GLM-Dialog:基于抗噪预训练的知识对话生成

新知榜官方账号

2023-11-30 22:18:40

GLM-Dialog:基于抗噪预训练的知识对话生成

随着计算能力的增强和数据量的爆炸式增长，大模型已经成为一个不可忽视的力量。尽管ChatGPT展现出了强大的能力，但仍然有一种致命的缺陷，一本正经地说胡话，即“幻觉性”。ChatGLM干货技术分享系列活动“GLM-Dialog:基于抗噪预训练的知识对话生成”邀请了中国人民大学信息学院硕士生张晓康，他在报告中介绍了对于大语言模型幻觉性问题的一些个性见解与解决方案。

为了减少事实错误的发生，检索增强型语言模型得到了广泛关注。微软和谷歌等领先科技公司已经推出了各自的解决方案：微软的NewBing和谷歌的Bard。此外，YouChat和Perplexity.ai等其他产品在这一领域也引起了持续关注。但是在用户实际使用之后发现幻觉性的问题并没有在很大程度上被缓解。尽管检索增强在学术界被广泛研究，业界也在积极地往产品中融合，但该问题仍未被妥善解决。

针对此问题，GLM-Dialog提出了一种新方法，用于知识驱动对话生成的容忍噪声预训练方法。GLM-Dialogue的框架分为三个部分。第一部分是准备阶段，第二部分是两阶段的模型训练过程，第三部分是模型部署阶段。

准备阶段

语料库准备。选择一个比较充分的中文对话语料，并按照与用户聊天的实际场景的差异程度进行排序。训练语料库由来自不同来源的三部分组成，具有特殊目的，主要包括在线讨论平台中的社交媒体数据、由来自不同任务的开源基准数据集的对话形式转化而来的基准数据以及从自己部署的在线聊天机器人平台中收集的在线服务数据。

骨干准备。采用GLM10B，它从特殊标记完成输入句子，作为主干来设计查询生成和对话生成模型。GLM的主要优点有两个方面。首先，GLM分别实现了上下文和生成内容的双向注意机制和单向注意机制。灵活的注意机制允许双向注意对输入句子进行分类，自回归生成单向注意的句子。其次，GLM为各种模型尺度提供了一致的模型架构和开源检查点，允许在不同的计算设备上部署GLM-Dialog。

查询生成模块准备。查询生成模块将对话历史作为输入并生成适当的搜索查询，该查询被传递到在线搜索引擎以检索与对话相关的知识片段。为了准备查询生成模块，需要最大化与对话历史相关联的正确查询标注的概率。通过以这种方式训练模块，旨在增强其生成准确和适当的查询的能力，有效捕捉对话历史的要点。

模型训练过程

训练阶段1：持续对话预训练。尽管现成的LLM在生成流畅的对话回应方面表现出能力，但它们离构建对话模型还有一段距离，在口语化的对话和来自一般领域的Web爬取文本之间的语言风格之间存在差异。社交媒体数据作为一种特殊类型的网络爬取文本，既构成了GLM预训练数据的一部分，使得GLM易于适应新引入的训练数据；它的语言风格与自然对话也有许多相似特征，最终的训练语料库包括了特意收集的社交媒体数据。

训练阶段2：知识注入微调。为了构建基于知识的对话模型，采用上下文相关的背景知识片段来补充输入，以帮助模型生成更多信息响应。然而，直接利用补充的片段并构建基于知识的对话模型具有挑战性。因此，在训练的第二阶段主要完成以下事情：第一，构建具有外部知识和负面知识样本的对话训练实例；第二，设计具有辅助对抗性损失的训练目标，以鼓励模型共同生成响应并决定是否使用外部知识；第三，在迭代训练方案中引导训练实例，确保渐进、精细的学习过程。

模型部署阶段

GLM-Dialog由三个组件组成——查询生成模块、外部搜索引擎和响应生成模块。GLM-Dialog首先使用查询生成模块生成网络搜索查询，然后从网络搜索引擎构建外部知识池，只保留顶部搜索结果，最终的响应根据对话历史和补充知识生成。

隐式评估

张晓康介绍道，研究中还有另外一个发现：传统的对话评价指标对于本文的方法并不适用。因此，他们使用了一种新的隐式评估工具，允许人类在与机器人交互时隐式评估机器人，以评估其性能。如果机器人的响应更频繁地从其他机器人中选择，则认为机器人具有卓越的性能。通过为每一轮的所有机器人保持相同的对话历史，以便公平地比较它们的响应，可以有效地减少注释偏差。

消融实验

张晓康还对消融实验进行了一定的分析。他通过对响应生成进行消融研究，以确认注入外部知识和知识分类的影响。结果表明，在没有对基于知识的对话进行第二次训练的情况下，模型无法将注入的背景知识与对话历史相结合，导致所有指标显著下降；与在线收集的对话相比，基于知识的基准的数量非常有限。因此，在不向在线大规模服务数据注入知识的情况下，知识整合能力主要依赖于基于知识的基准，从而影响最终性能；即使将知识引入在线服务数据中，也有很多与响应无关的噪声知识，这可能会对响应产生不利影响。

总结

GLM-Dialog是一种基于抗噪预训练的知识对话生成方法，用于解决大模型幻觉性问题。该方法通过利用外部知识和嘈杂数据，提高了对话生成模型的性能，并通过隐式评估工具，有效地减少了注释偏差。GLM-Dialog的框架和训练过程都非常详细，消融实验的结果也非常有说服力。希望该技术能够激发更多基于知识的对话生成的研究。

本页网址：https://www.xinzhibang.net/article_detail-21550.html

寻求报道，请

关键词

大模型幻觉性检索增强 GLM-Dialog 知识对话生成抗噪预训练

分享至微信：

相关工具

YouChat AI

AI搜索对话工具

ColossalChat

Colossal-AI推出的免费开源版ChatGPT聊天机器人替代品

文心一言

百度推出的基于文心大模型的AI对话互动工具

Open Assistant

免费开源的对话式AI，GitHub星标超3万

Character.AI

创建虚拟角色并与其对话

360智脑

360搜索最新推出的AI对话聊天机器人

微软宣布新的人工智能驱动的Bing主页，你可以和它聊天了

微软宣布新的人工智能驱动的Bing主页，你可以和它聊天了近日，微软宣布将在Bing搜索引擎中加入ChatGPT技术的Chat功能，用户可以与之聊天，并将更新Edge浏览器。新的必应可以回答具有大量上下文的问题，类似于ChatGPT的方式。此举让微软与谷歌的浏览器之争进入了白热化阶段。微软总部的新闻发

分类标签微软人工智能Bing

11-30 22:19

划重点

划重点的重要性划重点是一种重要的学习方法，能够帮助我们更好地理解和记忆知识点。通过划重点，我们可以把复杂的知识点简化为关键信息，同时也可以帮助我们更好地组织和理解知识结构。划重点的技巧和注意事项1. 选择重要信息：划重点的关键是选择重要信息，这需要我们对知识点有深入的理解和掌握。2. 简洁明了：划重

分类标签划重点重点SEO

11-08 02:32

YouTube测试新人工智能聊天机器人 YouChat

YouTube测试新人工智能聊天机器人 YouChat据站长之家(ChinaZ.com)11月7日消息，YouTube正在测试一款新的人工智能聊天机器人，能够与观众交谈，让他们「更深入地了解他们正在观看的内容。」这项名为「YouChat」的功能从周一起对「一小部分视频上的少数人」开放。这个新的交流工

分类标签 YouTube人工智能聊天机器人

11-08 02:31

AI搜索引擎是否能够完全取代传统搜索引擎？

引言本文讨论了AI搜索引擎是否能够完全取代传统搜索引擎的问题，并分析了AI搜索引擎对搜索体验、自然语言处理、SEO等方面的影响。AI搜索引擎的兴起随着AI技术的不断发展，生成式对话机器人和AI搜索引擎开始涌现，试图在AI时代抢夺搜索话语权。这些AI搜索工具虽然大大提高了理解和生成文本的能力，但涉及一

分类标签 AI搜索引擎传统搜索引擎ChatGPTSEO信息获取方式搜索习惯

11-01 10:24

百度推出名为“SynClub”的AI社交产品

百度推出名为“SynClub”的AI社交产品钛媒体App7月17日消息，据悉，百度在海外对AI产品进行布局，目前已经在中国香港、日本等地，推出了名为“SynClub”的AI社交产品。该产品采用了百度最新的AI技术，用户可认识专属于自己的AI朋友。这一举措表明百度在AI领域的布局进一步扩展，同时也为用

分类标签百度AI产品SynClub

11-01 10:23

封面新闻成为百度文心一言首批生态合作伙伴

封面新闻成为百度文心一言首批生态合作伙伴2月14日，封面新闻宣布成为百度文心一言（英文名：ERNIEBot）首批生态合作伙伴，将全面体验并接入文心一言的能力。文心一言（英文名：ERNIEBot）是百度基于文心大模型技术推出的生成式对话产品。随着近段时间以来ChatGPT的持续走红，对话式语言模型技术

分类标签封面新闻百度文心一言智媒体

11-01 10:22

百度AI对话功能介绍

百度AI对话功能介绍不知道大家都注意到没有，在电脑端使用百度搜索引擎时，会看到左上角有一个“AI对话”的功能。当你点击进去后，你会看到一个和AI对话的界面，你可以在他的对话框里输入你的问题，发送后他会给出你想要的答案。我这里让他给出一个ai的短视频脚本值，大家看看他的回答怎么样。值得注意的是，这个服

分类标签百度AI对话语音对话

11-01 10:21

VSCode是一款优秀的Python编辑器

VSCode是一款优秀的Python编辑器VSCode是微软出品的一款可扩展的轻量级开源编辑器，可以支持全平台系统。它支持几乎所有主流的开发语言的语法高亮、智能代码补全、自定义热键、括号匹配、代码片段、代码对比Diff、Git等特性，支持插件扩展，并针对网页开发和云端应用开发做了优化。VSCode的

分类标签 PythonVSCode编辑器

10-31 02:31

创建您自己的AI聊天机器人

创建您自己的AI聊天机器人创建您自己的AI聊天机器人可能是一个涉及多个步骤的复杂过程，例如：确定聊天机器人的用途、选择一个平台、设计聊天机器人的对话流程、训练聊天机器人、测试和改进、启动和维护。创建AI聊天机器人可能是一个耗时的过程，但它也是一种与您的受众互动并为他们提供有用信息和帮助的有益方式。创

分类标签 AI聊天机器人构建聊天机器人无/低代码聊天机器人构建器

10-19 17:08

AI看视频聊天，OpenGVLab发布最新项目Ask-Anything

项目介绍OpenGVLab发布最新项目Ask-Anything，可以让AI边看视频，边和用户聊天。在线可玩Ask-Anything提供在线可玩的demo，只需要将视频“拖拽”或“上传”到页面左上角的指定位置即可。用户可以输入OpenAI的API，点击“Watchit”，让AI先看一下视频；再点击“L

分类标签 AI视频聊天OpenGVLab

10-12 02:26