新知榜官方账号
2023-09-17 03:58:36
一两年前由于工作需要重点研究过自然语言处理与人机对话系统,本文将会列出的它们的知识点以及我的思考。
NLP与人机对话对于普通企业,人机对话目前主要的应用是任务型人机对话系统。不管是NLP亦或是Chatbot,学术上和工程上都有不同的实现手段。学术界上人机对话系统的研究成果以及最新的研究趋势在工程上应用的较少,而工程上又有自己的方式来实现人机对话。人机对话在实现过程中会使用很多NLP技术,所以可以说NLP是Chatbot的基础。涉及NLP词:语法、语义、语用。短语(句子):语法、语义、语用。篇章:语法、语义、语用。词和短语的研究已经比较成熟了,主要的研究集中在2000年后。篇章的研究不成熟,主要研究是在2010年以后。语法树:DGCFGPCFGLPCFG常用算法:搜索S动态规划D分类算法C序列标注S优化算法O。
人机对话主流框架分成了三个主要模块,分别为NLU、DM和NLG。自然语言理解包括三块:领域识别,主要就是判断任务种类,比如会议室预定、火车票购买、订餐等等类别。意图识别,识别用于意图,比如用户确定、拒绝。槽填充,抽取任务相关的重要信息,比如会议预定,槽就可以定义为开会地点、开会时间。自然语言理解研究现状:基于规则的方法,正则表达,比较耗人力、灵活性差、可移植性差。基于统计的方法,单独建模和联合建模。单独建模将领域识别、意图识别、槽填充分开研究,分别使用支持向量机、卷积神经网络、决策树、条件随机场、循环神经网络实现,存在误差累积。
对话管理模块主要框架如下图,用户输入“五道口附近餐馆”,经过NLU处理后得到intent=ask,slots={位置:五道口}。对话状态跟踪模块输出slots={位置:五道口}。Action候选为餐馆检索和需求澄清。Policy将候选Action排序。Action执行根据Action排序执行action更新交互状态由NLG生产回复,“还有其他需求吗?”用户继续输入。
自然语言生成模块NLG,典型的概念到文本生成包含三部分,内容选择,从输入中选择合适的内容并决定输出文本的结构。句子规划,决定个别句子的词汇内容。内容表达,渲染选定句子到输出。传统做法涉及到:概率上下文无关文法n元语法属性检测阈值过滤文本筛选基于深度学习的方式:RNNLSTMseq2seqencoder-decoder训练样本需要几十万条。
人机对话目前只有在很小的某个领域能做出效果,不大可能实现一个大范围的通用的聊天机器人。目前主流对话系统的主体框架都大同小异,主要还是要能出效果。要做出效果就只有将领域限定得很小才可行,可以把业务领域限定的很小,只是某块小业务。涉及到用机器学习或深度学习的对话系统都需要大量的训练样本,没有办法跳过人力标注这步。
样本标注方面,需要搞用户便捷的标注系统,方便业务人员或标注人员使用。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49