语音交互和智能音箱的未来

新知榜官方账号

2023-09-30 16:24:39

语音交互和智能音箱的未来

机器学习以及自然语言处理技术的进步,开启了人与人工智能进行语音交互的可能,人们透过对话的方式获取信息、与机器进行交互,将不再只是存在科幻情结当中。语音交互是未来的方向,而智能音箱则是语音交互落地的第一代产品。

一、语音交互流程简介

AI对话所需要的技术模块有4个部分,分别为:自动语音识别(AutomaticSpeechRecognition,ASR)自然语言理解(NaturalLanguageUnderstanding,NLU)自然语言生成(NaturalLanguageGeneration,NLG)文字转语音(TexttoSpeech,TTS)

二、语音交互流程设计

一次完整的语音交互流程,成功的语音对话,通常是有以下几个阶段。

  1. 交互流程的核心—意图所谓意图,表示用户在使用应用时所做的动作(譬如:问一个问题或发送一条指令),这些意图代表了应用的核心功能。如果应用成功地识别了用户意图,则需要在完成业务动作后,将结果反馈给用户;如果应用无法识别用户意图,则需要给用户友好的提示,指导用户使用。
  2. 如何识别意图—语义解析对语音识别结果进行分析理解,简单来说就是将用户语音输入映射到机器指令。
  3. 如何处理意图—云端交互调用意图的结构化请求,向服务器请求处理后做出反馈响应。通俗来讲该流程主要处理用户的请求,解决用户问题的答案。
  4. 上下文意图的处理-对话管理在用户进行自然对话时,可能会因为表达事情的复杂度、时间、地点、效率等,产生具有脉络的对话过程,所有的对话元素会编织在一个连贯的线性对话中。

数据堂自制版权的系列数据集产品为“自然对话语音数据”这一技术路径的实现提供了强有力的支持。1,351小时普通话自然对话语音数据(手机+录音笔)该数据由1950名发音人参与录制,以自然方式进行面对面交流,针对给定的数个话题自由发挥,领域广泛,语音自然流利,符合实际对话场景。1,351小时普通话自然对话语音数据由人工转写文本,准确率高。

三、中文自然语言处理的关键技术

1、词法分析 2、句法分析 3、语义分析 4、语用分析 5、语境分析

四、Ai对话目前存在的问题

人机对话过程中,用户难免会出现表达失误的情况,导致机器对用户语言理解出现偏差,在这时,纠错机制对机器而言则非常重要,如缺少这个机制,用户需要花费相当长的时间将其意图解释清楚,相应的用户体验也会十分糟糕。另一方面,虽然可以很好的识别语音,但是却不能理解你的对话目的,语义理解上有偏差。当前,包括Alexa在内的国内外智能音箱之所以没有表现的那么智能,出现了“人工智障”的嘲笑也是因为在以上两方面没有处理太好。因此语音交互最终需要解决的关键问题是歧义消解问题,和未知语言现象的处理问题。

五、智能语音助手背后的生态服务

AmazonEcho的胜利在于其语音助手Alexa掌握的无数技能,GoogleAssistant以及GoogleHome之所以被人看好是在于其Android后发优势所具备的开放性。智能语音助手类的产品要想在中国落地开花,它不仅仅是简单的语音识别那么简单,还有集成服务,一整套的中文生态、内容、服务等配套设施,是一种涵盖很多基础能力的生态系统。未来基于语音交互的语义技能,必须要能够达到几万、几十万甚至上百万种的时候,才能促使语音交互时代操作系统真正走向成熟,未来语音交互产品的形态和样式也将越来越丰富。让我们期待未来Ai语音交互的蓬勃发展,期待未来对技术的无限挑战!

本页网址:https://www.xinzhibang.net/article_detail-14516.html

寻求报道,请 点击这里 微信扫码咨询

关键词

语音交互 自然语言处理 智能音箱

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯