语音交互与中文自然语言处理技术

新知榜官方账号

2023-07-08 07:50:24

语音交互流程简介

AI对话所需要的技术模块有4个部分,分别为:自动语音识别(ASR)、自然语言理解(NLU)、自然语言生成(NLG)和文字转语音(TTS)。以叮咚开发文档中的语音交互流程图来看,Ai对话技术的主要路径为用户与设备之间的交互,主要是采用语音方式处理和完成的。

语音交互流程设计

一次完整的语音交互流程,成功的语音对话,通常是有以下几个阶段:

  1. 意图:表示用户在使用应用时所做的动作,这些意图代表了应用的核心功能。
  2. 语义解析:对语音识别结果进行分析理解,将用户语音输入映射到机器指令。
  3. 云端交互:调用意图的结构化请求,向服务器请求处理后做出反馈响应。
  4. 对话管理:在用户进行自然对话时,可能会因为表达事情的复杂度、时间、地点、效率等,产生具有脉络的对话过程,所有的对话元素会编织在一个连贯的线性对话中。
  5. 语言合成:根据解析模块得到的内部表示,在对话管理机制的作用下生成自然语言句子。同时将生成模块生成的句子转换成语音输出。

中文自然语言处理的关键技术

中文自然语言处理的关键技术包括词法分析、句法分析、语义分析、语用分析和语境分析。

Ai对话目前存在的问题

语音交互最终需要解决的关键问题是歧义消解问题,和未知语言现象的处理问题。

智能语音助手背后的生态服务

智能语音助手类的产品要想在中国落地开花,它不仅仅是简单的语音识别那么简单,还有集成服务,一整套的中文生态、内容、服务等配套设施,是一种涵盖很多基础能力的生态系统。

未来基于语音交互的语义技能,必须要能够达到几万、几十万甚至上百万种的时候,才能促使语音交互时代操作系统真正走向成熟,未来语音交互产品的形态和样式也将越来越丰富。

让我们期待未来Ai语音交互的蓬勃发展,期待未来对技术的无限挑战!

本文由@Baolan原创发布于人人都是产品经理。未经许可,禁止转载。

本页网址:https://www.xinzhibang.net/article_detail-6818.html

寻求报道,请 点击这里 微信扫码咨询

关键词

语音交互 自然语言处理 智能音箱

分享至微信: 微信扫码阅读

相关工具

相关文章