Nvidia和MozillaCommonVoice合作开发新的语音人工智能生态系统

新知榜官方账号

2023-07-01 11:04:33

在Nvidia今天的语音人工智能峰会上，该公司宣布了其新的语音人工智能(AI)生态系统，该生态系统是通过与MozillaCommonVoice合作开发的。该生态系统专注于开发众包多语言语音语料库和开源预训练模型。

Nvidia和MozillaCommonVoice旨在加速自动语音识别模型的发展，该模型普遍适用于全球每种语言的使用者。Nvidia发现标准语音助手，如AmazonAlexa和GoogleHome，支持不到1%的世界口语。为了解决这个问题，该公司旨在提高语音AI中的语言包容性，并扩大全球和资源匮乏语言的语音数据的可用性。

英伟达正在加入Meta和谷歌已经在进行的一场竞赛：最近，两家公司都发布了语音AI模型，以帮助说不同语言的人之间进行交流。Google的语音到语音AI翻译模型TranslationHub可以将大量文档翻译成多种不同的语言。谷歌还刚刚宣布，它正在构建一个通用语音翻译器，经过400多种语言的培训，并声称它是“当今语音模型中最大的语言模型覆盖率”。同时，MetaAI的通用语音翻译器(UST)项目有助于创建AI系统，实现跨所有语言的实时语音到语音翻译，即使是那些口语但不常用的语言。

面向全球语言用户的生态系统根据Nvidia的说法，语音AI的语言包容性具有全面的数据健康益处，例如帮助AI模型了解说话者的多样性和噪声谱。新的语音AI生态系统可帮助开发人员构建、维护和改进语音AI模型和数据集，以实现语言包容性、可用性和体验。用户可以在MozillaCommonVoice数据集上训练他们的模型，然后将这些预训练模型作为高质量的自动语音识别架构提供。然后，全球其他组织和个人可以调整和使用这些架构来构建他们的语音AI应用程序。

“人口多样性是捕捉语言多样性的关键，”Nvidia产品经理CarolinedeBritoGottlieb说。“有几个重要因素会影响语音变化，例如服务不足的方言、社会方言、口音。通过这种合作伙伴关系，我们的目标是创建一个数据集生态系统，帮助社区为任何语言或上下文构建语音数据集和模型。”

MozillaCommonVoice平台目前支持100种语言，拥有来自全球500,000名贡献者的24,000小时语音数据。最新版本的CommonVoice数据集还包含六种新语言——Tigre、MeadowMari、Bengali、TokiPona和Cantonese，以及来自女性演讲者的更多语音数据。通过MozillaCommonVoice平台，用户可以通过将句子录制为短语音片段来捐赠他们的音频数据集，Mozilla会在提交时对其进行验证以确保数据集质量。

本页网址：https://www.xinzhibang.net/article_detail-3815.html

寻求报道，请

关键词

Nvidia MozillaCommonVoice 语音人工智能生态系统自动语音识别语言包容性

分享至微信：

相关工具

Whispr

免费AI对话回应

Character.AI

创建虚拟角色并与其对话

ChatGPT

OpenAI旗下AI对话工具

ChatSonic

WriteSonic出品的ChatGPT竞品

Neeva

集成了AI问答的AI搜索引擎

通义千问

阿里巴巴最新推出的类ChatGPT响应人类指令的大模型

使用手机制作和演示幻灯片

使用PowerPointApp 步骤1：下载PowerPointApp在您的手机应用商店中搜索“PowerPoint”并下载安装应用程序。如果您已经有了Microsoft帐户，则可以直接登录。否则，您需要先创建一个Microsoft帐户。步骤2：创建幻灯片在PowerPointApp中选择“新建演

分类标签手机幻灯片制作演示PowerPointAppGoogleSlidesApp

12-07 02:21

谷歌实验性聊天机器人Bard的产品负责人透露Bard是其开发另一款能吸引20亿用户的产品的必经之路

谷歌实验性聊天机器人Bard的产品负责人杰克·克劳奇克透露，Bard是其开发另一款能吸引20亿用户的产品的必经之路。克劳奇克表示，Bard可以让消费者集思广益并获取信息，这为谷歌吸引更多用户的目标奠定了基础。谷歌的这一计划凸显了其母公司Alphabet在人工智能方面的雄心壮志，迄今为止，Alphab

分类标签谷歌Bard人工智能

12-04 06:23

Google的AI聊天机器人Bard新增图像和多语言支持，以抢占ChatGPT市场份额

AI聊天机器人市场竞争加剧，Google的Bard更新增添新功能近期数据显示，AI聊天机器人市场竞争愈加激烈，Google的Bard通过新增图像和多语言支持等新功能，努力抢占市场份额。Bard现在支持40多种语言，并在欧洲和巴西等地区提供服务。用户可以通过上传图像和文本来使用Bard生成输出，并且B

分类标签 AI聊天机器人Bard图像支持多语言支持

12-04 06:22

LLM时代，为什么Apple仍有底气自我颠覆，而Google不行？

LLM时代，为什么Apple仍有底气自我颠覆，而Google不行？随着LLM时代的到来，科技公司面临着前所未有的挑战。在这个时代，Apple仍然能够保持其自我颠覆的能力，而Google却表现不佳。那么，为什么Apple能够做到这一点呢？1. Apple的产品设计Apple一直以来都以其出色的产品设计

分类标签 LLM时代Apple自我颠覆

11-30 08:02

谷歌通过Bard加强人工智能合作回应

谷歌通过Bard加强人工智能合作回应据外媒报道，Bard的产品负责人JackKrawczyk在接受采访时表示，Bard可以让消费者在新的人工智能的帮助下集思广益并获取信息，它正在为谷歌吸引更多客户奠定基础。其中一个机会是，该公司计划通过Bard的合作回应来激活其定时器设置、命令执行谷歌助手。Kraw

分类标签 Bard人工智能谷歌助手

11-26 02:20

谷歌升级机器人Bard，让用户轻松获取YouTube视频内容

谷歌升级机器人Bard，让用户轻松获取YouTube视频内容近日，谷歌宣布对其聊天机器人Bard进行了升级，使其能够快速地理解YouTube视频内容。Bard目前可以从视频资源库中提炼出有用信息以达到迅速回答用户提问的效果，帮助用户更深入透彻地了解YouTube影片内容。谷歌表示还在开发YouTub

分类标签谷歌Bard机器人YouTube视频内容用户需求

11-26 02:19

Google的BardAI聊天机器人现在可以回答与YouTube视频内容相关的具体问题

Google宣布其BardAI聊天机器人现在可以回答与YouTube视频内容相关的具体问题。尽管Bard在去年9月推出YouTube扩展功能时已具备分析YouTube视频的能力，但现在，聊天机器人可以为您提供有关视频内容的具体查询答案。公司在Bard更新页面上写道：「我们正在迈出Bard理解YouT

分类标签 GoogleBardAI聊天机器人YouTube视频

11-26 02:18

谷歌的BardAI聊天机器人现在可以回答关于YouTube视频的问题

谷歌的BardAI聊天机器人现在可以回答关于YouTube视频的问题谷歌的BardAI聊天机器人现在可以回答关于YouTube视频的问题。Bard通过扩展YouTubeExtension的功能，不仅可以找到特定视频，还可以回答与视频内容相关的具体问题，提供更深入的视频交流体验。在此次更新之前，Bar

分类标签 BardAI聊天机器人YouTube视频

11-24 10:05

Google人工智能聊天机器人Bard的YouTube整合功能得到升级

Google的人工智能聊天机器人巴德（Bard）在经历了乏善可陈的发布之后，已经逐渐变得越来越有用。现在，该机器人的YouTube整合功能得到了方便的升级，这样它就可以分析单个视频，为观众提供特定的信息--比如关键点或食谱成分--而无需按下播放键。这可能是一个非常有用的工具，但也可能让创作者更加担心

分类标签 Google人工智能聊天机器人

11-24 10:04

Bard聊天机器人：观众消化视频的利器，创作者的噩梦

Bard聊天机器人：观众消化视频的利器，创作者的噩梦在短视频逐渐占据上风的视频领域，另一大威胁正在慢慢靠近。“三分钟看完X电影”的短视频up主与“一分钟总结X电影”的人工智能即将进入正面交锋。更让up主们为难的是，他们很难回答到每一个观众的问题，但AI却没有这个烦恼。谷歌的Bard聊天机器人正是掀起

分类标签 Bard聊天机器人短视频人工智能

11-24 10:03

ChatGPT Midjourney 文心一言文心一格 bing新必应 Stable diffusion 稿定设计墨刀AI mastergo Adobe Firefly runway