Meta推出开源AI语言模型，可识别超过4000种口语

新知榜官方账号

2023-09-25 04:06:21

Meta公司周一（5月22日）推出了一个开源AI语言模型——大规模多语言语音（MassivelyMultilingualSpeech,MMS）模型。该模型可以识别超过4000种口语，是以往任何已知技术的40倍；该模型还将文本语音互转技术从100多种语言扩展到1100多种。Meta选择将MMS模型开源，以帮助保护语言多样性，并鼓励研究人员在其基础上进行进一步开发。

Meta公司在新闻稿中写道，“今天，我们公开分享我们的模型和代码，以便研究界的其他人可以在我们的工作基础上继续发展。通过这项工作，我们希望为保护全世界令人惊叹的语言多样性做出一点贡献。”

数据采集语音识别和文本到语音模型通常需要对模型进行数千小时的音频训练，并附带语音转录标签。这些标签对机器学习至关重要，它使算法能够更准确地分类和理解数据。如此一来，收集数千种语言的音频数据是Meta面临的第一个挑战，而现有最大的语音数据集最多涵盖100种语言。

对于那些在工业化国家没有被广泛使用的语言，其中的许多语言在未来几十年甚至存在消失的风险。Meta使用了一种非常规的方法来收集音频数据：利用翻译完成的宗教文本的录音。该公司表示，“为了克服这个问题，我们转向了宗教文本，如圣经，这些文本已被翻译成多种不同的语言，这些译本也已被用于广泛的语言研究中。”

这些宗教文本的各语言译本也有专业人士进行阅读并录音。作为MMS项目的一部分，Meta创建了一个超过1100种语言的“《新约》阅读数据集”，平均每种语言有32小时的数据。此外，Meta还指出，考虑到其他宗教类读物的未标记录音，我们将可提供的语言数量增加到4000多种。

Meta在新闻稿中提出，希望扭转世界语言逐渐减少的趋势，希望每个人都能用自己的第一语言来获取信息或使用技术。

本页网址：https://www.xinzhibang.net/article_detail-13579.html

寻求报道，请

关键词

分享至微信：

相关工具

TME Studio

腾讯音乐推出的智能音乐创作助手

Adobe Podcast

Adobe推出的在线AI音频录制和编辑工具

Voicemaker

AI文本到语音生成工具

AssemblyAI

转录和理解语音的AI模型

LALAL.AI

AI人声乐器分离和提取

LOVO AI

AI人声和文本转语音生成工具

在线文字转语音朗读器

在线文字转语音朗读器如果你需要将文字转换成语音，并且需要一个高效、智能、便捷的工具，熊猫宝库是一个不错的选择。这款在线文字转语音朗读器可以帮助你解决需要阅读大量文字的问题。它支持在电脑网页、微信公众号、APP上使用，适用范围广泛。不仅可以为小说、童话、杂志、课本等提供个性化的听书内容，还具有智能检测

分类标签在线文字转语音朗读器自然语言处理

12-08 08:46

谷歌推出WaveNet支持的AI语音合成器

谷歌推出WaveNet支持的AI语音合成器Google正在推出一款新的AI语音合成器，作为其机器学习云工具套件的一部分。名为云文本到语音的服务将适用于任何需要语音合成的开发人员或企业，无论是应用程序，网站还是虚拟助理。有趣的是，CloudText-to-Speech由WaveNet提供支持，该公司由

分类标签谷歌AI语音合成器WaveNet

12-08 08:45

XR医疗保健技术开拓者VeyondMetaverse推出AI语音命令系统

XR医疗保健技术开拓者VeyondMetaverse宣布在数字手术领域取得了新进展——推出了AI语音命令系统，该系统可在XR操作环境中与动态数字孪生协同工作。在此之前，VeyondMetaverse于2023年9月完成了世界上首例数字手术，而AI语音命令功能有望显著增强XR手术室动态。VeyondM

分类标签 XR手术室数字手术人工智能语音命令

12-04 16:07

少数族裔演员：类型化面孔下的无限可能

直到今天，在好莱坞打拼的少数族裔演员的成长之路依旧十分艰辛。他们能够饰演的角色就不多，通常只是跑跑龙套。真的出镜了，又往往扮演着带有一定刻板印象的角色。能够真正闯出名堂的少之又少。长居纽约的日裔摄影师HarukaSakaguchi和西班牙艺术家GriseldaSanMartin将这一根深蒂固的现象重

分类标签少数族裔演员类型化影视表演经验TypecastHarukaSakaguchiGriseldaSanMartin

12-03 02:12

Android竞态请求问题及解决方案

Android竞态请求问题及解决方案昨天，看到飞书团队一篇技术分享《如何解决前端常见的竞态问题》，自己的项目中也存在类似的问题，也是容易出Bug的地方。字节这篇文章是从Web端的视角切入的，借鉴意义有限，这篇文章我们从Android的视角展开讨论。什么是竞态问题简单来说，竞态问题就是用户短时间内重复

分类标签 Android竞态请求OkHttpRetrofit取消请求

12-03 02:10

CAST基因编辑系统的内源转录调控机制被证实

近年来，CRISPR-Cas基因编辑技术成为了颠覆性创新技术，但是其存在脱靶效应和编辑效率低等瓶颈问题，限制了其在人类疾病治疗等关键领域的应用。因此，开发更高效精准的、无需DNA双链断裂的基因编辑工具是该领域亟待解决的问题。CAST系统可借助转座机制而非DNA双链断裂实现基因的靶向整合插入，在精准、

分类标签 CAST基因编辑系统MerR-type转录调控因子CvkRCRISPR-Cas基因编辑技术

12-03 02:08

AI是否能替代人类？

AI是否能替代人类？人工智能看上去已经无所不能，包含人类引以为豪的艺术方向，AI作画和音乐创作等产品已经变得神乎其神，很多创作者也已经大量使用AI产品。midjourney某些AI生成的写实照片已经让真正的摄影师无法分辨，这到底是实拍还是渲染出来的。soundraw国外的博主有做过视频，只花几分钟调

分类标签人工智能AI替代人类

11-28 22:06

英语文字转语音在线版，2023年超火的语音配音平台

近年来，随着社交媒体的兴起和高质量音频内容的需求，越来越多的企业和个人正在寻找高效和有效的方式将书面内容转换为口头语音。其中，一种备受关注的平台是在线英语文字转语音平台。该平台预计将在2023年成为行业的主要参与者，它提供了一系列独特的功能，使其区别于其他在线文字转语音工具。其中最显著的特点之一是其

分类标签英语文字转语音语音配音平台AI配音

11-17 08:46

新一代AI语音技术的应用与未来

新一代AI语音技术的应用与未来数字人播报是一种由人工智能技术提供的全新播音方式，具有诸多益处。首先，数字人播报能够准确、规范地进行语音表达，消除了人为主持中可能出现的错误和瑕疵，提供了更加准确、优美的声音。这对于新闻播报、广播节目以及其他需要播音的场合来说，都能够提供更好的听觉体验。其次，数字人播报

分类标签数字人播报AI技术语音合成

11-17 02:22

AI语音智能机器人概述

一、AI语音智能机器人概述AI语音智能机器人是一种集成了语音识别、自然语言处理和机器学习等技术的人工智能设备。与传统机器人相比，其最大的特点在于其能够理解和处理自然语言，从而在各种场景下进行智能化的服务。AI语音智能机器人可以通过对人类语言的理解和模拟，与人类进行智能交互，提供更为便捷、高效的服务。

分类标签 AI语音智能机器人语音识别自然语言处理

11-17 02:21