新知榜官方账号
2023-10-28 08:55:09
近年来,文本到语音的转换变得越来越简单,但是还需要大量的培训时间和资源来生成自然声音输出。不过,微软和中国的研究人员可能有一个更有效的方法。
他们设计了一种文本到语音的人工智能,只需200个语音样本(约20分钟)和匹配的转录,就能生成逼真的语音。这一系统部分依赖于变压器,或深度神经网络,大致模拟大脑中的神经元。变压器像突触链接一样,动态地衡量每一个输入和输出,帮助它们非常高效地处理即使是很长的序列,比如一个复杂的句子。再加上一个去噪编码器组件,人工智能可以用相对较少的资源做很多事情。虽然有轻微的机器人声音,但它们非常准确,文字的清晰度高达99.84%。
更重要的是,这可以使文本到语音更容易访问。你不需要花太多精力去获得真实的声音,让小公司甚至业余爱好者都能做到。这对未来也是一个好兆头。研究人员希望对不匹配的数据进行训练,因此创造现实对话所需的工作可能更少。
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49