新知榜官方账号
2023-09-30 16:46:38
近日,美国一款即时性音频社交软件Clubhouse风靡全球,不到一年的上线时间,软件全球下载量突破800万。“Spaces”“对话吧”“SoundClub”等一系列类似软件紧跟其后,似乎都在暗示声音社交回归舞台。自出生后的第一声啼哭开始,我们与声音已经“相处”已久,但关于“声音”,或许我们还有许多方面值得深究。人工智能时代,声音在被捕捉、模仿、传输和理解的过程中,究竟经历了什么?本期《科技周刊》带你走进声音的世界。
现实生活中,很多人有这样的经历:当你饱含深情地说了一段语音后,语音播放出来却不仅声音变得奇怪,听起来甚至不太像自己。明明是同一个人在说话,为何会出现这样的差异呢?究竟哪个才是自己最真实的声音?“实际上,这主要有两个原因,首先是声音传播的方式不同,另一个是语音经过社交平台转录出去后常常会被压缩。”中国科学院声学研究所研究员、中国科学院语言声学与内容理解重点实验室副主任张鹏远接受《科技周刊》记者采访时表示,声音是由物体振动产生的,“别人听见你的声音”是由你声带的振动引起了空气的振动,从而被他人感知,所以是依靠空气传播;而“自己听见自己的声音”则是通过颅骨传导,直接振动耳蜗进而转化为神经信号,变成你所听到的声音,这也就是我们常说的“骨传导”。
自1939年世界上第一台能够合成人声的电子设备Voder亮相纽约世界博览会以来,“如何能让机器模仿人的声音”就成了人工智能领域的一大热点话题。江苏省人工智能学会智能语音专家、苏州思必驰信息科技有限公司联合创始人、上海交通大学苏州人工智能研究院执行院长俞凯教授告诉《科技周刊》记者,人工智能语音合成技术正不断迭代更新,其发展历史主要分为三个阶段。
两年前,康奈尔大学研究团队设计并训练了一个深度神经网络,它在训练过程中学习了视听、音像、声音和面部的关联性,从而根据声音来推测面部特征。透过声音,人工智能真的能够“看到”脸吗?目前,人工智能领域对声音的研究又有何新进展?对此,张鹏远认为,单纯借助声音无法百分百还原目标人的脸部图像,但有可能还原出其部分面部特征。
......
相关工具
相关文章
相关快讯
推荐
用Deepseek写AI绘图提示词,像呼吸一样简单!
2025-02-19 16:12
你以为AI绘画是黑科技?其实早成了“路边摊生意”!
2025-02-19 10:15
Flux爆火,全网最全面最详细的Flux使用教程!
2025-02-18 14:19
用AI如何创作音乐,实战教学来啦!
2025-02-17 17:23
MidJourney让你秒变绘画大神,从零开始画哪吒!
2025-02-17 14:56
AI应用新境界:让人工智能成为你的得力助手
2025-02-14 15:45
AI短片革命:当创作遇上智能,人人都能成为导演
2025-02-14 14:53
AI狂潮下的人类职场:是失业危机还是进化契机?
2025-02-13 16:53
开启影视创作新纪元,效率提升 10 倍的神器来了!
2025-02-13 15:11
深度解析DeepSeek:当AI技术照进创作产业的未来
2025-02-12 17:16