新知榜官方账号
2023-09-19 00:18:21
近日,谷歌AI部门DeepMind和牛津大学的研究人员使用人工智能创建了迄今为止最准确的一款读唇软件。利用BBC数千小时的电视节目,研究人员将AI软件对电视节目嘉宾唇语解读的准确率提升到了46.8%。这一数字乍看上去十分不起眼,尤其在与AI软件语音识别准确率进行比较后更是如此,但要指出的是,即便是专业的唇语专家在接受同样的测试时,准确率仅为12.4%。
值得一提的是,牛津大学的另一独立小组也于不久前开发了一款类似的AI读唇软件。这个名叫LipNet的读唇软件,在测试中达到了93.4%的准确性,而人类的准确性则为52.3%。但该测试所用的材料均为志愿者事先录制好的固定句子,没有任何复杂的事件背景可言。而此次谷歌DeepMind部门研发的“Watch,Listen,Attend,andSpell”AI软件所进行的测试则更具挑战性,在没有任何背景介绍的情况下直接对BBC节目嘉宾唇语进行解读。该软件用于读唇术训练的电视节目视频时长累计超过了5000小时,包括近12万个不同的句子和约1.7万个独特的单词,相比之下LipNet软件的测试视频仅有51个独特的单词。
至于AI读唇软件的应用,很多人第一时间想到的便是监控视频的唇语解读。研究人员表示,监控视频的分辨率将对AI软件的读唇准确度有很大影响,但人工智能会将这一差距慢慢缩小。
相关工具
相关文章
相关快讯
推荐
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49
国产GLM-4.5把AI价格打到地板价,实测强到离谱!
2025-07-30 09:08