新知榜官方账号
2023-10-07 16:48:26
近日,火山语音(字节跳动AILab智能语音与音频团队)提出了一种基于篇章级情节理解的有声小说配乐系统,能够自动化地挑选并组合出贴合文章情节、烘托感情氛围的背景音乐,同时与语音合成的有声小说音频进行精准的时间戳对齐和混音,极大节省了后期配乐的人力投入。
该系统可以分为情节划分(Plot Partition)、情节分类(Plot Classification)和音乐选择(Novel Selection)三个部分。前两部分主要通过NLP技术实现了篇章级语意理解,能够自动将小说文本进行片段式的情节划分,做到预测多达十二类的情节;第三部分则实现了基于语意及小说音频长度的启发式规则,自动化地从音乐库中选择合适的音乐片段并与小说音频进行自动混音。该系统在与人工配乐的对比实验中,目前的合格率已追平人工水平(均为88.75%);优秀率也高达45%,但对比人工52.5%的数据指标还略有差距。有声小说自动化配乐系统框架在语音合成有声小说的场景和业务中,自动化精配背景音乐的加入不仅能够大幅度提升用户的听觉感受和代入感,还极大降低了音频后期的人力投入成本。目前,自动化精配背景音乐已经在番茄小说等业务中开始应用。
除了有声小说配乐系统外,火山语音团队还在Interspeech2022中共有七篇论文成功入选,内容涵盖音频合成、音频理解等多个技术方向的突破。以下是其中的几篇论文:
微信扫码咨询
相关工具
相关文章
相关快讯
推荐
阿里Accio中文版上线!一键搞定复杂采购
2025-08-19 09:13
视频“用嘴编辑”的时代来了,但钱包顶得住吗?
2025-08-15 17:59
智谱新模型GLM-4.5V全面开源,玩家们有福啦!
2025-08-12 17:56
扎心文案+AI插画=爆款!揭秘8万赞视频的制作全流程
2025-08-12 10:08
GPT-5没你想的那么好,附实测体验~
2025-08-11 11:07
一站式搞定AI绘图+视频,AI短片效率飙升的秘密在这儿!
2025-08-08 09:26
打工人新神器!10款国产AI,让你告别996!
2025-08-08 09:24
豆包视觉推理深度体验,AI也能“边看边想”了!
2025-08-08 09:19
300美元的AI男友来了!马斯克的情感生意从女友做到男友
2025-08-01 17:56
Agent智能体:2025年企业新员工,月薪仅需一度电?
2025-07-30 17:49