火山语音提出基于篇章级情节理解的有声小说配乐系统

新知榜官方账号

2023-10-07 16:48:26

火山语音提出基于篇章级情节理解的有声小说配乐系统

近日,火山语音(字节跳动AILab智能语音与音频团队)提出了一种基于篇章级情节理解的有声小说配乐系统,能够自动化地挑选并组合出贴合文章情节、烘托感情氛围的背景音乐,同时与语音合成的有声小说音频进行精准的时间戳对齐和混音,极大节省了后期配乐的人力投入。

该系统可以分为情节划分(Plot Partition)、情节分类(Plot Classification)和音乐选择(Novel Selection)三个部分。前两部分主要通过NLP技术实现了篇章级语意理解,能够自动将小说文本进行片段式的情节划分,做到预测多达十二类的情节;第三部分则实现了基于语意及小说音频长度的启发式规则,自动化地从音乐库中选择合适的音乐片段并与小说音频进行自动混音。该系统在与人工配乐的对比实验中,目前的合格率已追平人工水平(均为88.75%);优秀率也高达45%,但对比人工52.5%的数据指标还略有差距。有声小说自动化配乐系统框架在语音合成有声小说的场景和业务中,自动化精配背景音乐的加入不仅能够大幅度提升用户的听觉感受和代入感,还极大降低了音频后期的人力投入成本。目前,自动化精配背景音乐已经在番茄小说等业务中开始应用。

其他研究成果

除了有声小说配乐系统外,火山语音团队还在Interspeech2022中共有七篇论文成功入选,内容涵盖音频合成、音频理解等多个技术方向的突破。以下是其中的几篇论文:

  • 一种借助声学参考特征和对比学习的高品质歌唱转换方法
  • 结合对话上下文的流式RNN-T语音识别
  • 基于连续整合发放机制的融合说话人差异和语音内容的字级别说话人转换点检测
  • 基于多任务和迁移学习方法的MOS自动打分
  • 使用原始序列流利度特征提升口语流利度打分性能

本页网址:https://www.xinzhibang.net/article_detail-15744.html

寻求报道,请 点击这里 微信扫码咨询

关键词

火山语音 有声小说 配乐系统

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯