基于深度残差网络的音源分离

新知榜官方账号

2023-10-02 16:56:13

基于深度残差网络的音源分离

本文介绍了基于深度残差网络的音源分离系统,该系统在MUSDB18数据集上实现了明显优于以前的方法的效果。

系统实现

该系统采用深度残差网络(DeepResidualUNets)来增加其深度,用以估计复数理想比例掩码(cIRM)。其中每个残差编码块由4个残差卷积块(RCB)组成,残差卷积块又由两个核大小为3×3的卷积层组成。每个残差解码块由8个卷积层和1个反卷积层组成。

实验结果

在MUSDB18数据集上进行实验,以信号失真率(SDR)作为评判标准,可以看到ResUNetDecouple系统在分离人声、低音、其他和伴奏方面明显优于以前的方法。

作者介绍

本文作者孔秋强是字节跳动的Speech, Audio and Music Intelligence研究小组的成员,主要从事音频信号处理和声音事件检测等领域的研究。

本页网址:https://www.xinzhibang.net/article_detail-14906.html

寻求报道,请 点击这里 微信扫码咨询

关键词

音源分离 深度残差网络 AI音乐家

分享至微信: 微信扫码阅读

相关工具

相关文章

相关快讯