联合深度编解码网络和时频掩蔽估计的单通道语音增强 |
| |
引用本文: | 时文华, 张雄伟, 邹霞, 孙蒙, 李莉. 联合深度编解码网络和时频掩蔽估计的单通道语音增强[J]. 声学学报, 2020, 45(3): 299-307. DOI: 10.15949/j.cnki.0371-0025.2020.03.002 |
| |
作者姓名: | 时文华 张雄伟 邹霞 孙蒙 李莉 |
| |
作者单位: | 陆军工程大学 南京210007;北京航空工程技术研究中心 南京210028;陆军工程大学 南京210007 |
| |
基金项目: | 国家自然科学基金项目(61471394)和江苏省优秀青年基金项目(BK20180080)资助 |
| |
摘 要: | 提出了一种联合深度编解码神经网络和时频掩蔽估计的语音增强方法。该方法利用深度编解码网络估计时频掩蔽表示,并联合带噪语音的幅度谱学习带噪语音与纯净语音幅度谱之间的非线性映射关系。深度编解码网络采用卷积-反卷积网络结构。在编码端,利用卷积网络的局部感知特性,对带噪语音的时频域结构特征进行建模,提取语音特征,同时抑制背景噪声。在解码端,利用编码端提取到的语音特征逐层恢复局部细节信息并重构语音信号。同时,在编解码端对应层之间引入跳跃连接,以减少由于池化和全连接操作导致的低层细节信息丢失的问题。在TIMIT语音库和不完全匹配噪声集下进行仿真实验,实验结果表明,该方法可以有效抑制噪声,且能较好地恢复出语音细节成分。
|
收稿时间: | 2018-09-10 |
修稿时间: | 2019-06-11 |
本文献已被 CNKI 万方数据 等数据库收录! |
| 点击此处可从《声学学报》浏览原始摘要信息 |
|
点击此处可从《声学学报》下载免费的PDF全文 |
|