首页 | 本学科首页   官方微博 | 高级检索  
     

车载场景结合盲源分离与多说话人状态判决的语音抽取
引用本文:张聪, 杨飞然, 陈先梅, 杨军. 广义高斯分布的卷积传递函数多通道非负矩阵分解[J]. 声学学报, 2024, 49(3): 598-610. DOI: 10.12395/0371-0025.2023009
作者姓名:张聪  杨飞然  陈先梅  杨军
作者单位:1.中国科学院噪声与振动重点实验室(声学研究所) 北京 100190;2.中国科学院大学 北京 100049
基金项目:国家自然科学基金项目(62171438)、北京市自然科学基金–小米创新联合基金项目(L223032)和中国科学院声学研究所自主部署项目(QYTS202111)资助
摘    要:

基于卷积传递函数的多通道非负矩阵分解(CTF-MNMF)在长混响环境的盲源分离中取得了较好的性能, 但该算法的分离性能依然受到声源模型的限制。因此提出了基于广义高斯分布(GGD)的CTF-MNMF算法, 通过将域参数引入NMF中并利用广义非负矩阵分解(GNMF)建模GGD的非负尺度因子, 提高了声源模型捕捉信号离群值的鲁棒性, 进而提高了声源估计的准确性。
采用基于辅助函数的优化策略给出分离矩阵和非负矩阵参数的更新公式。仿真结果表明所提算法在语音和音乐两种信号的分离实验中均取得了比GGD-ILRMA、WPE-ILRMA和CTF-MNMF更好的分离性能。




关 键 词:盲源分离  广义高斯分布  卷积传递函数  非负矩阵分解
收稿时间:2023-02-01
修稿时间:2023-05-04
点击此处可从《声学学报》浏览原始摘要信息
点击此处可从《声学学报》下载全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号