基于卷积神经网络的鲁棒性说话人识别方法 |
| |
引用本文: | 曾春艳,马超峰,王志锋,孔祥斌.基于卷积神经网络的鲁棒性说话人识别方法[J].华中科技大学学报(自然科学版),2020,48(6):39-44. |
| |
作者姓名: | 曾春艳 马超峰 王志锋 孔祥斌 |
| |
作者单位: | 湖北工业大学太阳能高效利用及储能运行控制湖北省重点实验室,湖北武汉430068;华中师范大学数字媒体技术系,湖北武汉430079;华中科技大学机械科学与工程学院,湖北武汉430074 |
| |
基金项目: | 湖北省自然科学基金;国家自然科学基金;湖北省教育厅科学技术研究项目;湖北省高等学校优秀中青年科技创新团队项目 |
| |
摘 要: | 为了提升说话人识别技术在复杂噪声环境下的识别性能,提出了一种基于高斯均值矩阵和卷积神经网络的鲁棒性说话人识别方法,应用于纯净语音训练出的模型上测试含噪语音的场景.其中高斯均值矩阵是采用最大后验概率(MAP)对传统的梅尔频率倒谱系数(MFCC)特征进行自适应操作得到的,这一操作增加了帧与帧之间的关联性,使特征携带更丰富的说话人身份信息.同时采用卷积神经网络进一步对帧层面的信息进行对准,并从数据中学习到更有利于说话人识别的特征表示,从而提升说话人识别的鲁棒性.实验结果表明在Libri语音数据集上,所提出方法的鲁棒性优于GMM-UBM和GSV-SVM算法.
|
关 键 词: | 说话人识别 鲁棒性 卷积神经网络 高斯均值矩阵 最大后验概率 |
本文献已被 CNKI 万方数据 等数据库收录! |
|