噪声环境下听觉特征融合的语种识别 |
| |
引用本文: | 黄张衡,龙华,邵玉斌,杜庆治,苏树盟,王延凯.噪声环境下听觉特征融合的语种识别[J].现代电子技术,2023(5):47-54. |
| |
作者姓名: | 黄张衡 龙华 邵玉斌 杜庆治 苏树盟 王延凯 |
| |
作者单位: | 昆明理工大学信息工程与自动化学院 |
| |
基金项目: | 国家自然科学基金项目(61761025); |
| |
摘 要: | 针对单一信号特征CFCC与GFCC在低信噪比下识别率不高的问题,提出一种噪声环境下听觉特征融合的语种识别方法。在特征提取前端对含噪语音信号进行端点检测,然后结合谱减法与维纳滤波器对信号进行噪声滤除;再根据人耳听觉频率集中范围采用带通滤波器滤除高频以及低频中噪声,进一步减小噪声对信号特征提取的影响;提取GFCC融入CFCC构成融合特征,再采用主成分分析对融合特征进行降维处理;最后将处理后的融合特征通过频域注意力Fcanet网络模型进行分类识别。实验对比不同特征在不同信噪比下的性能实验表明,融合特征较单一特征语种识别率有显著提升,特别在0 dB信噪比下较单一特征GFCC和CFCC识别准确率分别提升了9.75%和11.08%,具有较强的鲁棒性。
|
关 键 词: | 语种识别 信号端点检测 噪声滤除 带通滤波 特征提取 特征识别 降维处理 |
|
|