基于神经网络的语音信号识别与分类 |
| |
引用本文: | 薛雅洁,贺红霞,杨祎.基于神经网络的语音信号识别与分类[J].现代电子技术,2023(24):79-84. |
| |
作者姓名: | 薛雅洁 贺红霞 杨祎 |
| |
作者单位: | 西安邮电大学电子工程学院 |
| |
基金项目: | 西安市科技计划项目(101/203010002); |
| |
摘 要: | 针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。
|
关 键 词: | 语音信号识别 深度全序列卷积神经网络 隐马尔可夫链 声学特征提取 梅尔倒谱系数 CTC损失函数 |
|
|