基于帧特征、段特征联合建模的语音识别模型 |
| |
引用本文: | 韩疆,尹宝林.基于帧特征、段特征联合建模的语音识别模型[J].声学学报,2000(2). |
| |
作者姓名: | 韩疆 尹宝林 |
| |
作者单位: | 北京航空航天大学计算机科学与工程系!北京100083 |
| |
摘 要: | 提出了基于帧特征、段特征联合建模的语音识别模型。该模型采用描述谱参数轨迹的段特征,在段尺度上实现了对语音信号帧间相关性的显式建模;采用段特征依赖的非平稳时间序列产生模型,实现了段特征与帧特征间的相关性建模,并在帧尺度上通过参数化的均值轨迹函数,实现了对语音信号帧间相关性的隐式建模。本文给出了基于帧特征、段特征联合统计距离优化的分段算法以及内嵌EM迭代的模型参数估计算法。对非特定人汉语孤立韵母以及多话者汉语基本音节的识别实验表明,该模型的识别性能优于标准HMM及趋势HMM。
|
本文献已被 CNKI 等数据库收录! |
|