首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于最大似然多项式回归的鲁棒语音识别
引用本文:吕勇,吴镇扬.基于最大似然多项式回归的鲁棒语音识别[J].声学学报,2010,35(1):88-96.
作者姓名:吕勇  吴镇扬
作者单位:东南大学信息科学与工程学院 南京 210096
基金项目:国家973计划,国家自然科学基金 
摘    要:本文针对最大似然线性回归算法线性假设的缺点,将多项式回归方法用于模型自适应,构建了基于最大似然多项式回归的非线性模型自适应算法。该算法在对数谱域用多项式回归方法,逼近每个Mel子带上识别环境模型均值与训练环境模型均值之间的非线性关系。多项式系数通过EM算法和最大似然准则从识别环境下的少量自适应数据中估计。实验结果表明,二阶多项式就可以较好地逼近模型均值的非线性环境变换关系。在噪声补偿和说话人自适应实验中,最大似然多项式回归算法的误识率都明显低于最大似然线性回归算法。本文算法较好地克服了线性模型自适应算法线性假设的缺陷,可同时减小噪声,和说话人的改变或其它因素对语音识别系统的影响,尤其适合说话人和噪声的联合自适应。 

关 键 词:说话人自适应  自适应算法  最大似然准则  语音识别系统  均值向量  回归算法  变换关系  多项式回归  二阶多项式  模型自适应  
收稿时间:2008-12-18

Maximum likelihood polynomial regression for robust speech recognition
L Yong,WU Zhenyang.Maximum likelihood polynomial regression for robust speech recognition[J].Acta Acustica,2010,35(1):88-96.
Authors:L Yong  WU Zhenyang
Institution:School of Information Science and Engineering, Southeast University Nanjing 210096
Abstract:The linear hypothesis is the main disadvantage of maximum likelihood linear regression(MLLR).This paper applies the polynomial regression method to model adaptation and establishes a nonlinear adaptation algorithm using maximum likelihood polynomial regression(MLPR) for robust speech recognition.In this algorithm,the nonlinear relationship between training and testing mean vectors in every Mel-band is approximated by a set of polynomials.The polynomial coefficients are estimated from small adaptation data i...
Keywords:
本文献已被 CNKI 万方数据 等数据库收录!
点击此处可从《声学学报》浏览原始摘要信息
点击此处可从《声学学报》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号