首页 | 本学科首页   官方微博 | 高级检索  
     检索      

综合非语境因素的语音数据分类与声学建模研究
引用本文:丁鹏,徐波.综合非语境因素的语音数据分类与声学建模研究[J].声学学报,2004(1).
作者姓名:丁鹏  徐波
作者单位:中国科学院自动化研究所模式识别国家重点实验室,中国科学院自动化研究所模式识别国家重点实验室 北京 100080,北京 100080
摘    要:分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8%-10%。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。

本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号