首页 | 本学科首页   官方微博 | 高级检索  
     

综合非语境因素的语音数据分类与声学建模研究
引用本文:丁鹏, 徐波. 综合非语境因素的语音数据分类与声学建模研究[J]. 声学学报, 2004, 29(1): 23-28. DOI: 10.15949/j.cnki.0371-0025.2004.01.005
作者姓名:丁鹏  徐波
作者单位:中国科学院自动化研究所,模式识别国家重点实验室,北京,100080;中国科学院自动化研究所,模式识别国家重点实验室,北京,100080
摘    要:分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8%~10%。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。

关 键 词:语境因素  声学模型  决策树  声学建模  训练数据  说话人  语音数据  相关模型  数据分类  测试集
收稿时间:2002-03-05
修稿时间:2002-06-05
本文献已被 CNKI 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号