综合非语境因素的语音数据分类与声学建模研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

按检索

综合非语境因素的语音数据分类与声学建模研究

引用本文：	丁鹏,徐波.综合非语境因素的语音数据分类与声学建模研究[J].声学学报,2004(1).

作者姓名：	丁鹏徐波

作者单位：	中国科学院自动化研究所模式识别国家重点实验室，中国科学院自动化研究所模式识别国家重点实验室北京 100080，北京 100080

摘要：	分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8％-10％。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。
本文献已被 CNKI 等数据库收录！