综合非语境因素的语音数据分类与声学建模研究期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

综合非语境因素的语音数据分类与声学建模研究

引用本文：	丁鹏, 徐波. 综合非语境因素的语音数据分类与声学建模研究[J]. 声学学报, 2004, 29(1): 23-28. DOI: 10.15949/j.cnki.0371-0025.2004.01.005

作者姓名：	丁鹏徐波

作者单位：	中国科学院自动化研究所,模式识别国家重点实验室,北京,100080;中国科学院自动化研究所,模式识别国家重点实验室,北京,100080

摘要：	分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8%~10%。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。
关键词：	语境因素声学模型决策树声学建模训练数据说话人语音数据相关模型数据分类测试集
收稿时间：	2002-03-05
修稿时间：	2002-06-05
本文献已被 CNKI 万方数据等数据库收录！