综合非语境因素的语音数据分类与声学建模研究 |
| |
引用本文: | 丁鹏, 徐波. 综合非语境因素的语音数据分类与声学建模研究[J]. 声学学报, 2004, 29(1): 23-28. DOI: 10.15949/j.cnki.0371-0025.2004.01.005 |
| |
作者姓名: | 丁鹏 徐波 |
| |
作者单位: | 中国科学院自动化研究所,模式识别国家重点实验室,北京,100080;中国科学院自动化研究所,模式识别国家重点实验室,北京,100080 |
| |
摘 要: | 分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8%~10%。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。
|
关 键 词: | 语境因素 声学模型 决策树 声学建模 训练数据 说话人 语音数据 相关模型 数据分类 测试集 |
收稿时间: | 2002-03-05 |
修稿时间: | 2002-06-05 |
本文献已被 CNKI 万方数据 等数据库收录! |
|