排序方式: 共有8条查询结果,搜索用时 15 毫秒
1
1.
一种基于迟滞编码的自动语音端点检测方法 总被引:2,自引:0,他引:2
端点检测在语音识别中占有十分重要的地位,端点检测的准确性将直接影响整十语音识别系统的性能。已往的自动端点检测方绝大多数都是利用帧平均能量EN,帧平均跨零数ZN,帧平均跨零积A和帧平均零比B等参敦来确定语音段的始点和终点。这些方法的缺点是难以设置对各次实验都合适的固定阈值,这给实际应用带来了很多不便。本文提出了一种基于迟滞编码的自动端点检测方法——在对语音信号进行迟滞编码的基础上,利用各杖的码字和来判斯语音段的起点和终点。该方法充分利用了噪声和信号的统计特性,克服了已往端点检测方法的不足。实验结果表明.该方法具有良好的性能。 相似文献
2.
本文在文献(1)建立的外周听觉系统以及部分中枢听觉神经系统的基础上,建立了一个主意识别器。它由听觉模型作为语音声学前端处理器(即特征提取),由具有tonotopic组织结构的神经网络作为识别分类器。大量实验表明,由该听觉模型提取的特征参数不仅能很好地表示主意区别意义,而且对于噪声环境下的语音特征表示有较好tobustness。语音识别实验表明:在有噪声的情况下,采用听觉模型参数的识别器,其识别率明 相似文献
3.
4.
基于决策树的汉语三音子模型 总被引:8,自引:2,他引:6
基于决策树理论的上下文相关声学模型在英语语音识别中已经得到了比较深入的研究和应用,但在汉语语音识别中的应用则研究的比较少。本文基于决策树理论建立了汉语语境相关模型-三音于模型,讨论了决策构建模所要解决的几个重要问题:(1)基本建模单元集的选择,(2)音子类别集的设计,(3)评估函数的选择,(4)停止准则的选择,(5)决策树的建立和三音子模型的生成,本文着重分析了两种不同建模单元的性能:对音子类别集的设计提出了一些一般性的准则,并对我们设计的类别集进行了统计分析;分析了三音子模型在语音库的覆盖程度。实验结果表明,基于决策树的三音子声学模型建立的识别系统与双音子声学模型系统比较,误识率下降了24.7%。 相似文献
5.
6.
几种高鲁棒性通道及说话人自适应语音识别算法研究 总被引:1,自引:1,他引:0
鲁棒性问题是决定语音识别技术能否在实际中得以应用和推广的关键问题之一。概括起来说,导致语音识别系统性能变坏的原因大体上来自三个方面,即噪声(加性噪声、卷积噪声)、信道变化和不同的讲话者(不同的声道形状、不同的发育方式等)。本文对三种高鲁律性自适应语音识别方法进行了研究和改进,并对它们的性能进行了比较,这三种方法分别是VQ码本自适应法、HMM参数自适应法和基于正则相关分析的谱变换补偿方法。实验结果表明,这三种方法都能提高非特定人语音识别系统对信道以及说话人的鲁棒性,而且基于正则相关分析的稻变换补偿方法具有最好的性能,它能够补偿由三种失真源同时引起的训练条件与测试条件之间的不匹配,因此适合作为一种通用的自适应方法。 相似文献
7.
由中国自动化学会、中国声学学会等五个学术团体联合主持的第二届全国人机语音通讯学术会议,于1992年9月18日—20日在桂林举行。近一百名学者、专家及青年科技人员参加了这次会议。 在会上宣读了95篇论文,这批论文涉及听觉模型与特征提取、语音识别方法与系统、非特定人语音识别、连续语音识别与语言模型、说话人识别、神经网络 相似文献
8.
提出了一种基于对识别器识别错误的统计分析建立音节混淆字典,并应用该音节混淆字典作为识别器的先验知识来校正结果的识别方法。这种近似的音节混淆字典可以分与语境无关和相关两种情况讨论,作为一种先验知识,它综合地刻画了说话人的发音特征、识别器的识别特征以及二者之间的相对关系。实验中,我们应用语境无关/相关的音节混淆字典于识别带上海口音的普通话识别器,使其音节误识率分别下降15%及20%。在此基础上,本论文结合常规的声学模型参数重估自适应MAP (最大后验概率)算法进一步研究了这种方法应用于语音识别系统的实际效果。结果证明,二者互为补充,更大地提高了识别器的精度。 相似文献
1