期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

基于连续高斯混合密度HMM的汉语全音节语音识别研究 总被引：5，自引：0，他引：5

国立新莫福源李昌立《声学学报》1995,(5)

本文在大量语音分析实验的基础上，对ＨＭＭ用于汉语全音节语音识别进行了较为深入的探讨，建立了一个连续高斯混合密度ＨＭＭ的汉语全音节语音识别系统．该系统在训练算法上撇开了传统的Ｂａｕｍ－Ｗｅｌｃｈ算法，代之以计算复杂度小、存储量小、迭代次数少且具有自动分割效应的分段Ｋ平均算法。对于ＨＭＭ的模型单元的选择，单元的结构以及模型参数的选取，充分考虑了汉语语音的特点；并在语音特征上做了深入的实验分析工作，采用了符合人耳听觉特性的Ｍｅｌ－Ｓｃａｌｅｄ参数，用ＦＦＴ倒谱代替了ＬＰＣ倒谱，同时利用了语音的动态谱特征和能量特征。另外，本文还针对汉语声母的特点，独特地提出了变帧移分析策略。整个识别系统的首选正识率为９１．１％．相似文献

2.

基于掩蔽特性的噪声环境下语音识别新特征 总被引：4，自引：1，他引：3

蒋文建韦岗《声学学报》2001,(6)

语音识别系统的识别率在噪声环境中下降很大。本文根据人耳的听觉特性,提出一种基于人耳听觉掩蔽特性的抗噪声特征提取方法。该方法先求取噪声语音的掩蔽特性,在此基础上再计算Ｍｅｌ倒谱系数用于语音识别。通过对ＴＩＭＩＴ数据包的０～９十个英语数字在ＮｏｉｓｅＸ９２的各种噪声下进行了识别试验。其中在信噪比０ｄＢ条件下,在３种噪声条件下识别率平均提高１５２％,实验表明新方法对于各种噪声环境下的识别率有显著提高。相似文献

3.

用于噪声鲁棒性语音识别的子带能量规整感知线性预测系数

下载免费PDF全文

蔡尚金鑫高圣翔潘接林颜永红《声学学报》2012,37(6):667-672

为了提高感知线性预测系数(PLP)在噪声环境下的识别性能,使用子带能量偏差减的方法,提出了一种基于子带能量规整的感知线性预测系数(SPNPLP)。PLP有效地集中了语音中的有用信息,在安静环境下自动语音识别系统使用PLP可以取得良好的识别率;但是在噪声环境中其识别性能急剧下降。通过使用能量偏差减的方法对PLP的子带能量进行规整,抑制背景噪声激励,提出了SPNPLP,增强自动语音识别系统在噪声环境下的鲁棒性。在一个语法大小为501的孤立词识别任务和一个大词表连续语音识别任务上做了测试,SPNPLP在这两个任务上,与PLP相比,汉字识别精度分别绝对提升了11.26%和9.2%。实验结果表明SPNPLP比PLP具有更好的噪声鲁棒性。相似文献

4.

高噪声背景下的孤立词语音识别方法研究及系统实现 总被引：2，自引：0，他引：2

王承发徐近需扬子云韩纪庆任为民吕成国《声学学报》1998,(3)

对高噪声背景下的语音特点进行了分析，提出了适应于高噪声背景下孤立词语音识别的全套方法，进行了系统实现。对本方法和系统进行了详细的实验比较和测试，证明系统在80dB左右接近同类无噪声识别系统的精度，最高可以抵抗100dB的噪声。相似文献

5.

基于中文语音识别技术的舰艇指挥训练系统的研究

景春进陈东东周琳琦《应用声学》2014,22(8):2571-2573

针对舰艇指挥训练系统的特点,提出了一种利用语音识别技术提高其训练效率的方法;首先分析了舰艇指挥指令的语言特点,然后研究了基于Sphinx平台的汉语连续语音识别的相关问题,包括声学模型的训练、语言模型的训练及语音识别引擎等;最后设计并实现了一个非特定人,中等专用词汇量的连续汉语语音识别系统;实验采用了一定数量的数字和专用词汇进行验证,结果表明,经过声学模型训练后,该系统的识别率有较大提高;该方法对提高舰艇指挥训练系统的自动化水平具有一定的指导意义。 相似文献

6.

基于连续HMM的汉语数码语音识别系统

钟明辉曹乃文黄汉明郑建华陈芽玲《广西物理》2007,(4)

探讨了连续隐马尔可夫模型的基本原理及其在汉语数码语音识别中的应用,实现了一个汉语数码语音识别系统,其正确识别率达到99%以上。相似文献

7.

全音节汉语语音识别系统的声学模型研究

关存太陈永彬吴伯修《声学学报》1994,(5)

本文在分析了汉语单音节发音的音节结构的基础上，定义了基于声韵母类的语音识别单元，从声学角度确定了用于汉语全音节识别系统的声学单元，并研究了这些声学单元的检测一致性及基于这些单元的识别系统的鲁棒性。文中还对大量的发音人的声母类发音的长度作了统计，给出了基于本文给出的分割算法和本文定义的声母单元下的声母长度预分类方法。通过在非特定人全音节汉语语音识别系统上的应用表明，本文定义的语音识别单元具有很高的检测一致性，建立在其上的识别，系统也具有很高的鲁棒性；文中给出的预选方法在最好的情况下，可以减少一半以上的运算量，而预选精度几乎达到１００％。相似文献

8.

基于声调建模的带噪汉语数字串语音识别 总被引：1，自引：1，他引：1

王欢良钱瑶 F.K.SOONG 韩纪庆《声学学报》2007,32(5):454-460

尝试利用声调信息来改善噪声下汉语数字串语音识别性能。为解决声调特征不连续问题,提出采用基于多空间概率分布的隐马尔可夫模型进行声调建模。简要分析噪声对声调特征提取的影响,论证了在带噪数字串语音识别中利用声调信息的可行性。实验结果显示,与不采用声调信息的方法相比,在5 dB到20 dB的测试数据上,所提方法可使错误率平均相对下降17.2%。这说明声调信息及所提建模方法对于改善带噪汉语数字串语音识别性能是有效的。相似文献

9.

BP神经网络在汉语数字语音识别中的应用

罗梅江丽莎罗涟玲《广西物理》2012,(3):26-28

从语音信号产生的数字模型出发,对1～10这10个汉语数字的语音信号进行预处理,提取了Mel频率倒谱系数,并将特征参数序列进行非线性时间规整为固定的帧数,使用BP神经网络的训练和识别,研究该方法的可行性和有效性。结果表明,在噪声环境下1,7,9的识别率为80%,而2,3,4,5,6,8,10的识别率都是100%,识别率主要受噪声、不同人的发音不同等因素的影响。该方法具有可行性强、识别率高的特点,可应用于语音识别系统。相似文献

10.

噪声环境中的汉语浊语音检测 总被引：1，自引：0，他引：1

李正友李天伟黄谦隋振庚《声学学报》2014,39(4):517-522

为了在低信噪比和复杂噪声环境下检测汉语浊语音,根据浊语音谐波结构特性,提出了一种鲁棒的浊语音检测方法。通过改进的谱跟踪算法,得到能表征浊语音谐波特性的一簇谱线;从谱线簇中提取谐波特征作为汉语浊语音检测的依据。在不同信噪比和不同噪声环境下的浊语音检测对比实验中全面优于传统方法,在0 dB信噪比时正识率高于传统方法约30%。实验结果表明,该方法在低信噪比和非平稳复杂噪声环境下都具有较好的浊语音检测效果。相似文献