期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵贤宇欧智坚王作英《清华大学学报(自然科学版)》2005,45(7):892-895

为了进一步提高矢量Taylor级数(VTS)算法的模型补偿精度以及在噪声环境下的识别性能,提出将无监督聚类与VTS算法相结合。无监督聚类算法利用噪声模型之间的Kullback-Leibler距离将含噪语音段划分为若干个子段。然后针对各个子段分别进行一阶Taylor级数展开,并在此基础上逐段估计噪声参数和补偿声学模型。该算法结合一个中文数字串识别系统进行实验,在Babble噪声和Gauss白噪声环境下该算法的误识率相对传统的VTS算法分别下降了27.7%和17.8%。证明这种结合无监督聚类的分段VTS算法能够更加有效地将语音和噪声在倒谱域上的非线性混合模型用一阶线性模型来近似。相似文献

2.

利用段长信息的改进连续语音识别算法 总被引：1，自引：1，他引：1

赵庆卫王作英《清华大学学报(自然科学版)》1997,(10)

以基于段长分布的隐含Ｍａｒｋｏｖ模型为基础，提出了一种改进的帧同步束搜索连续语音识别算法，使段长信息在连续语音识别中得到充分有效的利用，并与原算法作了比较。在该算法的具体实现上，建立了状态的局部路径组和全局活跃路径两种数据结构，并采用了帧同步快速实时算法来处理局部路径的剪枝和跳转。说明了段长参数的估计方法。介绍了非特定人大词汇量连续语音识别的实验，实验结果表明，利用段长信息改进识别算法比原识别算法字的误识率降低了６％。相似文献

3.

基于汉语语音音位的HMM建模方法

何珏刘加《清华大学学报(自然科学版)》2007,47(4):518-521

为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母2部分建立的半音节隐含M arkov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。相似文献

4.

基于汉语语音音位的HMM建模方法

何珏刘加《清华大学学报(自然科学版)网络.预览》2007,(4)

为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母两部分建立的半音节隐含Markov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。相似文献

5.

自回归加噪声模型参数估计及其渐近性质

陈敏《山西大学学报(自然科学版)》1990,13(2):130-136

本文给出了自回归加噪声模型参数的一种估计,并证明了这种估许是强相容的且具有渐近正态性。相似文献

6.

非凸段长分布隐含Markov模型的搜索算法

吴及肖熙许琳王作英《清华大学学报(自然科学版)》2005,45(7):924-927

基于段长分布的隐含Markov模型(DDBHMM)可解决经典隐含Markov模型(HMM)的状态段长指数分布的问题,实现了基于凸性假设的搜索。为解决非齐次模型的搜索算法问题,提出采用混合Gauss分布来拟合非凸段长分布,用子状态拆分的方法来实现非凸段长分布DDBHMM识别算法。在音乐信号识别上的实验表明:该方法在召回率提高1.1%的情况下,使准确率提高约10%。该方法实现了非凸段长分布HMM的识别算法,并且对于其他非凸段长信号具有推广价值。相似文献

7.

用 TMS320C31 实时实现电话语音识别系统 总被引：3，自引：0，他引：3

刘加潘胜昔江金涛胡凯军王作英《清华大学学报(自然科学版)》1998,(9)

描述了一个新型实时声控用户交换机语音接口的设计和实现。该系统使用数字信号处理器ＴＭＳ３２０Ｃ３１开发板在ＰＣ机ＷＩＮＤＯＷ平台下实现了与人无关连续命令语音识别,完成拨号、进行电话交换。系统使用少量控制词加上连续数字串构成了电话用户交换系统的常用命令语句,并生成相应识别文法网络（语言模型）。识别采用改进的令牌传递式Ｖｉｔｅｒｂｉ算法。研究中还开发识别系统拒识算法,在无拒识情况下命令语句中数字识别率为９８％以上,数字串（串长＜４）识别率达到９１％以上,通过加入拒识算法,字符串识别率可达９５％以上。相似文献

8.

基于改进的隐马尔科夫模型的语音识别方法 总被引：1，自引：0，他引：1

袁里驰《中南大学学报(自然科学版)》2008,39(6)

针对隐马尔可夫（HMM）语音识别模型状态输出独立同分布等与语音实际特性不够协调的假设以及在使用段长信息时存在的缺陷,对隐马尔可夫模型进行改进,提出马尔可夫族模型。马尔可夫族模型可看作一个数学上由多个马尔可夫链构成的多重随机过程,HMM模型则是双重随机过程,因而,HMM模型可视为马尔可夫族模型的特例。马尔可夫族模型用条件独立性假设取代了HMM模型的独立性假设。相对条件独立性假设,独立性假设是过强假设,因而,基于马尔可夫族模型的语音模型更符合语音实际物理过程。在马尔可夫族语音识别模型中引入状态段长信息,能自动根据语速对语音单元段长进行调整。非特定人连续语音实验结果表明,利用状态段长信息的改进语音识别模型比经典HMM模型的性能明显提高。相似文献

9.

基于MDT特征补偿的噪声鲁棒语音识别算法

胡旭琰邹月娴王文敏《清华大学学报(自然科学版)》2013,(6):753-756

针对噪声环境下语音识别系统性能下降的问题,提出一种基于语音时频相关性的Mel特征矢量聚类补偿算法。该算法首先实现掩码估计,利用纯净语音信号时域和频域的相关性,实现了时频块的有效划分和基于时频块的语音特征聚类。在此基础上,对带噪语音的Mel语谱进行特征补偿。采用HTK工具和TIDIGITS数据库加入不同类别噪声的语音测试结果表明:该算法在不同信噪比条件下,获得了较基于频域相关性聚类特征补偿算法更好的性能。相似文献

10.

语音识别技术探讨

唐国《菏泽学院学报》2001,23(4):17-19

介绍了语音识别技术ASR的发展历史、目前研究方法、技术手段及当前取得的成绩与不足,提出一种新的的研究理论——利用基因算法训练HMM方法. 相似文献

11.

用于抗噪声语音识别的谐振强度特征

许超曹志刚《清华大学学报(自然科学版)》2004,44(1):22-24

基于传统的Mel倒谱系数(MFCC)系列特征的语音识别系统在噪声环境中的识别性能会急剧下降。为了进行噪声环境中的自动语音识别,提出了一种反映语音信号谐振程度的特征:谐振强度,并用之代替传统MFCC特征中的能量维(零维倒谱C0,或者帧能量E)。在展览馆噪声、人群噪声和汽车噪声等情况下的语音识别实验结果表明:基于这种新特征的语音识别系统比基于传统特征的语音识别系统有更高的平均识别率和更好的抗噪声能力。相似文献

12.

基于状态驻留时间的汉语语音分段概率模型 总被引：1，自引：0，他引：1

贾宾朱小燕罗予频胡东成《清华大学学报(自然科学版)》2000,40(1)

为了解决分段概率模型 (SPM)因缺少对时间信息描述而带来的建模精度低的问题 ,提出了状态驻留分段概率模型 (SDSPM)。SDSPM中包含了用伽玛分布表示的状态驻留概率 ,以刻划语音的时间特征。此驻留概率相当于隐马尔可夫模型 (HMM)中的状态转移概率 ,但使 SDSPM描述语音时间特征的能力强于 HMM。SDSPM既改善了 SPM的模型性能 ,同时又避免了 HMM的计算复杂度问题。测试实验证明了 SDSPM模型在汉语语音识别中的有效性。相似文献

13.

基于独立感知理论的鲁棒语音识别算法

孙暐吴镇扬《东南大学学报(自然科学版)》2005,35(4):506-509

为了提高在噪声环境下语音识别系统的性能,对基于子带独立感知理论的语音识别方法进行了研究.这些方法利用人耳对不同频率信号感知的差异,以及噪声和识别对象的频域特征差异,分别采用线性分析、判决分析、多层感知机以及子带最大似然估计对噪声影响进行补偿.实验表明,子带分析采用非线性策略优于线性策略.基于独立感知假定的子带模型,虽然由于独立性假定丢失了带间相关性,但对于噪声环境下语音识别而言可以捕获噪声和识别对象的频谱差异,从而获得比全带分析更高的鲁棒性. 相似文献

14.

用于统计语音合成的大尺度压缩HMM的方法

那兴宇谢湘匡镜明何娅玲《清华大学学报(自然科学版)》2011,(9)

统计语音合成使用隐Markov模型(HMM)作为声学特征的统计模型。提出了一种利用声学模型空间距离进行HMM的大尺度压缩的量化方法,通过对矢量量化码本进行的优选迭代步骤,减小压缩后的声道谱模型与原模型之间的声学距离,使通过量化模型合成的语音更加接近未量化模型。主观和客观测试结果显示:使用该方法进行声道谱模型的压缩,在压缩至原模型大小的0.06左右时,仍有约90%的评价得分认为合成语音的质量没有明显下降。相似文献

15.

参数共享在语音识别中的应用

郭锐朱小燕《清华大学学报(自然科学版)》2002,42(10):1374-1376

参数共享是基于隐 Markov模型 (hidden Markovmodel,HMM)的语音识别系统的参数训练中的一个关键性问题 ,因此在语音识别的诸多领域中都有重要的应用。对参数共享的作用及其使用的聚类算法进行了分析研究 ,在此基础上提出改进合并分级聚类算法 ,并将其应用于 HMM的状态捆绑。实验表明 ,一个大规模词汇量的孤立词语音识别器采用 HMM的状态捆绑后 ,可以大大缩减识别过程的时空消耗 ,同时识别率仅有较小的损失相似文献

16.

有限词汇,特定人,商品化的英语语音识别系统

姚萝姑《上海交通大学学报》1996,30(6):141-146

介绍了一个在微机上实现的有限词，特定人语音识别系统，该系统采用连续，Ｍ元高斯混合密度的隐式马尔柯夫模型（ＣＤＨＭＭ）为识别方法，以修改后的ＢａｕｍＷｅｌｃｈ方法为训练重估算法，文中提出了对语音特征矢量非线性归一化预处理，和对训练数据不足的ＨＭＭ模型特征空产是进行后处理修正的算法，还提出了一种基于语音知识的模型初始化的方法，经实验证明，系统的识别率可以达到９０％以上。相似文献

17.

Using vector Taylor series with noise clustering for speech recognition in non-stationary noisy environments

赵贤宇 Ou Zhijian Wang Zuoying 《高技术通讯(英文版)》2006,12(1):18-23

The performance of automatic speech recognizer degrades seriously when there are mismatches between the training and testing conditions. Vector Taylor Series （VTS） approach has been used to compensate mismatches caused by additive noise and convolutive channel distortion in the cepstral domain, in this paper, the conventional VTS is extended by incorporating noise clustering into its EM iteration procedure, improving its compensation effectiveness under non-stationary noisy environments. Recognition experiments under babble and exhibition noisy environments demonstrate that the new algorithm achieves 35% average error rate reduction compared with the conventional VTS. 相似文献

18.

隐Markov模型在剪接位点识别中的应用 总被引：6，自引：0，他引：6

夏慧煜周晴李衍达《清华大学学报(自然科学版)》2002,42(9):1214-1217

剪接位点的识别是基因识别中的一个重要环节。由于现有的基因识别算法主要关注编码区的整体特性 ,而并不着重考虑个别位点的信息 ,因此难以准确地识别出剪接位点。考虑到剪接位点附近的保守序列的相邻碱基之间应该存在某种相关性 ,利用一阶 Markov链建立了表述这种相关性的模型 ,在此基础之上 ,设计了专门用于剪接拉点识别的隐马氏模型 (HMM)方法。实验结果表明 ,用 HMM描述剪接位点附近序列符合实际情况 ,并且利用这一方法进行剪接位点的识别可以很好地提取位点附近保守序列在边缘分布与条件分布 (转移概率 )上的统计特征。使用该方法对真实剪接位点和虚假剪接位点进行识别 ,识别率均可达 90 %以上。相似文献