首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 84 毫秒
1.
为提高汉语连续语音识别系统的性能,建立了音节间相关的半音节识别单元,并研究了基于这种单元的连续语音识别算法。讨论了基于 D D B H M M 模型和最大后验概率估计准则的连续语音识别的理论基础,依据动态规划的基本原理,提出了一种基于音节间相关的识别单元的汉语连续语音识别算法。依照这种算法,不但能得到最优句子侯选,而且能够在识别过程中得到音节格(即 Nbest句子侯选)的数据结构。最后通过大词汇量非特定人连续语音识别的实验,表明了采用音节间相关的识别单元比基本的识别单元误识率有明显的降低  相似文献   

2.
选用倒谱特征、△倒谱特征、能量类特征等个语音信号特征,采用多码本和HMM/VQ技术实现非特定连接数字语音识别。在识别阶段,使用帧同步型网络搜索识别算法结合模糊切分实现非特定人连接数字语音识别。数字串识别准确率达到81%以上,而数字识别准确率更高,达到94.4%。  相似文献   

3.
本文在统一的框架下描述了隐马尔柯夫模型(HMM)用于语音识别时的各种形式,包括离散HMM、连续混合密度HMM、半连续HMM和最大分量连续HMM等,指出各种模型均是统一形式下的导出形式。文中就离散HMM、连续混合密度HMM和最大分量连续HMM在非特定人全音节汉语语音识别中的应用,从识别率和复杂度两方面进行了性能比较。为提高最大分量连续HMM的识别性能;提出了一种修正的训练算法。  相似文献   

4.
在大词表孤立词语音识别中,Viterbi搜索是时间消耗的主要因素。为改善基线系统性能,根据汉语孤立词识别的特点,提出了一种基于音节切分的束搜索算法,在音节层和词条层进行剪枝。该算法不增加内存开销。实验结果表明:在词表规模为10 000时,该算法以0.23%的识别率下降率为代价,将Viterbi搜索的时间消耗降低为基线系统的26.73%;相对于小词表,该算法在大词表情况下对系统性能的改善尤为明显。  相似文献   

5.
提出短时能频值(EFV)的新概念,设计了用短时能频值的参量来估计语音起止点的新的有效算法,提高了语音信号与背景噪声的分辨力。运用基于短时能频值EFV估计语音起止点的算法,研究汉语普通话音素的区别特征,上机计算分析证明了EFV门限能够很好地从噪声中分辨出语音信号,有着较好的稳定性和较高的语音-噪声分辨力。  相似文献   

6.
高性能汉语数码语音识别算法   总被引:13,自引:0,他引:13  
提出了一个高性能的汉语数码语音识别 (MDSR)系统。 MDSR系统使用 Mel频标倒谱系数 (MFCC)作为主要的语音特征参数 ,同时提取共振峰轨迹和鼻音特征以区分一些易混语音对 ,并提出一个基于语音特征的实时端点检测算法 ,以减少系统资源需求 ,提高抗干扰能力。采用了两级识别框架来提高语音的区分能力 ,其中第一级识别用于确定识别候选结果 ,第二级识别用于区分易混语音对。由于采用了以上改进 ,MDSR系统识别率达到了 98.8% .  相似文献   

7.
语音识别是让机器听懂人的说话,并准确地识别出语音的内容和执行相应操作的技术.该文介绍了语音识别发展的过程,语音识别系统的结构和识别过程,模式识别理论和技术在语音识别研究中的应用以及语音识别中的关键技术和面临的问题.最后讨论了语音识别技术存在的优点和不足,并展望了其应用研究的前景.  相似文献   

8.
论述了基于神经网络模型的特定人汉语语音识别,并建立了一基于3层BP神经网络的汉语语音识别系统,对汉语10个数字(1 ̄10)进行识别实验,获得了较满意的识别结果。  相似文献   

9.
介绍了汉语双模态数据库的研究背景,采集系统,语料选择和存储结构,要用国际通有模式,建立具有华人特征的汉语双模态数据库。  相似文献   

10.
提出一个将支持向量机(SVM)与动态时间归正算法(DTW)相结合的方法,即将DTW内嵌入SVM常用的径向基内积核函数(RBF)中,由此得到一个RBF/DTW混合结构内积核函数,从而实现支持向量机对语音的分类识别。  相似文献   

11.
基于语音的自动人类情感识别是近年来新兴的研究课题,它在人机通信中有广阔的应用前景。分别利用语音的短时和长时特征识别说话者的五种情感状态,即生气、高兴、悲伤、惊奇和一种无情感状态。提出了一种基于基音频率、子带频谱能量与共振峰频率的短时特征矢量和一种反映能量频谱分布及动态的长时特征参数,分别利用隐马尔可夫模型和支持矢量机两种方法进行识别。试验用的情感语音包括一个普通话情感语音库和一个丹麦语情感语音库,试验结果表明使用两类特征参数都可以得到较高的识别率。  相似文献   

12.
用DSP技术开发的一种新的语音识别系统   总被引:2,自引:0,他引:2  
本文介绍了一种基于听觉谱特征参数的语音识别方法和系统.该系统采用高速DSP芯片TMS320C25,实现了语音信号的实时处理.用由此芯片开发的EISA插卡与计算机结合,构成了一个智能化语音输入实时识别系统.实验结果表明,在小词汇量特定人条件下,该系统的正识率可达到98%以上,在非特定人和有噪情况下,系统正识率分别为95%和90%以上.通过比较发现,该系统在正识率、抗噪性和鲁棒性等方面均比传统识别方法要好  相似文献   

13.
在语音信号GTF特征的基础上,提出一种基于混沌调制的语音识别新方法.实验结果表明,该方法对语音的缺损和突发性噪声干扰具有很强的容错能力.  相似文献   

14.
综述了模式分类与识别中的特征抽取与选择、模式分类与识别的传统方法及其研究状况,同时也简介了模式识别中并行处理方法的进展.在模式识别研究中多信息源、多媒体、智能化策略的综合研究将是这一领域的新动向。  相似文献   

15.
在语音识别应用中,如何提高识别的效率是一个重要的研究方向,尤其在大词表的识别中,巨大的搜索空间带来了很大的计算代价。先介绍了语音识别系统的三个组成部分即特征提取、声音模型及语言模型;然后重点讨论了语音识别中几种常用的搜索策略,最后指出了搜索策略进一步研究的方向。  相似文献   

16.
IntroductionIn recentyears,speech recognition has made greatprogress.Commercial systems such as Via Voice( IBM Company) and Naturally Speaking 1 .0( Dragon System Company ) lead the field.Although the recognition ratio has greatlyimproved,many issues still need further research,such as,real- time in processing,systemcomplexity[4 6] ,very large scale integrated circuit( VLSI) implementation,etc.Among these issues,the implementation in VLSI is the most criticalchallenge for wide use of s…  相似文献   

17.
一种基于听觉模型的抗噪语音识别特征提取方法   总被引:5,自引:2,他引:5  
提出了一种新的语音识别特征提取方法。该方法是建立在听觉模型的基础上,通过计算语音的上升过零率作为频率信息并通过非线性幅度加权相结合来获取语音特征。仿真实现了中小词汇量、孤立词的语音识别,得到了较好的实验结果,证明了此方法具有较强的抗噪声性能。  相似文献   

18.
把小波理论应用于抗噪语音识别特征提取,提出了基于高斯小波滤波器的语音识别特征提取方法,通过对人耳听觉特性的研究,按照人耳临界带宽设计了一组高斯小波带通滤波器。详细讨论了高斯小波滤波器的尺度参数选择方法。使用RBF识别网络,仿真实现了使用新特征与原特征的识别结果,证明了新特征具有较高的识别率和优良的抗噪性能。  相似文献   

19.
为了提高中小词汇量语音识别系统在噪声环境下的识别性能,以10个汉语数码语音为对象,利用汉语数码语音信号区别于噪声信号的准周期特性,提出了一种汉语数码语音频谱包络峰值特性的提取方法,首先用基频对语音频谱采样得到由谐波值构成的包络以提高信噪比,然后再对所得包络进行峰值提取得到汉语数码语音的峰值特征。实验结果表明,在信噪比大于5dB时,用该方法得到的峰值特征具有一定的抗噪性。  相似文献   

20.
基于ZCPA和DHMM的孤立词语音识别系统   总被引:2,自引:0,他引:2  
介绍了用离散隐马尔可夫模型(DHMM)构造孤立词语音识别系统的过程,重点针对软件实现中的问题重新推导了Baum Welch算法的重估公式,引入一种抗噪性能很好的特征参数:过零率与峰值幅度特征,将该特征与DHMM结合用于孤立词识别系统。结果表明,此系统训练时收敛很快并且识别效果好。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号