首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 78 毫秒
1.
结合汉语字单音节的特点,以0-9十个数字的音节设计局部码本,提出了在训练和识别过程中的FSVQ算法,使讲话者识别系统的正识率达到95%。  相似文献   

2.
为有效模拟情绪的动态转换过程,检测个体在交互过程中隐藏的情绪倾向从而提高虚拟交互过程的智能性,首先利用Hawkes过程模拟个体情绪的产生与衰退过程,然后利用隐马尔科夫模型检测个体的表情并将其映射到情绪模型的维度空间,最后通过对比受到事件刺激前后观测到的情绪状态来推导个体针对事件的情绪倾向.在个体隐藏情绪状态的情况下,系统采用持续追加正向刺激的策略激活个体的情绪表达,对于无法检测到情绪表达的状态采用默认为负倾向的策略.实验显示,本方法能够有效计算个体隐藏的情绪倾向并提高交互的智能性.   相似文献   

3.
一种基于奇异值分解的带噪语音识别方法   总被引:3,自引:3,他引:0  
提出了一种抗噪声的语音识别方法,用于训练和用于测试的语音信号在提取特征之前,均需经过相同的奇异值分解滤波,本文还提出了一种滤波参数的选取方法,实验证明,采用这种方法可以大幅度提高传统隐马尔可夫模型语音识别系统的抗噪声性能。  相似文献   

4.
为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母两部分建立的半音节隐含Markov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。  相似文献   

5.
为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母2部分建立的半音节隐含M arkov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。  相似文献   

6.
一种抗噪声语音识别方法   总被引:2,自引:0,他引:2  
本文提出了一种抗噪声语音识别新方法,并以这种方法为基础,在SUN工作站上实现了这一系统,实验结果表明,本文提出的方法提高了传统隐马柯夫模型语音识别器的抗噪性能。  相似文献   

7.
一种基于噪声动态检测的语音端点检测算法   总被引:1,自引:0,他引:1  
HMM技术在语音识别中得到较为成功的应用.本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性,第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

8.
HMM技术在语音识别中得到较为成功的应用,本文基于HMM的孤立词语音识别系统的识别策略,提出了两个改进的算法.第一种算法是对背景噪声进行动态估计的汉语语音端点检测算法,较一些常规的端点检测方法如基于能量的端点检测方法,具有更高精度和鲁棒性.第二种算法针对分裂法进行码本设计时,可能出现除数为零的计算错误,提出了避免出现计算错误的改进算法.通过进行汉语孤立词语音识别实验,表明这两种算法是有效的,得到较高的识别率.  相似文献   

9.
语音的网络搜索,不同于传统文字输入的搜索方式,它可应用于特定的环境场合,而且汉语语音搜索将是未来网络技术发展的重要方向.本文将从汉语语言模型建立和语音网络搜索两个主要方面,给出一种适合汉语的网络搜索方法.  相似文献   

10.
一种新型前向神经网络用于汉语四声识别   总被引:3,自引:0,他引:3  
提出了一种新型的前向神经网络,并研究了其在语音识别中的应用。该神经网络为只含一层非线性隐层的前向神经网络,以线性的输出层代替一般BP网络的非线性输出层,可以更准确地,范围更大地完成非线性函数估值功能。该神经网络采用了包括反向传播算法及最小均方算法的混合算法进行训练,可以减少落入局部最小点的概率以及提高收敛速度。  相似文献   

11.
利用基因算法训练连续隐马尔柯夫模型的语音识别   总被引:2,自引:0,他引:2  
为了提高语音识别系统的性能,基于全域优化的思想,提出了一种用于训练连续隐马尔柯夫模型(CHMM)的新算法——基因算法,并将该算法用于语音识别.用该算法训练CHMM,可得到最佳的模型参数,从而提高了语音识别率.利用该算法训练CHMM,不需要对CHMM的每一个参数单独进行估值,能够在一定的程度上提高训练速度.文中阐述了整个算法,给出了计算机模拟结果,并与传统的训练方法进行了比较.  相似文献   

12.
均衡化的改进K均值聚类法   总被引:3,自引:0,他引:3  
为了进行连续马尔可夫模型的初值提取,提出一种各类在训练样本空间近似均衡分布的K均值聚类法。在聚类的过程中引入惩罚因子,从而限制过多的训练矢量集中于一个或几个类,使样本空间划分近似均匀。连续马尔可夫模型初值提取实验证明,该方法与标准的K均值聚类法、LBG(L inde Buzo G ray)聚类法相比,降低了矢量量化产生的全局失真,各个类在样本空间的分布更加均匀,提高了矢量量化的性能。将该方法用于孤立词识别连续马尔可夫模型的初值提取,可使各个高斯概率密度函数的参数估计更逼近其无偏估计,从而提高了马尔可夫模型初值的可靠性。  相似文献   

13.
介绍了一个在微机上实现的有限词,特定人语音识别系统,该系统采用连续,M元高斯混合密度的隐式马尔柯夫模型(CDHMM)为识别方法,以修改后的BaumWelch方法为训练重估算法,文中提出了对语音特征矢量非线性归一化预处理,和对训练数据不足的HMM模型特征空产是进行后处理修正的算法,还提出了一种基于语音知识的模型初始化的方法,经实验证明,系统的识别率可以达到90%以上。  相似文献   

14.
基于修正MFCC参数汉语耳语音的话者识别   总被引:12,自引:1,他引:12  
耳语音的话者识别是一个较新的研究课题,许多参数模型与正常音存在差异.例如话者识别中常见的M el倒谱系数(MFCC)应用于耳语音中就存在共振峰和听觉敏感区域定位的偏差.基于对耳语音共振峰位置、能量以及人耳对耳语音听觉模型的研究提出了修正MFCC参数MFCCM和MFCCExp-Log,并结合两种参数的特点,改进了传统隐马尔可夫模型,建立了适用于耳语音的汉语话者识别系统.通过1 600个音的话者识别实验得出采用MFCCM的正确率为88.88%;MFCCExp-Log参数为91.38%;如果采用改进隐马尔可夫模型正确率可以提高到92.31%,均高于传统参数模型.实验表明,修正MFCC参数可以作为表征耳语音特点的参数,它提高了耳语音话者识别系统的识别率.  相似文献   

15.
对于隐Markov模型(HMM),经典的参数重估方法是Eaum-Welch算法,该算法基于最大似然准则,具有快速收敛和保证似然度单调增的优点,但是对于其他的训练准则,则不存在这样的算法,由于目标函数的复杂性,在考虑采用梯度方法时,必须先解决如何求取梯度的问题,为此,提出一种求取梯度的实现方法,结果表明,使用该方法所取得的模型与用Baum-Welch算法所得的模型性能相当,而前者适用于基于各种准则的训练方法。  相似文献   

16.
基于改进的隐马尔科夫模型的语音识别方法   总被引:1,自引:0,他引:1  
针对隐马尔可夫(HMM)语音识别模型状态输出独立同分布等与语音实际特性不够协调的假设以及在使用段长信息时存在的缺陷,对隐马尔可夫模型进行改进,提出马尔可夫族模型。马尔可夫族模型可看作一个数学上由多个马尔可夫链构成的多重随机过程,HMM模型则是双重随机过程,因而,HMM模型可视为马尔可夫族模型的特例。马尔可夫族模型用条件独立性假设取代了HMM模型的独立性假设。相对条件独立性假设,独立性假设是过强假设,因而,基于马尔可夫族模型的语音模型更符合语音实际物理过程。在马尔可夫族语音识别模型中引入状态段长信息,能自动根据语速对语音单元段长进行调整。非特定人连续语音实验结果表明,利用状态段长信息的改进语音识别模型比经典HMM模型的性能明显提高。  相似文献   

17.
噪声环境中基于HMM模型的语音信号端点检测方法   总被引:8,自引:1,他引:8  
在噪声环境下如何提高语音信号端点检测的准确性是自动语音识别(ASR)研究中的一个重要课题.常用的基于短时能量的端点检测方法对于能量较低的音节或在信噪比较低的环境下,检测性能不够理想.讨论了一种基于HMM模型的语音信号端点检测方法.先用训练的方法生成背景噪声和废料的模型,再用Viterbi解码算法对待测信号进行处理,并给出了具体的实现方法.实验测试结果表明,基于HMM的端点检测方法的检测性能接近于人工检测,方法是有效的.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号