共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
一种面向语音识别的新型神经网络 总被引:1,自引:0,他引:1
提出了一种新型神经网络模型,描述了该网络的工作原理和训练方法以及识别算法。为克服神经网络对时序信号建模能力差的缺点,引入了非线性分段处理和代表帧特征提取方法。最后介绍了根据这一模型所设计的一个汉语语音识别系统,试验表明该网络在汉语语音识别方面具有较大的潜力。 相似文献
4.
6.
语音情感识别的研究进展 总被引:11,自引:0,他引:11
情感在人类的感知、决策等过程扮演着重要角色.长期以来情感智能研究只存在于心理学和认知科学领域,近年来随着人工智能的发展,情感智能跟计算机技术结合产生了情感计算这一研究课题,这将大大的促进计算机技术的发展.情感自动识别是通向情感计算的第一步.语音作为人类最重要的交流媒介,携带着丰富的情感信息.如何从语音中自动识别说话者的情感状态近年来受到各领域研究者的广泛关注.本文从语音情感识别所涉及的几个重要问题出发,包括情感理论及情感分类、情感语音数据库、语音中的情感特征和语音情感识别算法等,介绍了当前的研究进展,并讨论了今后研究的几个关键问题. 相似文献
7.
8.
语音识别与理解的研究进展 总被引:1,自引:0,他引:1
本文综述了当前语音识别理解的发展趋势和最新进展。指出美国在不依说话人的大词汇表的连续语音隐马尔柯夫模型识别方面起主导地位,日本在大词汇表的连续语音神经网络识别、模拟人工智能进行语音后处理方面起主导地位,并介绍了国际上最优秀的语音识别理解系统。 相似文献
9.
语音识别是当今世界尖端科技之一,是一门典型的交叉学科。在计算机通信和机器人等领域有很好的应用前景。本文较详细地介绍了语音识别的一般原理,归纳总结了笔者在研究语音识别时所遇到的难点。 相似文献
10.
11.
本文简要讨论了在基于HMM的连续语音识别系统中怎样选取基本语音单元的问题,介绍了在欧洲Polyglot课题下在法国LINSI-CNRS建立的基于上下文无关音素HMM。然后,本文详细给出了利用左或右上下文相关音素HMM,作者对上述系统改进后进行的连续语音识别,有用美国语音库DARPA-RM1,在不考虑句法信息时,我们获得了连续时词识别率大约3-10个百分点的明显提高。实验是在法国LIMSI-CNRS 相似文献
12.
13.
线性预测HMM(Linear Prediction HMM,LPHMM)并没有象传统HMM那样引入状态输出独立同分布假设,但实用中识别性能并不佳.通过分析两种HMM的各自优劣,本文提出了一种新的语音识别的混合模型,将语音静态特性(基于传统HMM)和动态特性(基于LPHMM)分别描述又有机结合在一起,更为精确地刻划了真实的语音现象,同时又继承使系统的实现改动很小和较小的计算量.汉语大词汇量非特定人连续语音识别的实验表明,混合模型的识别性能显著好于LPHMM和传统HMM.理论上,本文还给出了LPHMM的一组闭式参数重估公式. 相似文献
14.
15.
智能机器人语音识别技术 总被引:3,自引:0,他引:3
给出了一种由说话者说出控制命令,机器人进行识别理解,并执行相应动作的实现技术。在此,提出了一种高准确率端点检测算法、高精度定点DSP动态指数定标算法,以解决定点DSP实现连续隐马尔科夫模型CHMM识别算法时所涉及的大量浮点小数运算问题,提高了定点DSP实现的实时性、精度,及其识别率。 相似文献
16.
17.
正反向隐马尔可夫模型及其在连续语音识别中的应用 总被引:1,自引:0,他引:1
本文针对语音信号中客观存在的正、反向依赖特性,明确提出了用条件概率的概念来定量表述语音信号的这种正、反向的马尔可大依赖关系,提出了描述语音信号这种正反向依赖关系的正反向隐马尔可夫模型(HMM),并用实验证明了仅仅利用语音反向依赖关系语音识别同样也能获得相当可观的识别性能。接着,本文针对孤立字和连续语音两种不同的识别任务,研究了在语音识别中同时利用这两种依赖信息的方法,并提出了一种连续语音识别中的新的搜索算法──正反向分半混合搜索。这种方法利用基于正向HMM的正向Viterbi搜索和基于反向HMM的反向Viterbi搜索的中间结果来有效地结合正反向依赖信息,实验证明正反向分半混合搜索方法确实一致地优于单用任何一种依赖信息的单向搜索识别方法。 相似文献
18.
耳语音识别可应用于国家安全的某些特殊需要。运用双门限法对语音样本进行端点检测,通过实验分别找出短时能量、短时过零率的高低门限4个参数的最佳取值。深入分析研究参数的抗噪问题,在MFCC参数中引入短时能量、一阶差分、二阶差分等参数,增强MFCC的抗噪性。研究表明,在隐马尔可夫模型中,MFCC和LPCC联合运用讨论识别效果要远优于独立参数。 相似文献
19.
Wei Han Kwok-Wai Hon Cheong-Fat Chan Chiu-Sing Choy Kong-Pang Pun 《The Journal of VLSI Signal Processing》2007,47(3):223-232
This paper presents the design of a speech recognition IC using hidden Markov models (HMMs) with continuous observation densities.
Results of offline and live recognition tests are also given. Our design employs a table look-up method to simplify the computation
and hence the architecture of the circuit. Currently each state of the HMMs is represented by a double-mixture Gaussian distribution.
With minor modifications, the proposed architecture can be extended to implement a recognizer in which models with higher
order multi-mixture Gaussian distribution are used for more precise acoustic modeling. The test chip is fabricated with a
0.35 μm CMOS technology. The maximum operating frequency is 62.5 MHz at 3.3 V. For a 50-word vocabulary, the estimated recognition
time is about 0.16 s. Using noise-corrupted utterances, the recognition accuracy is 93.8% for isolated English digits. Such
a performance is comparable to the software implementation with the same algorithm. Live recognition test was also run for
a vocabulary of 11 Chinese words. The accuracy is 91.8% for five male and five female speakers.
相似文献
Wei HanEmail: |
20.
语音识别隐马尔可夫模型的改进 总被引:7,自引:1,他引:6
由于在语音识别中被广泛应用的隐马尔可夫模型是一重马尔可夫模型,它不能充分地描述语音信号的时间相依性。虽然理论上可将HMM扩展成多重马尔可夫模型,但由于所需运算量和存储量将成指数增长而使其难以应用。因此,本文提出一种新模型,它是由HMM与一个能描述语音信号时间相依性的多维高斯密度函数相结合构成的。本文从理论上论证了新模型的合理性。对汉语不计声调的全部409个单音节的识别实验结果表明:新模型的识别率显 相似文献