排序方式: 共有43条查询结果,搜索用时 15 毫秒
31.
本文给出了一个高性能汉语数码串非特定人连续语音识别系统,其声学模型基于Mel倒谱系数和连续HMM,识别时采用多候选帧同步搜索算法,并采用了MCE算法进行训练以提高系统的区分能力,实验证明该系统的识别率为94.8%(不定长数字串)和96.8%(定长数字串).为增强系统的实用性,本文还研究了基于MAP算法的说话人自适应算法和基于置信度的拒识算法.在进行自适应后,误识率可相对下降40%以上,在拒绝掉5%的正确语音时,系统识别率可以上升到96.9%(不定长数字串)和98.7%(定长数字串). 相似文献
32.
33.
研究了中英文混合识别系统声学建模的方法,为改善识别效果及降低混合系统的模型参数规模,提出了一种基于状态时间对准的模型距离测度和声学知识相结合的中英文音素模型聚类算法,并与其他方法进行了比较。实验结果表明,在模型参数规模等同的条件下,该算法较之于模型直接合并有了显著的提高,比基于Bhattacharyya距离和似然度距离的做法也有了不同程度的改进。 相似文献
34.
35.
36.
汉语语音合成系统中激励源和声调模型研究 总被引:1,自引:0,他引:1
在语音合成器中激励源对合成语音的质量有极为重要的作用,本文对几种浊音激励源及其合成的结果进行了分析比较,同时对激励源细动态变化特性进行了研究。汉语的声调对合成语音质量影响很大,本文通过对语音基频、音长、音强的变化分析研究,建立了汉语的声调模型。在此基础上开发了一种并联型共振峰模型,该合成器能合成出具有较好清晰度和自然度的语音 相似文献
37.
38.
研究了音频信息处理中一项重要的预处理工作:语音音乐分类.针对语音信号处理中遇到的实际问题,选择合适的音频特征和分类器来对音频数据进行语音和音乐分类.采用二级系统,选择优化低能量率( Modified Low Energy Ratio,MLER)以及梅尔频谱倒谱系数(Mel Frequency Cepstral Coef... 相似文献
39.
40.
语音识别技术及应用(下) 总被引:3,自引:0,他引:3
语音识别系统分类与应用 语音识别系统可以根据对输入语音的限制加以分类。表1列出各种系统的分类比较。从表中可以看出,如果从说话者与识别系统的相关性考虑,可以将识别系统分为3类:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别;(2)非特定人语音系统:识别的语音与人无关,通常要用大量不同人的语音数据库对识别系统进行学习;(3)多人的识别系统:通常能识别一组人的语音, 相似文献