排序方式: 共有36条查询结果,搜索用时 15 毫秒
11.
用 TMS320C31 实时实现电话语音识别系统 总被引:3,自引:0,他引:3
描述了一个新型实时声控用户交换机语音接口的设计和实现。该系统使用数字信号处理器TMS320C31开发板在PC机WINDOW平台下实现了与人无关连续命令语音识别,完成拨号、进行电话交换。系统使用少量控制词加上连续数字串构成了电话用户交换系统的常用命令语句,并生成相应识别文法网络(语言模型)。识别采用改进的令牌传递式Viterbi算法。研究中还开发识别系统拒识算法,在无拒识情况下命令语句中数字识别率为98%以上,数字串(串长<4)识别率达到91%以上,通过加入拒识算法,字符串识别率可达95%以上。 相似文献
12.
13.
基于后验概率词格的汉语自然对话语音索引 总被引:1,自引:0,他引:1
语音索引是语音检索任务的关键问题之一.该文针对汉语自然对话语音索引问题,提出了基于子词的词格索引和融合方法.采用后验概率形式表示的词格取代最优路径进行索引.根据后验概率词格特性,将LVCSR识别得到的基于词的词格分解为基于子词的词格;在汉语自然对话语音关键词检测任务上,采用字、有调音节和无调音节作为子词单元,关键词检测指标品质因数相对基线系统分别提高了3.9%、4.4%和7.4%.根据后验概率词格节点之间、边之间可合并的特性,在词格内部进行合并,并对不同识别器结果词格进行融合,品质因数指标由基线系统的68.3%(用LVSCR得到的)和66.9%(用音节识别器得到的)提高到78.8%. 相似文献
14.
针对以往的矩阵分解方法不能保证分解结果非负的问题, 根据非负矩阵分解(NMF: Non negative Matrix Factorization)结果非负的特点, 提出了基于NMF的阴影检测方法, 并以此为基础将进一步引入的分块非负矩阵分解(BNMF: Block Non negative Matrix Factorization)应用于阴影检测。通过NMF/BNMF提取训练样本中阴影的亮度特征, 再根据特征识别测试样本中的阴影区域。实验结果表明,与基于奇异值分解方法相比, 该算法的阴影检测细节更清晰, 具有更好的效果。 相似文献
15.
针对传统的隐含马尔可夫模型(hidden Markov model,HMM)存在的缺陷,该文提出了一种在识别的后处理阶段使用段长模型的方法,并应用在基于HMM的汉语识别系统上。该方法利用归一化的段长模型对识别系统的解码结果重新打分,比较前后两次算出的分数从而选出更可靠的识别结果。实验表明,通过该方法将段长模型应用在识别过程中,可以显著提高识别系统的性能,大量减少识别结果中的插入错误。数据显示,该方法使识别系统的音节错误率下降了大约10%,识别系统最终的插入错误和删除错误都低于1%。 相似文献
16.
基于离散HMM的非特定人关键词提取语音识别系统 总被引:2,自引:0,他引:2
设计了一个基于离散隐含马尔可夫整词模型的非特定人汉语小词表关键词提取语音识 别系统, 提出一种基于对前向、 后向搜索得到的关键词假设做二次识别的置信度策略. 将 该置信度用于关键词提取系统的说话验证, 得到了良好效果. 相似文献
17.
目前主流的说话人确认系统一般包括若干个分类器,或称子系统,通过对各分类器输出分数的融合得到最终的识别结果。该文针对说话人确认系统线性分数融合中的分类器筛选问题,提出了最小矢量角(VAM)筛选准则,将各分类器得到的分数拼接成矢量,在分数矢量空间中考察各矢量的几何学关系,然后选取一个最优的矢量子集,使得它们经过线性组合能够与实际情况对应的参考矢量夹角最小。为了控制搜索规模,在分类器选取方案的优化中,采用模拟退火算法得到近似最优解。实验结果表明,基于VAM的分类器选择可以在降低所需分类器数目的同时提高系统的性能。较之依据单分类器性能最优准则选择分类器,在选择分类器数量n=16的情况下,系统等错误率相对下降15%。 相似文献
18.
为了减少声学模型复杂度、降低对嵌入式系统的硬件资源需求,提出了为汉语全音节的声母、韵首、韵腹、韵尾4部分音位分别建立隐含Markov模型的新方法。基于汉语语音学的音位知识,并结合4部分音位方案比较实验,最终确定声母、韵首、韵腹、韵尾4部分音位模型总数分别为76、12、76、14,对应的4部分的模型状态数分别为4、1、4、2。同采用声母、韵母两部分建立的半音节隐含Markov模型相比,新系统中模型数、状态数减少了30.2%、36.5%,同时关键词识别率提高1.32%。 相似文献
19.
针对语种识别中大规模数据库的训练问题,提出一种基于局部多样性建模的向量空间模型。首先将训练数据库分成若干个小数据库,然后利用每个小数据库来训练不同的向量空间模型,最后对不同的模型进行加权组合。为了有效地对不同模型进行组合,需要对模型的加权系数进行优化。对模型组合算法从理论上进行推导,在模型权重与分数线性融合系数之间建立起对应的数学关系,并提出采用逻辑回归方法对不同模型的权重进行估计。在美国国家标准技术局(NIST)2009年度语种识别测试库上的实验结果表明:所提方法不仅能够处理大规模的训练数据,而且相比传统方法识别性能也有了一定程度的提高,系统的等错误率在30 s、10 s和3 s的测试条件下分别下降了8.44%、5.91%以及3.45%。 相似文献
20.
一种改进的新型说话人确认算法 总被引:1,自引:0,他引:1
在单芯片上实现的说话人确认系统是说话人识别应用的重要方向。该文面向片上应用,在使用DTW(dynamictime-warping)匹配方法的确认系统基础上提出一种改进的说话人确认算法,结合说话人确认的任务特点对DTW算法进行了改进:1)引入分层判决思想,2)在判决中结合单帧说话人区分能力估计,使系统的识别性能得到改进。新系统能够在对模板应用压缩处理后仍然保持良好的识别性能。测试表明新确认系统不做模板压缩时的等错误率为1.81%,经过1:8模板压缩处理后新系统的等错误率为2.35%。 相似文献