首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
2.
全音节连续汉语语音识别的研究   总被引:3,自引:0,他引:3  
在大词汇量连续汉语语音识别的研究中,我们根据汉语语音自身的特点,选用全音节作为识别单元,与音对文法相结合,以期达到实现大词汇量语音识别的目的.实现连续语音识别时,不需预先切分音节,而使用帧同步型网络搜索算法并在搜索中予以音长控制,用180句未训练过的任意词组成的无文本约束的连续语句对系统进行测试评估,获得了40.40%的音节识别率.  相似文献   

3.
汉语数码语音识别自适应算法   总被引:4,自引:0,他引:4  
说话人自适应是提高非特定人语音识别性能的有效方法之一。本文将MAP算法应用于汉语数码语音识别中,并讨论了几种加快自适应速度的方法以及自适应对非自适应人的影响。实验表明,MAP算法可以有效地降低汉语数码识别对被适应人的误识率,而且对非自适应人性能影响很小。  相似文献   

4.
刘鑫  罗幼喜 《电子测试》2022,(24):67-69
为解决深度学习模型在语音识别芯片上内存占用过大的问题,训练时间长,训练深度不够等问题,本文在Transformer语音识别模型的基础上,提出一种减少Transformer计算复杂度的模型,新的模型参数仅有原模型的1/10,模型训练速度大大提升。此外本文在对模型进行参数调整的过程中还对Transformer模型结构中add&norm这一结构结合残差神经网络进行修改,针对模型在训练过程中因为模型深度太深(容易产生梯度消失和梯度爆炸)导致的模型收敛速度过慢或者模型不收敛等问题,在保证词错率下降的同时,加快模型的收敛速度和训练速度,修改结构之后的模型在词错率上相比原有模型词错率更低,并且收敛速度也比未修改结构的模型收敛速度更快。  相似文献   

5.
本文论述了基于神经网络模型的非特定人汉语语音识别。我们采用24人(12人用于训练,12人用于测试)的语音数据对汉语十个数字和十个孤立字进行了实验,取得了96.3%(10个数字)和97.2%(十个汉字)的识别率。  相似文献   

6.
7.
改进汉语数码语音识别中的语音特征提取性能   总被引:3,自引:0,他引:3  
汉语数据码语音识别中存在三种与语音特征提取性能有关的语音混淆。  相似文献   

8.
欧智坚  王作英 《电子学报》2003,31(4):608-611
尽管作为当前最为流行的语音识别模型, HMM由于采用状态输出独立同分布假设,忽略了对语音轨迹动态特性的描述.本文基于一个更为灵活的语音描述统计框架—广义DDBHMM,提出了一个具体的多项式拟合语音轨迹模型,以及新的训练和识别算法,更好地刻划了真实的语音特性.本文还给出了一种有效的剪枝算法,得到一个实用化模型.汉语大词汇量非特定人连续语音识别的实验表明,这种剪枝的多项式拟合语音轨迹模型以较少的计算量明显改善了识别系统的性能.  相似文献   

9.
金玮  孙甲松 《电声技术》2010,34(8):49-52
研究了汉语语音识别中语言模型的并行优化问题,在已有汉语语音识别有调拼音模型和多核体系结构的基础上,对其算法进行了并行优化,并优化了查询机制和前后向算法。试验表明,该方法取得了很好的效果,识别速度有了很大改进。  相似文献   

10.
11.
基于小波变换的汉语声调识别新方法   总被引:2,自引:0,他引:2  
利用小波变换能够模拟人耳听觉特性的优点及其时频局部化特性,对实际语音信号进行分析。根据小波变换模极大值原理以及语音信号的奇异和瞬态特性,提出了一种新的小波变换峰值检测算法。该算法可用于精确提取语音的基音周期,准确进行声调识别。最后,给出应用实例说明了本文算法的有效性。  相似文献   

12.
在介绍和评述了当今各种语音合成方式优缺点的基础上,作者认为用参数合成方式实现音节型语音合成系统是汉语合成较优越方式,设计了一个用有限音节合成无限词汇的汉语语音合成系统模型,试验证明其可行性,并指出进一步提高合成汉语语音自然度的途径。  相似文献   

13.
一种基于支持向量机的手写汉字识别方法   总被引:30,自引:0,他引:30       下载免费PDF全文
本文提出了一种新的基于支持向量机手写汉字识别方法.支持向量机作为一种新的机器学习方法,由于其建立在结构风险最小化准则之上,而不是仅仅使经验风险达到最小,从而使得支持向量分类器具有较好的推广能力.本文首先讨论了支持向量机的基本原理,然后,针对支持向量机识别大类别手写汉字所遇到的特殊问题,文章进行了分析和阐述,并在此基础上,提出了基于最小距离分类器预分类的两级分类策略.最后,针对GB2312-80的1034个汉字类别的120套手写样本,进行了实验仿真.实验结果表明,本文方法的汉字识别率较距离分类器有较大提高,其中多项式核函数的支持向量分类器,识别率平均提高3.38%,表明了本文方法的有效性.  相似文献   

14.
脱线签名的验证较难,他仅依靠签名图像的静态信息,而书写过程中的动态信息几乎完全消失。针对脱线手写签名识别的特点,提出基于提升小波变换的特征选取方法,将传统的结构特征与统计特征有机结合起来。运用K-L变换对已提取的特征向量进行降维。最后通过支持向量机进行真伪识别。实验结果表明该算法对测试样本具有高识别率。  相似文献   

15.
基于ML-pLSA模型的目标识别算法   总被引:1,自引:0,他引:1  
陈琳  卢湖川 《电子与信息学报》2011,33(12):2909-2915
为了避免图像目标识别过程中识别结果对分割结果的过度依赖,该文提出了一种基于多尺度的概率潜在语义分析目标识别方法(Multi-Level-probabilistic Latent Semantic Analysis, ML-pLSA)。该方法利用多种分割算法对图像进行多尺度分割,再利用pLSA算法和词袋方法(Bag Of Words, BOW)对分割区域进行目标类别估计,最后联合多尺度的估计值给出最终分割结果。在目标尺度、目标角度、外界光照变化都相对较大的GRAZ-02数据库上进行实验,结果表明:与传统目标识别算法相比,该方法鲁棒性更强;在识别准确率方面,也有了很大的提高,取得了很好的效果。  相似文献   

16.
特定声识别与定位系统   总被引:1,自引:0,他引:1  
龚小章 《电子科技》2011,24(8):36-38,45
设计并实现了一种特定声识别与定位系统,应用于捕捉特定声源并判断其方位。系统将声音识别和定位两大功能有机结合,利用基于频域特性的相似度计算识别方法监测目标音频信号,定位方面,提出了对传统的基于到达时间差(TDOA)算法的系统优化。通过硬件电路预处理和软件设计相结合的方法,简便地计算出音频信号的到达时间差。再经过多重计算求...  相似文献   

17.
本语文提出了一种用于模式识别的电波型模糊处理器。该处理器采用“加权求和”的函数,并且权重可以调节,以利于系统的自适应处理。另外,该处理器可以按综合录属度大小的顺序依次输出综合录属度以及相应的标准模式,这将十分有利于改善硬件系统的性能,尤其是多级联系统的性能。我们采用单支多晶的2μm N阱标准数字CMOS工艺成功地制作了模糊处理器芯片。测试结果表明,该处理器芯片的性能很好。  相似文献   

18.
一种手写汉字特征抽取的新方法   总被引:5,自引:0,他引:5  
针对非特定人脱机手写汉字识别,本文提出了一种新的特征抽取方法。首先,将输入汉字模式进行非线性规一化;然后,根据汉字的横竖撇捺四种基本笔画将规一化后的模式分割成四个子模式;最后,将所得到的四个子模式分别均匀地划分成M×M个小网格,在每一小网格内统计笔画穿透数目,从而得到一个4M2维的特征向量。通过对国标一级3755个汉字的测试表明,正确识别率达90%以上,从而证实了本文方法的有效性。  相似文献   

19.
工程图纸骨架识别的模板设计   总被引:1,自引:0,他引:1  
文章依轮廓象素点是否可被剥离,结合工程图纸的特点,设计了一个简明直观的骨架识别模板,并在软件实现的基础上获得了交叉点畸变较小的拓扑骨架。  相似文献   

20.
通过研究声品质几个基本参数的理论模型,提出了声品质客观评价模型,编制了仿真程序,给出了几种信号的声品质烦扰度计算结果,并通过主观评价试验,验证了该模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号