首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
汉语连续语音识别中一种新的音节间相关识别单元   总被引:1,自引:0,他引:1  
考虑汉语连续语音中的协同发音现象对语音识别性能的提高是非常重要的。针对汉语语音的特点,提出了一种新的在汉语连续语音识别中考虑音节间协同发音现象,对声学模型进行细化的识别单元。然后基于语音学知识对音节间上下文影响进行分类,实现单元间状态参数的共享,降低了模型的复杂程度,保证了模型的可训练度。这种方法和传统方法的最大不同在于:这种方法完全利用语音学知识进行聚类,而传统方法采用数据驱动的聚类方式。识别实验表明,基于语音学分类的音节间相关识别单元对识别性能有明显的改善,系统的首选误识率降低了17%。  相似文献   

2.
分别采用基于数据聚类和基于先验知识的两种研究方法,深入探讨了性别、口音、语速、信道等非语境因素对语音数据分类与建模的影响。为了综合考虑语境、非语境因素在统一框架下建模的问题,采用非语境因素扩展决策树方法。而对于这种方法生成的多套非语境因素相关的高精度声学模型,提出一种依据最大似然准则,动态组合生成测试人相关声学模型的算法。这种方法可以使系统相对误识率平均降低8%-10%。实验结果说明为非语境因素分类建模可以提高声学模型的建模能力,而且模型组合算法可以有效解决统一建模所带来的模型选择问题。  相似文献   

3.
本文研究水声OFDM通信信号与常见单载波水声数字通信信号(MPSK,MFSK)之间的调制识别问题。考虑到水声信道复杂传播特性对循环前缀相关性的影响,本文通过截取信号前后片段并迭代搜索双相关峰进行无需先验知识的水声OFDM通信信号特征参数提取,在此基础上设计了一种基于模糊系统的水声OFDM通信信号识别器。对不同信道条件下海上实录信号数据的识别实验结果表明了本文方法的有效性。  相似文献   

4.
为解决非合作通信系统中水声OFDM信号的类型识别,本文研究水声OFDM通信信号与常见单载波水声数字通信信号(MPSK,MFSK)之间的调制识别问题。考虑到水声信道复杂传播特性对循环前缀相关性的影响,本文通过截取信号前后片段并迭代搜索双相关峰进行无需先验知识的水声OFDM通信信号特征参数提取,在此基础上设计了一种基于模糊系统的水声OFDM通信信号识别器。对不同信道条件下海上实录信号数据的识别实验结果表明了本文方法的有效性。  相似文献   

5.
提出了一种对光谱信号识别的新方法。针对光谱信号的特征 ,我们设计了基于径向基函数神经网络组成的统计混合模型 ,并构造了识别系统的代价函数。通过优化系统的代价函数 ,导出了类EM算法去估计混合模型的参数 ,从而构建对光谱特征识别的识别器。利用实际的拉曼光谱 ,对本文所提出的估计模型参数的算法与建立的光谱识别器进行了检验。我们还讨论了利用特征波长与相应的光谱强度 ,以及利用主分量分析组成输入特征矢量 ,及其这些输入特征矢量对光谱识别器应用的效果。实验结果表明 ,所提出的算法可以有效地估计模型参数 ,其建立的光谱识别模型具有较高的识别准确率。所提出的对光谱信号识别的方法通用性强 ,因此具有较为广阔的应用前景。  相似文献   

6.
汉语孤立字全音节实时识别系统   总被引:1,自引:0,他引:1  
本文在大量语音实验的基础上,对汉语语音识别方法进行了较为深入的探讨,并以IBMPC/AT配以自行研制开发的TMS320C25-E型高速信号处理板为硬件基础,建立了一个特定人汉语普通话全音节实时识别系统.该系统针对汉语普通话的语音特点,采用了分层识别策略.整个系统响应时间小于0.2秒,用4遍1240个全音节语音对系统进行的严格测试表明:系统四声识别的平均正确率为99%左右,音节识别前5个候选的正确识别率分别为82%,91%,94%,96%,97%;同时,本文根据这一测试结果建立了相应的声韵母混淆矩阵和基于Shepard方法的相似度集群分析树图,并对照汉语语音合成清晰度测试结果及汉语语音知觉结构的集群分析结果,对本系统各部分进行了较为深入的分析,提出了相应的改进措施.  相似文献   

7.
基于ARMA模型的汉语讲话者识别   总被引:3,自引:0,他引:3  
实现了一个仅用鼻音声母且与文本无关的汉语讲话者识别系统,根据讲话者在讲话时鼻腔相对固定、发鼻音时咽腔稳定,以及汉语鼻音声母(只有m-和n-两种)少(全部音节分别只有53和48个)的特点,使用极零(ARMA)模型获得所有汉语鼻声母音节的极点和零点系数的谱参数。系统在对20个讲话者识别时,其性能为:各个人所有单个声母测试时,总正识率为87.92%;分别随机地选用各人的人3、4、5个声母平均后测试时,则平均正识率可达91.67%、95.00%、96.67%、99.97%。  相似文献   

8.
为了解决多组分红光谱定量分析中的特征的取和校正建模问题,本文提出了一种输入层自构造神经网络。在应用这种网络之前的预处理过程首先对训练数据进行分析,获得关于问题的某些先验知识。在训练阶段,神经网络根据先验知识自动选择输入层神经元的个数,同时确定网络参数。这种网络模型将特征提取和参数学习过程融为一体,有利于提高建模效率。利用仿真红外光谱的定量分析实验表明,这种网络模型不仅能够对光谱数据实现高效率的波长选择,并具有抑制随机噪声和非线性干扰的能力。  相似文献   

9.
提出了广义模型,将动态时间规正(DTW,DynamicTimeWarping)技术和隐马尔可夫模型(HMM,HiddenMarkovModel)统一到一个语音声学模型的框架内.分析表明,广义模型更接近语音实际情况并具有很小的存储量.还利用广义模型构造了汉语全音节语音识别器,和离散HMM及DTW的对比实验结果显示:对于特定人识别,广义模型的识别性能和DTW相当而高于离散HMM;对于非特定人识别,广义模型的识别性能高于DTW和离散HMM。  相似文献   

10.
提出一种基于人体轮廓表达的姿势学习框架来进行人体行为识别。通过一种基于Procrustes形状分析和局部保持投影的姿势特征表示方法,从人体运动视频中提取具有平移、旋转和放缩不变性的姿势特征,在保留人体姿势的局部流形结构的同时尽量提取子空间上的判别信息。针对该特征还提出了一种基于姿势字典学习的人体行为识别框架,对每类行为分别学习一个对应于该类的字典,通过串联所有类的字典来得到整个姿势字典;并通过最小重构误差准则来分类测试视频。在Weizmann和MuHAVi-MAS14数据集上的实验结果证实了该方法的识别率高于大部分经典方法。特别是在MuHAVi-MAS14数据集上的识别率对比已有的结果上有巨大的提升。  相似文献   

11.
中高分辨力遥感图像中飞机目标自动识别算法研究   总被引:2,自引:0,他引:2  
提出了一种中高分辨力的航空航天遥感图像中飞机目标快速自动识别的新算法。在分割和分类过程中充分利用飞机目标的先验知识,提出了一种改进区域分割方法,并应用树分类器对飞机目标进行自动识别。所提出的改进区域分割方法较好地实现了区域分割中阈值的准确自动选取,克服了复杂背景图像中小目标的全局阈值自动分割的失效问题。采用二叉树分类器,通过提取简单的目标几何特征,分层进行种类识别,提高了识别速度,降低了漏检率和虚警率。运用该方法进行了实验。结果表明,识别率达到了100%。  相似文献   

12.
传统的船舶辐射噪声基频检测方法不仅依赖大量的先验知识,而且对背景噪声非常敏感。为了提高目标识别的稳定性和精确性,本文提出了一种基于深度神经网络的基频检测算法。首先从多通道水听器信号中提取DEMON谱,然后直接将二维谱特征矩阵输入由CNN和LSTM构成的级联网络,最后通过稠密层输出实现对基频的估计。从仿真和外场试验数据得到如下结论:(1)深度网络能够实现无先验知识和不同信噪比条件下的基频检测,具有良好的泛化性能。(2)LSTM网络能够高效地从时序DEMON谱中提取统计特征,提高基频估计精度。(3)输入信号的时间长短会影响网络的检测精度,更长时间的信号能够获得更好的检测结果。  相似文献   

13.
陈斌  陈琦  张连海  屈丹  李弼程 《声学学报》2016,41(1):125-134
在区分性训练的框架下,提出了一种基于混淆信息加权的互补系统构造方法。首先通过统计音素对的混淆信息,利用混淆信息给音素对加以不同的惩罚权重,分别以基线系统中的3个最优识别结果作为参考,计算混淆信息加权后的音素准确率,同时以正确的标注为参考计算标准的音素准确率。然后通过同时最大化混淆信息加权后的音素准确率和最小化标准音素准确率,构建模型层互补系统,并进一步通过结合RDLT (region-dependent linear transform)特征变换过程构造特征层的互补系统。实验结果表明,与互补最小音素错误准则相比,融合模型层互补系统后识别率提高了0.76%,同时融合特征层和模型层的互补系统识别率提高了1.35%。本方法可以增大互补系统间的差异性,提高系统融合后的识别性能。   相似文献   

14.
冯立军  谷德桥 《应用光学》2008,29(1):156-159
设计了一种同步控制器和参数识别器来实现异结构不确定混沌系统的同步控制。以单模激光Lorenz系统和不确定Genesio系统为例,验证了这种控制器的有效性。根据Lyapunov稳定性理论,分步构造出Lyapunov函数,从而给出同步控制器和参数识别器的结构。仿真结果表明:利用本文提出的同步控制方案,仅用一个控制器就能使不确定Genesio系统的所有状态变量严格地跟踪Lorenz系统的混沌轨迹,而且误差变量经过短暂的时间序列以后始终平稳地趋于零,实现了异结构混沌系统的混沌同步,且不确定Genesio系统的参数全部可以得到识别。  相似文献   

15.
本文在分析了汉语单音节发音的音节结构的基础上,定义了基于声韵母类的语音识别单元,从声学角度确定了用于汉语全音节识别系统的声学单元,并研究了这些声学单元的检测一致性及基于这些单元的识别系统的鲁棒性。文中还对大量的发音人的声母类发音的长度作了统计,给出了基于本文给出的分割算法和本文定义的声母单元下的声母长度预分类方法。通过在非特定人全音节汉语语音识别系统上的应用表明,本文定义的语音识别单元具有很高的检测一致性,建立在其上的识别,系统也具有很高的鲁棒性;文中给出的预选方法在最好的情况下,可以减少一半以上的运算量,而预选精度几乎达到100%。  相似文献   

16.
基于半波差分谱的语音信号音节切分   总被引:1,自引:1,他引:0  
根据听觉感知系统对于动态语音特征的响应特点,提出了半波差分港的概念,在此基础上提出了一种简便的音节切分算法,可以将存在大量协同发音现象的连续语音切分成一个个音节。在连续语音上的切分实验结果说明这种切分算法是准确而可靠的.  相似文献   

17.
李娟娟? 《应用声学》2021,40(5):767-773
针对兰姆波多模态识别问题,提出了基于小样本字典学习的模态识别方法。将多层复合板的频散特性看作一个线性时不变系统,首先,根据频散知识模拟各个模态传播特定距离后的信号,提取走时和能量特征创建字典;其次,获取待测信号的走时特征,通过查询字典来识别兰姆波模态;最后,根据能量参数估计结果,实现待测信号中各模态信号的分离和重构。通过对三层粘接的AAA板(铝板-亚克力板-铝板,每层厚度为2mm)中传播距离为0.3m、0.5m的直达波和反射波的实验验证,结果显示该方法对A0、S0模态的有效识别和各个波包信号的准确重建。  相似文献   

18.
针对当前彩色图像和深度图像(RGB-D)特征融合困难、联合识别效率不高的问题,提出了一种结合K奇异值分解(KSVD)和最大相关最小冗余准则(mRMR)的RGB-D场景图像融合算法。该算法首先采用KSVD稀疏图像的特征,将稀疏系数对应的字典原子作为特征融合的参数,以完整地表达图像的全部信息;之后采用互信息的mRMR原则求取维度最小且各维度之间相关性最小的特征原子组合;最后通过最大化原则融合特征原子对应的稀疏系数,从而完成了两种图像之间的有效信息融合。实验结果表明,该算法在信息熵、互信息和边缘保持度等方面比主成分分析-K奇异值分解和非下采样轮廓变换-K奇异值分解融合算法更有优势,有效提高了图像目标的识别准确率和成功率。  相似文献   

19.
一种正交二视角光学层析重建算法   总被引:1,自引:0,他引:1  
邢键  高益庆 《光学学报》2005,25(12):606-1610
提出了一种基于最大熵原理的正交二视角重建算法,该算法能够较好地重建多峰非对称待测场,且只需两个正交方向的投影数据。算法中融合了含有轴对称因子的先验知识,该先验知识可由两个正交方向的投影数据迭代算出,并分析了正交投影方向这个因素对重建结果的影响。通过计算机数值模拟,结果表明,融合先验知识的正交二视角重建算法与没有融合先验知识的正交二视角重建算法相比重建精度全面超出。其中,在两峰随机余弦高斯模拟待测场的情况下均方根误差减少了73%。在三峰随机高斯模拟待测场的情况下均方根误差减少了47%。该算法充分显示了在重建多峰非对称待测场时的优越性。同时,由于只需要两个正交方向的投影数据,可使实验系统得到简化。  相似文献   

20.
大多数图象复原技术都是以图象退化的某种先验知识为基础,即系统的脉冲响应是已知的。这种复原称为先验模型。在许多实际应用中,这种知识往往不能简单地加以利用,退化可能难以测量或退化可能以不能予测的方式随时间变化。在这种情况下,必须从退化图像中以或明或隐的方式抽出退化信息。这种复原称为后验模型。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号