首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
基于单高斯模型集的汉语美子带特征重建算法   总被引:2,自引:0,他引:2       下载免费PDF全文
罗宇  杜利民 《电子学报》2004,32(10):1654-1657
本文提出了基于单高斯模型集的汉语美子带特征重建(SGMDI)方法,并通过试验研究了该算法对提高语音识别系统加性噪声鲁棒性的作用.实验结果表明:SGMDI方法能够明显提高语音识别系统对各类音子尤其是容易被加性噪声破坏的清辅音音子的识别正确率,从而显著增强了语音识别系统的噪声鲁棒性.  相似文献   

2.
基于隐马尔可夫模型局部最优状态路径的数据重建算法   总被引:3,自引:1,他引:2  
该文提出了基于隐马尔可夫模型局部最优状态路径的数据重建(LOPDI)算法。该算法假设语音特征矢量是一个L状态隐马尔可夫模型的输出序列,基于局部最优状态路径估计产生语音特征矢量的次最优状态序列,并按最大后验概率准则(MAP)重建出缺失矢量。实验表明,LOPDI算法能够显著提高语音识别系统对加性噪声的鲁棒性。  相似文献   

3.
并行子带HMM最大后验概率自适应非线性类估计算法   总被引:1,自引:0,他引:1  
目前,自动语音识别(ASR)系统在实验室环境下获得了较高的识别率,但是在实际环境中,由于受到背景噪声和传输信道的影响,系统的识别性能急剧恶化.本文以听觉试验为基础,提出一种新的独立子带并行最大后验概率的非线性类估计算法,用以提高识别系统的鲁棒性.本算法利用多种噪声和识别内容功率谱差异,以及噪声在不同频带上对HMM影响的不同,采用多层感知机(MLP)对噪声环境下最大后验概率进行非线性映射,以减少识别系统由于环境不匹配而导致的识别性能下降.实验表明:该算法性能明显优于最大后验线性回归算法和Sangita提出的子带语音识别算法.  相似文献   

4.
龙华  杨明亮  邵玉斌 《通信学报》2020,41(4):134-142
针对语音通话中语音段的起始检测性能不佳,检测语音连续性结构受到破坏的问题,提出了一种基于特征流融合的带噪语音检测算法。首先,根据语音特性分别提取时域特征流、谱图特征流和统计特征流;其次,利用不同的语音特征流分别对带噪音频中的语音段进行概率估测;最后,将各个特征流估测得到的语音估测概率进行加权融合,并利用隐马尔可夫模型对语音估测概率进行短时状态处理。通过对复合语音数据库在多类型噪声与不同信噪比条件下的性能测试表明,所提算法相对于基于贝叶斯与DNN分类器的基线模型相比,语音检测正确率分别提高了21.26%与11.01%,显著提高了目标语音的质量。  相似文献   

5.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法。将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决。实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性。应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率。  相似文献   

6.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFCC特征参数在噪声环境和较大词汇量情况下,其抗噪性和识别率均优于MFCC特征参数的结果。  相似文献   

7.
噪声自适应的多数据流复合子带语音识别方法   总被引:3,自引:0,他引:3  
张军  韦岗 《电子与信息学报》2006,28(7):1183-1187
首先针对现有丢失数据语音识别技术中的边缘化(marginalisation)技术在特征运用上的局限,提出了一种倒谱特征分量的可靠性估计方法,将边缘化技术推广到常用的倒谱语音识别系统中; 然后利用基于全带和子带倒谱特征的边缘化识别器在不同噪声中的互补性能,提出了一种噪声自适应的多数据流复合子带语音识别方法。实验结果表明,所提识别方法可以自适应地选出全带和子带数据流中受噪声影响较小者并以之为主要依据进行识别,有效地提高了识别系统在多变噪声环境中的鲁棒性。  相似文献   

8.
为提高语音活动检测(VAD)在低信噪比下的准确率,提出了一种基于子带长时信号变化特征的VAD算法.将语音信号转换到频域,并分解为几个不重复的子频带,对这些子带信号分别提取长时信号变化特征,然后采用GMM在线建立语音和非语音模型,以模型的似然比进行VAD判决.实验结果表明,算法在较低的信噪比下能够显著地提高语音活动检测的准确率,且在多种噪声环境和信噪比条件下具有较好的稳健性.应用于语音识别系统的实验表明,该算法能有效提高噪声环境下的语音识别率.  相似文献   

9.
基于子带能量累积变化的语音端点检测   总被引:1,自引:0,他引:1  
噪声环境下的语音端点检测在稳健语音识别中占有十分重要的地位。根据噪音和语音子带能量的累积分布变化,提出一种新的语音信号端点检测算法。通过计算各帧的子带能量变化程度,并以此设定门限进行语音端点的检测。实验表明,与一些传统的端点检测算法比较,该算法在速度和抗噪声能力上都有所增强,适合低信噪比下的语音端点检测。  相似文献   

10.
马璐  王刚 《现代电子技术》2012,35(4):18-21,24
在传统的多目标跟踪系统中,数据关联仅利用了那些与目标状态向量直接相关的信息。在此提出了一种基于广义概率数据关联(GPDA)的新的关联算法即特征辅助跟踪(FAT)算法。该算法同时利用了目标的特征信息和状态信息进行数据关联,较好地解决了在密集杂波环境下对近目标的跟踪问题。最后以目标的一维距离像信息为例进行仿真,仿真结果表明,所提出的算法使跟踪性能优于传统的概率数据关联。  相似文献   

11.
In this letter, we propose a new histogram equalization technique for feature compensation in speech recognition under noisy environments. The proposed approach combines a signal‐to‐noise‐ratio–dependent feature reconstruction method and the class histogram equalization technique to effectively reduce the acoustic mismatch present in noisy speech features. Experimental results from the Aurora 2 task confirm the superiority of the proposed approach for acoustic feature compensation.  相似文献   

12.
为了减轻因信包丢失而造成的语音失真,提出了一种基于双边线性预测的信包丢失隐藏算法。这种方法利用丢失信包的前一信包或邻接信包(在后一信包可获得的情况下)预测丢失信包,通过线性加权双边线性预测的样点获得最终的重建信号,使用重叠相加和幅度调整操作平滑重建信号和真实信号之间的边界。经过非正式试听和ITU-T P.862协议所推荐的PESQ算法测试,该算法的重建语音信号质量与其他四种流行重建算法相比,有了较为明显的改善。  相似文献   

13.
改进的图像重建迭代算法   总被引:6,自引:0,他引:6  
张兆田  张朋 《电子与信息学报》2004,26(10):1626-1630
针对不完全数据图像重建问题,该文从积分方程角度提出一种改进的图像重建迭代算法(Im-proved Iterative Reprojection Reconstruction,IIRR),并证明其在范数下收敛。该算法的图像重建收敛速度和重建图像误差依赖于引入的参数因子、已知的投影数据与图像的先验信息。重建图像可以表示为由已知投影数据所构成图像的级数形式。数值模拟结果表明,IIRR算法在不完全数据的情况下具有较好的图像重建能力。  相似文献   

14.
本文概述了基于滤波器组法的语音识别系统,并给出了滤波器网络的具体设计方法。  相似文献   

15.
魏国  刘昕  孙金玮  孙圣和 《电子学报》2008,36(4):695-700
由氯化钠、蔗糖组成的三元水溶液在食品渗透脱水过程中有着广泛的应用.本文采用一种新颖的多功能传感器,在线敏感三元溶液的超声波传输速度、电导率以及温度三个参量.基于获取的三个可测参量,本文重点研究利用支持向量回归方法实现多功能传感器信号重构,同时获得三元溶液中各成分的浓度估计值.支持向量机是基于结构风险最小化准则的新型机器学习方法,适用于小样本标定数据情况,可有效抑制过拟合问题并改善泛化性能.实验结果显示测试数据集氯化钠浓度和蔗糖浓度的平均绝对误差分别为0.00615 mol/kg和0.00369 mol/kg,表明所提出的重构算法具有较高的可靠性和准确度,验证了方法的有效性.  相似文献   

16.
变异语音处理的研究进展   总被引:1,自引:0,他引:1       下载免费PDF全文
张磊  韩纪庆  王承发 《电子学报》2003,31(3):411-418
本文讨论了变异语音处理技术及其研究进展,分析了变异情况对语音识别性能产生的影响,综述了变异语音分类和变异语音识别方法,探讨了变异语音处理研究中存在的问题及未来的研究重点.  相似文献   

17.
稳健语音识别技术发展现状及展望   总被引:12,自引:0,他引:12  
姚文冰  姚天任  韩涛 《信号处理》2001,17(6):484-493
本文在简单叙述稳健语音识别技术产生的背景后,着重介绍了现阶段国内外有关稳健语音识别的主要技术、研究现状及未来发展方向.首先简述引起语音质量恶化、影响语音识别系统稳健性的干扰源及其影响.然后分别介绍语音增强、稳健语音特征的提取、基于特征和模型的补偿技术、麦克风阵列、基于人耳的听觉处理及听觉视觉双模态语音识别等技术路线及发展现状.最后讨论稳健语音识别技术朱来的发展方向.  相似文献   

18.
本文在丢失数据技术与声学后退技术的基础上,提出了一种基于模糊规则的鲁棒语音识别方法,首先根据先验知识或假定建立特征分量的可靠程度与其概率分布之间的模糊规则,识别时观察矢量的输出概率由一个基于规则的模糊逻辑系统来得到,并针对倒谱识别系统给出了一种具体的实现方法.实验结果表明,所提识别方法的性能显著优于丢失数据技术和声学后退技术.  相似文献   

19.
为了提高核磁共振图像的重构效果,提出一种Contourlet变换的MRI图像重构算法。首先,将核磁共振图像运用Contourlet变换进行分解,以此得到该磁共振图像对应的高频子带;然后,对高频子带利用方向正交特点进行重构,并采用高斯分布测量矩阵对各子带进行测量,构建压缩感知;最后,对于各子带系数运用正交匹配追踪法进行重建,随后对原图像运用Contourlet反变换进行重构。经分析实验结果可得出结论:在相同采样率的情况下,在生成核磁共振图像中,本文提出的重构算法在主观视觉效果、峰值信噪等方面要优于其他算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号