首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 265 毫秒
1.
窄带语音带宽扩展算法研究   总被引:1,自引:0,他引:1  
张勇  刘轶 《声学学报》2014,39(6):764-773
为了降低谱失真,提出了一种基于隐马尔科夫模型的窄带语音带宽扩展算法。首先,算法选取与宽带谱包络互信息大的参数构成特征矢量,并利用隐马尔可夫状态和过去观察特征矢量的联合先验概率估计条件后验概率。其次,以条件后验概率为基础,算法结合贝叶斯条件参数估计法和最小均方差准则估计宽带谱包络。针对宽带激励信号估计,基于信号高频和低频的谐波相关性,提出了一种中频激励扩展算法。实验结果表明,与传统的基于隐马尔可夫模型的带宽扩展算法相比,本文算法可降低0.187 dB的平均谱失真,将谱失真大于10 dB的语音帧减少了34.3%。   相似文献   

2.
语音存在概率的估计是语音增强的核心技术之一,针对传统的存在概率估计方法是启发式的,没有把存在概率的估计统一到一个理论框架之中,不能保证估计最优,提出了一种基于序贯隐马尔可夫模型(SHMM)的存在概率估计方法,在每一子带上构建一个SHMM模型描述对数功率谱包络的时间序列,把谱包络序列看作一个在语音和噪声状态之间转移的动态一阶马尔可夫链,采用单高斯函数构建每一状态的概率模型,语音状态的后验概率即为语音信号的存在概率。为了满足算法实时性要求,SHMM参数估计简化为一阶回归过程,根据极大似然准则逐帧更新模型参数。实验表明:SHMM所描述的时序相关性对存在概率的估计起到关键作用,它优于一般的启发式估计方法;SHMM算法的语音增强分段信噪比(SegSNR)和对数谱失真(LSD)性能优于经典的改进型最小统计量控制递归平均(IMCRA)算法。   相似文献   

3.
俞一彪  王朔中 《声学学报》2005,30(6):536-541
提出了一种文本无关说话人识别的全特征矢量集模型及互信息评估方法,该模型通过对一组说话人语音数据在特征空间进行聚类而形成,全面地反映了说话人语音的个性特征。对于说话人语音的似然度计算与判决,则提出了一种互信息评估方法,该算法综合分析距离空间和信息空间的似然度,并运用最大互信息判决准则进行识别判决。实验分析了线性预测倒谱系数(LPCC)和Mel频率倒谱系数(MFCC)两种情况下应用全特征矢量集模型和互信息评估算法的说话人识别性能,并与高斯混合模型进行了比较。结果表明:全特征矢量集模型和互信息评估算法能够充分反映说话人语音特征,并能够有效评估说话人语音特征相似程度,具有很好的识别性能,是有效的。  相似文献   

4.
提出了一种基于极大似然的噪声对数功率谱估计方法,采用高斯混合模型对每一个频带上的功率谱包络构建统计模型,将时序包络划分为语音和非语音类,它们分别对应于高斯混合模型的两个高斯分量,描述语音和非语音的统计分布,其中非语音高斯分量的均值即为噪声功率谱的最优估计.采用序贯学习的方法,在极大似然准则下逐帧更新模型参数,并逐帧给出噪声功率谱的最优估计值。此外,由于序贯更新过程中语音信号长时缺失,容易导致模型失稳,提出了一种在线的最小描述长度准则(MDL)来判断语音信号是否长时缺失,从而保证了模型的稳定性.实验表明,算法性能整体优于经典的MS和IMCRA算法。   相似文献   

5.
高阶累积量具有高斯噪声抑制和阵元扩展特性,将高阶累积量引入水声信号的方位估计中,提出了离格稀疏贝叶斯学习重构的高阶累积量测向算法。该方法利用高阶累积量对高斯噪声的自然盲性,计算阵列信号四阶累积量来滤除高斯噪声,使阵元在原来的结构上扩展了一倍;并构造出选择矩阵剔除了四阶累积量中的冗余项,能再一次的扩展阵元,得到的新观测模型具有更好的统计性能;最后利用空域稀疏性,推导出四阶累积量下的离格稀疏表示模型,采用贝叶斯学习解算出源信号的最大后验概率,实现了目标方位估计。数值仿真和海试实验数据表明,该方法在相邻声源方位间隔为4°的情况下分辨概率可达到95%以上,在信噪比大于-5 dB时目标方位估计的均方根误差在1°以内,可显著抑制背景噪声干扰,在多声源密集分布条件下也能准确、稳健的对水声目标方位进行估计。   相似文献   

6.
陈雪勤  赵鹤鸣 《声学学报》2013,38(2):195-200
为了改善耳语音转换中声道系统的转换性能,针对定值转换方法在非特定人耳语音转换系统中效果不理想的情况,提出使用通用背景模型建立独立于说话人的声道系统转换模型。进一步针对在通用背景模型中由于较大分量数产生的声学概率密度统计模型的误差问题,提出基于最小谱失真度的后验概率和有效高斯分量选择方法优化特征矢量的转换性能。定义了板仓一斋田谱失真测度的性能指标对该模型进行分析比较,实验表明,基于通用背景模型的转换特征矢量平均谱失真度性能指标优于定值偏移方法,且稳定性明显好于定值偏移方法。通用背景模型基础上有效高斯分量选择方法可进一步将性能指标提高5.11%,主观听觉测试表明本文方法可改善转换语音的清晰度和准确度。   相似文献   

7.
为了解决传统水下目标跟踪中目标数目估计不准确、状态估计误差增长过快的问题,提出了一种基于高斯混合概率假设滤波的水下目标跟踪算法。该算法基于双基地观测模型,采用高斯混合概率假设滤波算法处理方位和时延信息,利用粒子群算法处理多普勒频率获得矢量速度,进一步提升算法的跟踪精度。结果表明,该算法能完成在杂波环境下对目标的跟踪,相比传统的关联算法,能够有效地实现目标个数估计和抑制状态误差增长的目的。  相似文献   

8.
徐振华  黄建国  高伟 《声学学报》2012,37(2):151-157
为了解决观观测噪声和信道噪声概率分布不完全已知时的多传感器分布式量化估计融合问题,提出了一种期望极大化算法(EM算法)的分布式量化估计融合方法。该方法将未知的噪声参数以及局部量化器量化概率建模为EM算法中二元高斯混合模型参数,利用极大似然估计方法的估计不变性得到目标参数的估计融合结果。仿真实验结果表明:该方法在局部传感器观测样本数目大于6000和信噪比大于6 dB时与已有理想信道条件下的估计方法性能相当。本文方法对水下分布式协同探测问题提供了一种简化的估计融合实现途径。   相似文献   

9.
对矩形谱宽带光抽运下的布里渊慢光延迟特性进行了理论分析。在小信号增益情况下,得到了高斯脉冲延时量、脉冲展宽因子和增益的解析表达式。计算结果表明,当信号光的10 dB带宽小于抽运光带宽的0.357时,解析解和数值解吻合,且信号光脉冲能实现零展宽延迟。单个矩形谱宽带光抽运能达到的最大有效布里渊增益带宽为20 GHz,可以实现半峰全宽约100 ps的高斯光脉冲的零展宽延迟。与高斯谱宽带抽运光相比,矩形谱宽带抽运光可减小脉冲失真。  相似文献   

10.
提出了一种对光谱信号识别的新方法。针对光谱信号的特征 ,我们设计了基于径向基函数神经网络组成的统计混合模型 ,并构造了识别系统的代价函数。通过优化系统的代价函数 ,导出了类EM算法去估计混合模型的参数 ,从而构建对光谱特征识别的识别器。利用实际的拉曼光谱 ,对本文所提出的估计模型参数的算法与建立的光谱识别器进行了检验。我们还讨论了利用特征波长与相应的光谱强度 ,以及利用主分量分析组成输入特征矢量 ,及其这些输入特征矢量对光谱识别器应用的效果。实验结果表明 ,所提出的算法可以有效地估计模型参数 ,其建立的光谱识别模型具有较高的识别准确率。所提出的对光谱信号识别的方法通用性强 ,因此具有较为广阔的应用前景。  相似文献   

11.
To reduce the spectral distortion,a Hidden Markov Model-based narrowband speech bandwidth extension algorithm is presented.Firstly,the parameters which have higher mutual information with wideband envelope were extracted to constitute the feature vector,and then a posterior probability was calculated via the joint probability of the partial observation feature vector sequence and the markov states.Secondly,based on the posterior probability,the wideband envelope was estimated using Bayesian parameter estimation method and minimum mean square error criteria.For estimation of wideband excitation signal,intermediate frequency extension algorithm is proposed based on the harmonic correlation between the low frequency and high frequency.The experimental results show that,compared with the traditional bandwidth extension algorithm based on Hidden Markov Model,the average spectral distortion is reduced by 0.187 dB and the number of speech frame with spectral distortion over10dB is decreased by 34.3%.  相似文献   

12.
提出了一种自适应多普勒畸变校正方法,以声源移动速度v、初始时刻麦克风与声源横向距离x两个运动学参数为优化变量,以最大化重采样信号的频域统计指标为优化目标,通过参数寻优进行v和x的估计,通过幅值还原和时域插值拟合进行畸变校正。仿真分析结果表明,频谱峭度、频谱偏度、频谱脉冲因子和频谱峰值因子4种统计指标均能准确识别运动学参数,且频谱峭度的抗噪能力最好,临界信噪比达到-3.1 dB。实验分析结果表明,列车故障轴承多普勒畸变声音信号校正后,包络谱故障频率成分及其倍频成分清晰准确,说明多普勒畸变得到有效校正。该方法可基于信号本身实现多普勒畸变信号时频结构的全面校正。  相似文献   

13.
被动遥测红外信号的精确解译,对远距离、非接触获取污染云团信息具有重要意义。然而,测量过程中的光谱畸变阻碍了这一目的的达成。针对遥测信号中的谱线畸变问题,提出了一种利用线形函数模型自适应补偿傅里叶变换红外光谱仪光谱线形函数的方法。通过对傅里叶变换光谱仪线形函数的成因分析,结合实际仪器设计参数,从理想线形函数、固有线形函数和相位误差三个方面构建线形函数模型;在此基础上,以实测畸变光谱与理论仿真光谱的均方误差作为代价函数,利用迭代优化方法实现了对实际线形函数关键参数进行估算的算法流程;将重构得到的线形函数应用于理论光谱补偿,显著减少了理论仿真光谱与实测光谱之间的差异。分析结果表明,理想线形函数主要影响谱线展宽及旁瓣幅值;固有线形函数造成向低频方向的非对称展宽;而相位误差则会造成谱峰非对称。必须在理论仿真光谱中综合考虑三种来源线形函数的贡献,才能有效建立测量光谱和待反演云团参数之间的联系。实际线形函数畸变参数的获取和补偿应用,有助于提高红外遥测信号的定量解译水平。  相似文献   

14.
闫敬文  沈贵明  胡晓毅  许芳 《光学学报》2003,23(10):1163-1167
提出了基于Karhunen Lo埁ve变换的小波谱特征矢量量化三维谱像数据压缩方法耍幔颍瑁酰睿澹?Lo埁ve变换 /小波变换 /小波谱特征矢量量化方法应用了Karhunen Lo埁ve变换的消除谱相关性优良性能 ,应用二维小波变换消除空间相关性 ,在小波变换域内应用二维集分割嵌入块编码和一维谱特征矢量量化对三维谱像数据压缩 ,获得较高的压缩性能。实验结果表明 :Karhunen Lo埁ve变换 /小波变换 /小波谱特征矢量量化编码比Karhunen Lo埁ve变换 /小波变换 /改进对块零树编码和Karhunen Lo埁ve变换 /小波变换 /快速矢量量化编码方法在同样压缩比条件下 ,峰值信噪比提高 2dB和 1dB以上 ,而速度提高了 1.5和 8倍 ,整体压缩性能有较大的提高  相似文献   

15.
戴明扬  徐柏龄 《应用声学》2001,20(6):6-12,44
本文基于人耳听觉模型提出了一种鲁棒性的话者特征参数提取方法。该种方法中,首先由Gamma tone听觉滤波器组和Meddis内耳毛细胞发放模型获得表征听觉神经活动特性的听觉相关图。由听觉神经脉冲发放的锁相特性和双声抑制特性,我们将听觉相关图每个频带中的幅值最大频率分量作为表征当前频带特性的特征参量,于是所有频带的特征参量便构成了表征当前语音段特性的特征矢量;我们采用DCT交换进一步消除各个特征参量之间的相关性,压缩特征矢量的维数。有效性试验表明,该种特征矢量基本上反映了输入语音的谱包络特性;抗噪声性能实验表明,在高斯白噪声和汽车噪声干扰下,这种特征参数比LPCC和MFCC有较小的相对失真;基于矢量量化的文本无关话者辨识表明,对于三种类型的噪声干扰该种特征参数在低信噪比下都获得了较好的识别结果。  相似文献   

16.
矢量泰勒级数特征补偿的说话人识别   总被引:2,自引:0,他引:2       下载免费PDF全文
将矢量泰勒级数(Vector Taylor Series,VTS)特征补偿算法应用于说话人识别,给出了卷积噪声方差的近似闭式解,构建了联合快速估计卷积噪声和加性噪声均值和方差的框架。该算法可在无需失配环境先验信息的前提下,直接从失配语音中估计出卷积噪声和加性噪声的均值和方差,实现对环境失配的补偿。实验结果表明,在信道变化较大的无线信道下,卷积噪声方差的补偿最高可降低误识率3.24%.提升了系统的识别性能。在存在加性噪声的无线信道下,与基于线性失真模型的特征映射算法和倒谱均值减算法相比,本文算法可分别最大降低49.65%和68.06%的误识率,适合于信道变化较大的失配环境补偿。   相似文献   

17.
The dual-microphone voice activity detection (VAD) technique is proposed by applying discriminative weight training to achieve optimal weighting of spatial features available within the dual-microphone VAD. Since the motivation behind our method is to use the relevant spatial information available from the two microphones, we employ the phase difference, coherence, and power level difference ratio (PLDR) as a feature vector, and then use this feature vector to derive the maximum a posteriori (MAP) probabilities. Then, we combine each MAP probability based on a discriminative weight training, i.e., the minimum classification error (MCE) method to offer an optimal VAD decision in a spectral domain, which successfully represents the dynamic evolution of speech over time even in the non-stationary noise environments. The proposed dual-microphone VAD algorithm outperforms conventional dual-microphone VAD methods based on only single feature among the PLDR, phase difference, and spectral coherence.  相似文献   

18.
针对高光谱图像分类,文章提出一种基于波段子集最大噪声分量特征提取的最小二乘支持向量机的高光谱图像分类算法.利用高光谱图像的谱间相关性将原始光谱波段划分为若干个波段子集,并在各个子集上采用最大噪声分量方法进行特征提取,将提取的特征合成为分类的组合特征矢量,避免了高光谱图像较强的波段相关性,减少了谱间冗余.并且采用了最小二...  相似文献   

19.
近红外光谱分析在工业过程故障检测方面具有独特的优势,是一种准确且高效的方法。结合互信息熵和传统的主成分分析,对近红外光谱特征信息进行提取,通过构建过程的模式来刻画工业过程的运行状态。利用近红外光谱数据,从有机分子含氢基团振动信息中获取工业系统的过程模式,从微观分子层面探索提高工业过程故障检测准确率的有效方法,结合贝叶斯统计学习技术,提出了基于近红外光谱数据的工业过程故障检测技术。针对近红外光谱信息量丰富,谱带较宽,特征性不强的特点,首先对工业过程不同运行状态下的近红外光谱吸光度数据进行一阶导数预处理,采用主成分分析法(principal component analysis,PCA)压缩光谱数据量,扩大不同运行状态下光谱特征信息的差异性,提取光谱的内部特征信息。然后采用互信息熵(mutual information entropy,MIE)作为光谱特征信息相关性度量函数,基于最小冗余最大相关算法进一步减少光谱特征信息间的冗余并最大化光谱特征信息与类别的相关性,弥补了PCA无监督特征波长选择的不足,提出一种基于PCA-MIE的过程模式构建方法,获得的过程模式子集更紧凑更具类别表现力。再利用贝叶斯统计学习算法,根据后验概率对构建的模式子集进行决策,判别生产过程的正常状态和故障状态。由于过程模式子集结合了PCA浓聚方差的优势和互信息熵相关性测度的特征信息选择方法,蕴含了更多的近红外光谱的本质信息与内在规律,从而更能刻画工业过程的运行状态。接着,设置测试准确率TA作为评估标准,用以评价故障检测方法的性能效果。最后利用某化工厂提供的原油脱盐脱水过程近红外光谱数据对所提方法进行验证,并与传统近红外光谱特征信息提取方法PCA和MIE方法性能进行对比分析,结果表明基于PCA-MIE的过程模式故障检测方法几乎在所有维数子集上性能都优于其他两种方法,在特征维数为18维时获得最高的准确率94. 6%,证明了方法的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号