共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
为了克服低信噪比输入下,语音增强造成语音清音中的弱分量损失,造成重构信号包络失真的问题。论文提出了一种新的语音增强方法。该方法根据语音感知模型,采用不完全小波包分解拟合语音临界频带,并对语音按子带能量进行清浊音区分处理,在阈值计算上,提出了一种清浊音分离,基于子带信号能量的小波包自适应阈值算法。通过仿真实验,客观评测和听音测试表明,该算法在低信噪比输入时较传统算法,能够更加有效地减少重构信号包络失真,在不损伤语音清晰度和自然度的前提下,使输出信噪比明显提高。将该算法与能量谱减法结合,进行二次增强能进一步提高降噪输出的语音质量。 相似文献
5.
结点阈值小波包变换图像去噪新算法 总被引:2,自引:0,他引:2
小波包变换是小波变换的推广,可视为普通小波函数的线性组合,具有灵活的时频分析能力,随着分解层数的增加,小波包分解能够在所有的频率范围聚焦。提出一种应用结点阈值小波包变换的新型图像去噪算法。利用小波包变换对含噪图像进行分解,在图像信号的子带层次上进行结点阈值操作,采用软阈值的方法进行阈值处理,结点噪声采用谱熵法估计,并使用峰值信噪比评估去噪后的图像质量。实验结果表明,相比于使用其它阈值方法的小波包图像去噪算法,该算法具有更好的图像去噪性能。 相似文献
6.
7.
8.
9.
基于小波变换和矢量量化的语音压缩编码方案 总被引:3,自引:1,他引:2
对于一种新的语音压缩编码方法——基于小波变换和矢量量化的语音压缩编码方案进行了开发和研究。该方法先对语音进行小波变换和小波包变换,然后使用矢量量化来压缩数据.我们还研究了使用摘编码方法进一步降低比特率的算法,实验结果表明对于采样频率为8kHz,每样本量化为8bit的64kbit/s语音信号压缩到6kbit/s~8kbit/s时,具有良好的语音质量.同时该算法还具有低延迟的优点,其算法延迟只有8ms。 相似文献
10.
提出了一种基于极大似然的噪声对数功率谱估计方法,采用高斯混合模型对每一个频带上的功率谱包络构建统计模型,将时序包络划分为语音和非语音类,它们分别对应于高斯混合模型的两个高斯分量,描述语音和非语音的统计分布,其中非语音高斯分量的均值即为噪声功率谱的最优估计.采用序贯学习的方法,在极大似然准则下逐帧更新模型参数,并逐帧给出噪声功率谱的最优估计值。此外,由于序贯更新过程中语音信号长时缺失,容易导致模型失稳,提出了一种在线的最小描述长度准则(MDL)来判断语音信号是否长时缺失,从而保证了模型的稳定性.实验表明,算法性能整体优于经典的MS和IMCRA算法。 相似文献
11.
针对红外与可见光图像特点,提出一种基于小波包变换的融合算法。该算法先对源图像进行小波包分解,得到低频分量和各带通方向子带分量,并对不同分量采用不同的融合规则进行融合处理,得到各融合系数,然后经小波包重构获得融合图像。该方法可提取源图像细节信息,取得较好的融合效果。 相似文献
12.
13.
基于混合映射模型的语音转换算法研究 总被引:3,自引:0,他引:3
分析了语音转换研究中使用高斯混合模型映射算法时转换特征出现过平滑的问题,认为协方差矩阵估计不准确导致的转换特征细节信息的丢失是产生过平滑问题的主要原因,提出了使用码本映射和高斯混合模型共同转换声学特征细节的混合映射算法。此外提出了利用音素信息进行快速高斯混合模型训练的训练方法。客观评价表明使用音素信息的训练方法比常规方法性能指标平均提高了12.87%,而混合映射算法在使用音素信息的训练方法基础上比传统高斯混合模型转换算法性能指标提高了27.13% 相似文献
14.
15.
分数阶Fourier变换在处理非平稳信号尤其是chirp信号方面有着独特的优势,而人耳听觉系统具有自动语音识别系统难以比拟的优良性能。本文采用Gammatone听觉滤波器组对语音信号进行前端时域滤波,然后对输出的各个子带信号用分数阶Fourer变换方法提取声学特征。分数阶Fourier变换的阶数对其性能有着重要影响,本文针对子带时域信号提出了采用瞬时频率曲线拟合求取阶数的方法,并将其与采用模糊函数的方法作了比较。在干净与含噪汉语孤立数字库上的语音识别结果表明,采用新提出的声学特征得到的识别正确率相对MFCC基线系统有了显著提高;根据瞬时频率曲线搜索阶数的算法与模糊函数方法相比,计算量大大减少,并且根据该方法提取的声学特征得到了最高的平均识别正确率。 相似文献
16.
听觉计算模型在鲁棒性语音识别中的应用 总被引:3,自引:1,他引:2
利用听觉感知机理,建立一个基于听觉感知机理的语音信号特征提取模型。本文由两部分组成,一部分是在传统听觉计算模型基础上提出听觉倒谱特征AFCC(AnditoryFrequencyCepstralCoefficient)的提取方法,这样既压缩了特征维数,减小计算量,又使各个特征维之间相互独立,满足HMM模型的要求。并且根据听觉神经中枢的长时整合特性,文中提出了用低通滤波模型来模拟这种功能。结合该低通模型,提取的语音信号的听觉倒谱特征在HMM框架下取得较好的鲁律性。另一部分在研究听觉侧抑制机理的基础上,提出一个简单有效的听觉侧抑制处理模型。美尔倒谱特征MFCC谱特征经过该侧抑制模型处理,得到侧抑制美倒谱特征MFCCI,实验表明,该新特征MFCCI鲁棒性能比MFCC有大大提高。听觉倒谱特征AFCC经过该侧抑制处理得到侧抑制听觉倒谱特征AFCCI,实验表明,该新特征AFCCI鲁律性能比AFCC有大大提高。 相似文献
17.
18.
《光子学报》2015,(12)
针对相干光正交频分复用系统中出现的高峰值平均功率比问题,提出用小波包变换取代传统快速傅里叶变换的相干光正交频分复用系统.仿真实验证明了具有良好正交性的小波包变换对高峰值平均功率比起到一定程度上的抑制作用,且误码率性能优于传统的快速傅里叶变换.随着小波尺度函数及小波函数对称性的提升,其避免信号处理过程中的相移的能力提高,系统性能有所改善.与传统的快速傅里叶变换系统相比,基于小波包变换的系统中,小波基函数haar小波的互补累计分布函数为0.01时,门限值降低约2dB,且在误码率为10-3的情况下,性能优化1.5dB.在此基础上,将小波提升算法应用到相干光正交频分复用系统中,得到的抑制峰均比及误码率性能与应用Mallat算法时一致,但算法的结构复杂度降低. 相似文献
19.
由于可见光成像系统的聚焦范围有限,因而在成像过程中,除聚焦良好的物体能生成清晰的图像外,该物体前后一定距离外的所有物体都将呈现不同程度的模糊.为了获得场景内所有物体均清晰的图像,在分析了多聚焦图像成像机理的基础上,提出了一种基于小波包变换的融合方法.它是将成像系统先聚焦在一部分对象上,得到其清晰的图像;然后再将其聚焦在另一部分对象上,得到另一清晰的图像;最后把这两幅实验图像加以融合,从而获得场景内所有物体均清晰的图像.实验结果表明,基于小波包变换的融合方法能够将信号的频带进行多层次划分,对高频成分也能进一步地分解,可有效综合多聚焦图像. 相似文献