首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 437 毫秒
1.
基于听觉模型的耳语音的声韵切分   总被引:5,自引:0,他引:5       下载免费PDF全文
丁慧  栗学丽  徐柏龄 《应用声学》2004,23(2):20-25,44
本文分析了耳语音的特点,并根据生理声学及心理声学的基本理论与实验资料,提出了一种利用听觉模型来进行耳语音声韵切分的方法。这种适用于耳语音声韵切分的听觉感知模型主要分为四个层次:耳蜗对声音频率的分解机理;听觉系统的时域和频域非线性变化;中枢神经系统的侧抑制机理。这种模型能反映在噪声环境下人对低能量语音的听觉感知特性,因而适于耳语音识别,在耳语音声韵母切分实验中得到了满意的结果。  相似文献   

2.
在充分考虑人耳听觉特性和噪声统计特性的基础上,提出一种时频结合Bark尺度自适应阈值的语音消噪算法,在Bark频域上自适应调整增强系数可以较准确地进行阈值判定。仿真实验验证,时频结合算法在低信噪比输入情况下较传统语音降噪方法具有明显优势,其在消除高斯白噪声的同时有效降低了语音损失,可获得最大信噪比,谱失真测度最小,增强语音的MOS(Mean Opinion Score)评分明显提高,具有较好的听觉效果。  相似文献   

3.
针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。  相似文献   

4.
李轶南  张雄伟  贾冲  陈亮  曾理 《声学学报》2015,40(4):607-614
针对现有基于字典学习的增强算法需要先验信息、不易实时处理的问题,提出一种便于实时处理的无监督的单通道语音增强算法。首先,该算法将无监督条件下背景噪声的建模问题转化为带噪语音幅度谱的稀疏低秩噪声分解;然后,采用增量非负子空间方法对背景噪声进行在线字典学习,获得能够体现背景噪声时变特性的自适应噪声字典;最后,利用所得的噪声字典,采用易于实时处理的逐帧迭代方式,对带噪语音进行处理。实验结果表明:相较于多带谱减法和基于低秩稀疏矩阵分解的增强算法,所提算法在噪声抑制方面的性能尤为显著,在多项性能评价指标上,均表现出更好的结果。   相似文献   

5.
基于听觉掩蔽效应和Bark子波变换的语音增强   总被引:22,自引:3,他引:19  
陶智  赵鹤鸣  龚呈卉 《声学学报》2005,30(4):367-372
提出了一种适用于低信噪比下的提高语音的听觉效果的语音增强方法。该方法在谱减法的基础上有两个特点:首先减参数是根据人耳听觉掩蔽效应提出的且是自适应的;其次采用了与人耳听觉系统特性更为适应的Bark子波变换方法对增强前后的语音进行分析。对该算法进行了客观和主观测试,结果表明:与谱减法相比对低信噪比的语音信号,(1)能更好地抑制残留噪声和背景噪声,(2)增强后的语音具有更好的清晰度和可懂度。  相似文献   

6.
针对语音无线通信中带宽资源受限的问题,提出基于压缩采样的低速率语音编码算法。以基尼系数为指标,比较不同稀疏变换域下语音信号的稀疏性,分析常见重构算法对语音信号压缩采样观测信号的重构特性。对标准耳蜗滤波器——伽马啁啾滤波器组的参数进行研究,并以梯度投影稀疏重建(GPSR)算法重构语音信号。利用语音质量感知评估(PESQ)、信噪比和主观听觉测试,对编解码后的合成语音信号进行了质量评估。实验表明,基于压缩感知的语音编码器以4 kbps的低速率对语音进行编码时,PESQ得分可达到3.16,计算复杂度相对较低,可以用于实际的语音编码环境。  相似文献   

7.
针对低信噪比说话人识别中缺失数据特征方法鲁棒性下降的问题,提出了一种采用感知听觉场景分析的缺失数据特征提取方法。首先求取语音的缺失数据特征谱,并由语音的感知特性求出感知特性的语音含量。含噪语音经过感知特性的语音增强和对其语谱的二维增强后求解出语音的分布,联合感知特性语音含量和缺失强度参数提取出感知听觉因子。再结合缺失数据特征谱把特征的提取过程分解为不同听觉场景进行区分地分析和处理,以增强说话人识别系统的鲁棒性能。实验结果表明,在-10 dB到10 dB的低信噪比环境下,对于4种不同的噪声,提出的方法比5种对比方法的鲁棒性均有提高,平均识别率分别提高26.0%,19.6%,12.7%,4.6%和6.5%。论文提出的方法,是一种在时-频域中寻找语音鲁棒特征的方法,更适合于低信噪比环境下的说话人识别。   相似文献   

8.
一种强噪声背景下微弱超声信号提取方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
王大为  王召巴 《物理学报》2018,67(21):210501-210501
为解决在强噪声背景下获取超声信号的难题,基于粒子群优化算法和稀疏分解理论提出一种强噪声背景下微弱超声信号提取方法.该方法将降噪问题转换为在无穷大参数集上对函数进行优化的问题,首先以稀疏分解理论和超声信号的结构特点为依据构建了粒子群优化算法运行所需要的目标函数及去噪后信号的重构函数,从而将粒子群优化算法和超声信号降噪联系在一起;然后根据粒子群优化算法可以在连续参数空间寻优的特点建立了用于匹配超声信号的连续超完备字典,并采用改进的自适应粒子群优化算法在该字典中对目标函数进行优化;最后根据对目标函数在字典上的优化结果确定最优原子,并利用最优原子按照重构函数重构出降噪后的超声信号.通过对仿真超声信号和实测超声信号的处理,结果表明本文提出的方法可以有效提取信噪比低至-4 dB的强噪声背景下的微弱超声信号,且和基于自适应阈值的小波方法相比本文方法表现出更好的降噪性能.  相似文献   

9.
由于传统谱减语音增强存在残留的"音乐噪声",因此基于传统谱减法降噪的电子耳蜗(CI)感知的声音品质也会受到影响.为提高CI的抗噪性,本文提出了一种自适应变阶谱减算法,并将该方法应用于电子耳蜗的语音增强中.根据CI电极对应的频带关系,该算法先对采集的带噪声音信号功率谱进行Bark子带划分,并在每个Bark子带中根据信噪比的变化进行谱减阶数和系数的自适应调节,使各子带噪声更均衡地去除,基本消除了传统方法存在的"音乐噪声".基于该算法的电子耳蜗ACE仿真实验及测听结果表明,与传统谱减法相比,改进的算法能更好地抑制背景噪声和残留噪声,仿真得到的CI合成音感知更好和更清晰.  相似文献   

10.
基于掩蔽特性的噪声环境下语音识别新特征   总被引:4,自引:1,他引:3  
语音识别系统的识别率在噪声环境中下降很大。本文根据人耳的听觉特性,提出一种基于人耳听觉掩蔽特性的抗噪声特征提取方法。该方法先求取噪声语音的掩蔽特性,在此基础上再计算Mel倒谱系数用于语音识别。通过对TIMIT数据包的 0~9十个英语数字在 NoiseX92的各种噪声下进行了识别试验。其中在信噪比 0dB条件下,在 3种噪声条件下识别率平均提高 152%,实验表明新方法对于各种噪声环境下的识别率有显著提高。  相似文献   

11.
王玥  李平  崔杰 《声学学报》2013,38(4):501-508
为了在噪声抑制和语音失真中之间寻找最佳平衡,提出了一种听觉频域掩蔽效应的自适应β阶贝叶斯感知估计语音增强算法,以期提高语音增强的综合性能。算法利用了人耳的听觉掩蔽效应,根据计算得到的频域掩蔽阈自适应调整β阶贝叶斯感知估计语音增强算法中的β值,从而仅将噪声抑制在掩蔽阈之下,保留较多的语音信息,降低语音失真。并分别用客观和主观评价方式,对所提出的算法的性能进行了评估,并与原来基于信噪比的自适应β阶贝叶斯感知估计语音增强算法进行了比较。结果表明,频域掩蔽的β阶贝叶斯感知估计方法的综合客观评价结果在信噪比为-10 dB至5 dB之间时均高于基于信噪比的自适应β阶贝叶斯感知估计语音增强算法。主观评价结果也表明频域掩蔽的β阶贝叶斯感知估计方法能在尽量保留语音信息的同时,较好的抑制背景噪声。   相似文献   

12.
联合深度神经网络和凸优化的单通道语音增强算法   总被引:1,自引:1,他引:0       下载免费PDF全文
噪声估计的准确性直接影响语音增强算法的好坏,为提升当前语音增强算法的噪声抑制效果,有效求解无约束优化问题,提出一种联合深度神经网络(DNN)和凸优化的时频掩蔽优化算法进行单通道语音增强.首先,提取带噪语音的能量谱作为DNN的输入特征;接着,将噪声与带噪语音的频带内互相关系数(ICC Factor)作为DNN的训练目标;...  相似文献   

13.
针对激光雷达回波信号所含噪声的特点, 对比分析了传统去噪算法的优缺点, 重点就小波自适应阈值去噪方法和独立成分分析去噪方法进行了系统研究。为了验证这两种方法在激光云高测量信号去噪上的有效性和优劣性, 对包含高斯白噪声的模拟仿真信号进行了消噪, 并对半导体激光云高仪实际探测得到的大气回波信号进行了消噪处理, 最后对去噪结果进行了对比分析。仿真结果和实验结果表明, 这两种消噪方法均能够有效降低激光雷达回波信号中所含噪声, 并且独立成分分析消噪效果明显优于小波自适应阈值方法。  相似文献   

14.
非下采样小波变换红外光谱数据去噪   总被引:3,自引:2,他引:1       下载免费PDF全文
为了降低噪声对实测红外光谱信号的影响,引入了一种非下采样小波变换的红外光谱数据去噪方法。采用非下采样小波变换对原始光谱信号进行多尺度分解,提取信号的多尺度细节特征;根据光谱信号和噪声在不同尺度上的差异,通过应用变分偏微分方程方法调整分解后的各子带系数;重构各子带就可以将原始光谱信号中真实信号和噪声分离,从而达到剔除噪声的目的。通过两组实验对比传统小波和该方法针对红外光谱数据的消噪效果,实验结果表明:非下采样小波变换在红外光谱数据去噪方面具有明显的优势,不仅能够有效地去除噪声,很好地保持信号的形状,并且均方误差较小;在实际的红外光谱数据处理中能够获得较好的去噪效果。  相似文献   

15.
基于Gabor变换的TDLAS检测信号的降噪研究   总被引:1,自引:0,他引:1  
可调谐二极管激光吸收光谱(TDLAS)技术结合波长调制光谱(WMS)技术是用于痕量气体检测的重要技术手段。通过锁相放大器进行谐波检测,对解调得到的二次谐波信号进行分析可获得气体吸收的信息。但由于二次谐波信号受到噪声的影响,降低了检测系统的精度和稳定性。为了提高TDLAS检测系统的信噪比(SNR),提出了一种基于Gabor变换对二次谐波信号进行数字滤波降噪的方法。以CH4在1 653.72 nm处的吸收光谱为例,通过仿真和实验对该降噪方法的有效性进行了验证。仿真结果表明,通过Gabor变换对信噪比为0dB的二次谐波信号进行处理后,系统的信噪比可提高15.73 dB。实验结果表明,基于Gabor变换进行降噪处理后,CH4浓度在0.001%~0.02%区间内与二次谐波峰值的线性相关系数r达到了0.996 59,且系统的检测精度和稳定性明显提高。  相似文献   

16.
A significant and often unavoidable problem in bioacoustic signal processing is the presence of background noise due to an adverse recording environment. This paper proposes a new bioacoustic signal enhancement technique which can be used on a wide range of species. The technique is based on a perceptually scaled wavelet packet decomposition using a species-specific Greenwood scale function. Spectral estimation techniques, similar to those used for human speech enhancement, are used for estimation of clean signal wavelet coefficients under an additive noise model. The new approach is compared to several other techniques, including basic bandpass filtering as well as classical speech enhancement methods such as spectral subtraction, Wiener filtering, and Ephraim-Malah filtering. Vocalizations recorded from several species are used for evaluation, including the ortolan bunting (Emberiza hortulana), rhesus monkey (Macaca mulatta), and humpback whale (Megaptera novaeanglia), with both additive white Gaussian noise and environment recording noise added across a range of signal-to-noise ratios (SNRs). Results, measured by both SNR and segmental SNR of the enhanced wave forms, indicate that the proposed method outperforms other approaches for a wide range of noise conditions.  相似文献   

17.
针对目前有监督语音增强忽略了纯净语音、噪声与带噪语音之间的幅度谱相似性对增强效果影响等问题,提出了一种联合精确比值掩蔽(ARM)与深度神经网络(DNN)的语音增强方法。该方法利用纯净语音与带噪语音、噪声与带噪语音的幅度谱归一化互相关系数,设计了一种基于时频域理想比值掩蔽的精确比值掩蔽作为目标掩蔽;然后以纯净语音和噪声幅度谱为训练目标的DNN为基线,通过该DNN的输出来估计目标掩蔽,并对基线DNN和目标掩蔽进行联合优化,增强语音由目标掩蔽从带噪语音中估计得到;此外,考虑到纯净语音与噪声的区分性信息,采用一种区分性训练函数代替均方误差(MSE)函数作为基线DNN的目标函数,以使网络输出更加准确。实验表明,区分性训练函数提升了基线DNN以及整个联合优化网络的增强效果;在匹配噪声和不匹配噪声下,相比于其它常见DNN方法,本文方法取得了更高的平均客观语音质量评估(PESQ)和短时客观可懂度(STOI),增强后的语音保留了更多语音成分,同时对噪声的抑制效果更加明显。   相似文献   

18.
在光谱数据的定量分析中,噪声的存在常常会影响结果的准确性。为提高红外光谱分析精度,需要对光谱数据进行去噪处理。将一种光滑阈值函数和一种分层阈值选取方法应用到提升小波域光谱信号的去噪处理中,并对提升小波重构信号进行中值滤波。对某小麦品种的实测光谱信号,添加信噪比为21.17 dB的噪声后采用该方法进行去噪处理,并利用信噪比(SNR)、均方根误差(RMSE)、峰值平均相对误差(AREPV)以及峰位平均误差(AEPP)四项指标对去噪效果进行评价。结果表明,与软阈值法与硬阈值法相比,该方法能更有效地去除光谱信号中的噪声,保留光谱中的有用信息,提高光谱信噪比,降低均方根误差、峰值平均相对误差以及峰位平均误差,提高光谱的分析能力。  相似文献   

19.
A novel denoising method based on Radon transform and filtered back-projection (FBP) image reconstruction algorithm was proposed. This method can be considered as a special mean filter on projection line, which is different from most of the traditional filters operated on adjacent templates that could bring serious blurs to images. The details of images processed by the proposed method can be preserved relatively complete and the denoising effect is satisfactory. To verify the denoising effect of the proposed method, the simulation was designed and carried out, and the image evaluation parameters were applied to analyze the denoising effect and the detail-preserving ability quantitatively. For further understanding of the proposed method, the basic denoising principle of this method was analyzed. Noise points and information points can be distinguished: the attenuation velocity of gray scale of noise points is faster than that of information points, which was verified by the experiment. The results of different parameters in the proposed method were compared and analyzed. Several kinds of traditional filters were compared with the proposed method, and the result shows that the proposed method is better than the traditional filters in the aspects of both denoising effect and detail-preserving ability. Apart from this, the proposed method is not particular about the kind of noise; therefore, it is a powerful method to deal with atypical noise, uncertain noise, and mixed noises.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号