首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 140 毫秒
1.
基音周期估计算法研究   总被引:1,自引:2,他引:1  
为了实现甚低码率下的透明质量语音编码,提出了一种基音周期估计算法。针对语句后部的变调和基音频率的衰减,采用改进的自相关函数计算方法增强快变基音周期的跟踪。基于改进的自相关函数,采用相邻基音周期平滑变化等决策准则确定基音周期估计参考轨迹。算法增强了在鼻化元音的颤音等情况下不规则基音周期的估计。非正式的测试表明这种算法改进了基音周期的估计值,能够极大地降低由于不准确的基音周期估计而引入的听觉失真。  相似文献   

2.
马英  于向飞 《应用声学》2010,29(5):387-390
在语音信号分析中,对于基音周期的提取目前已有较多的分析和处理方法,在现有的短时平均幅度差函数(AMDF)的处理方法中,只需要加、减和取绝对值运算,运算量较之短时自相关函数大大下降。同时,AMDF函数的谷点提取基音周期比自相关函数的峰值更加尖锐,错判率相对较少,稳健性更高。然而,传统的AMDF算法对窗长的要求较为严格,窗长较短就会有较大的误差。本文针对该缺陷做出的改进算法,使之无论窗长多大均会有较为准确的结果,大大拓展了AMDF算法的适用空间。进一步,将其与同态处理结合,会有更好的效果。  相似文献   

3.
赵毅  尹雪飞  陈克安 《应用声学》2010,29(6):416-424
共振峰频率是语音信号的一个重要参数。传统的基于线性预测的共振峰检测算法由于受到计算量的限制,很难实现实时处理。本文提出一种基于倒谱变换的共振峰频率检测算法,采用后置处理,比较声道冲击响应对数幅频特性的二次导数和相频特性一次导数检测出的结果,删除伪峰数值和甄别合并共振峰,提高检测精度。仿真结果证明,该算法计算效率高,低信噪比下仍能保持较好的检测性能。  相似文献   

4.
薛帅强  陈波  陈菲 《应用声学》2016,24(4):253-256
在对语音信号静音、清音、浊音划分的基础上,针对语音信号周期特征明显段分布随机性问题,提出改进的变长度平均幅度差函数LVAMDF及综合多因素基音检测算法,该算法对语音信号进行周期特征明显段和周期特征不明显段的聚类划分,同时,获取周期特征明显语音段的基音周期,针对少数基音周期划分倍频或半频问题,提出识别、修正方法,其识别、修正率极高。在对大量真实语音处理中,能够精确的检测出语音特征明显段的基音周期端点,基本没有倍频和半频划分,并且和AMDF、ACF算法作了对比。  相似文献   

5.
均方误差函数是深度学习单通道语声增强算法最常用的一种代价函数。然而,均方误差值的大小与语声质量好坏并非完全相关。为了提高算法性能,该文在深度神经网络训练中引入了两类与人耳听觉相关的代价函数。第一类是加权欧氏距离代价函数,考虑了人耳听觉掩蔽效应;第二类是Itakura-Satio代价函数、COSH代价函数和加权似然比代价函数,强调语声谱峰的重要性,侧重于恢复干净语声谱峰信息。基于长短期记忆网络结构分析比较了两类代价函数在深度学习单通道语声增强算法中的性能,并与均方误差代价函数进行对比。实验结果表明,基于加权欧式距离代价函数的深度神经网络单通道语声增强算法能够获得更好的语声质量和更低的噪声残留。  相似文献   

6.
为了给双耳听力设备佩戴者带来更好的语音可懂度,提出了一种利用双耳时间差与声级差的近场语音增强算法,该方法首先利用这两种差异来估计语音的功率谱和语音的相干函数,然后计算干扰噪声在左右耳间的头相关传输函数的比值,最后构造两个维纳滤波器。客观评价的参数显示该算法去噪效果优于对比算法而目标语音的时间差误差和声级差误差低于对比算法。主观的言语接受阈测试表明该方法能有效提高语音可懂度。结果表明,该算法在能够有效去除干扰噪声的同时,保留了目标语音的空间信息。   相似文献   

7.
胡新奇  俞信  赵达尊 《光学学报》2007,27(8):1414-1418
以空间频谱描述图像结构,以图像灰度起伏的方均根值与噪声方均根值之比表示信噪比,系统分析了目标图像结构和噪声对相关哈特曼-夏克波前传感精度的影响。理论分析表明,两个子图像的相关函数峰值位置的亚像元插值误差等于其各离散频率成分的相关函数峰值位置插值误差的加权平均;相同功率下,低频成分的加权系数较小,高频成分的加权系数与亚像元偏移量有关。一维窄带图像的统计仿真表明,无噪声时,低频成分和接近奈奎斯特频率成分的误差较大,中频成分的误差较小;有噪声时,噪声对高频成分的影响低于低频成分。对典型频谱的32×32图像仿真表明,图像起伏信噪比为2∶1时,子图像平移量计算误差约0.03~0.11像元,与无噪声时相比增加不大。  相似文献   

8.
本文介绍关于语波的线性预测原理,重点介绍自相关线性预测法和选择线性预测法。给出了应用线性预测分析进行语音识别时的基本参数及其计算公式。在共振峰分析和音调提取分析-合成系统方面的引用也扼要地提及。对极-零模型也给予关注,并指出这是今后的发展方向。  相似文献   

9.
 通过多尺度变换实现了反演范围的自适应调整,使其更接近真实范围。分别采用反演范围固定算法与自适应算法对200~600 nm单峰和200~900 nm双峰分布颗粒的模拟相关函数进行了反演,结果表明:自适应算法的结果更接近理论分布,抗干扰能力更强。相对于固定算法,单峰分布颗粒最多可缩小峰值误差4.73%,缩小峰宽误差185 nm。双峰分布颗粒在0~0.001噪声水平时,峰值误差分别小于11.33%,12.45%,峰宽误差分别小于35,160 nm,而固定算法在噪声水平大于0.000 1时,难以得到合理的反演结果。反演范围自适应调整方法能够有效优化粒径反演结果。  相似文献   

10.
本文介绍一种预分浊音型的LPC基音提取算法,对语言信号先用线性预测系数a_0和a_1的差值分出浊音区,然后只对浊音部分进行基音提取。提取基频时,数据率减半,用LPC的自相关方法产生8个预测系数的倒滤波器,倒滤波后的误差信号,用平均幅差函数(AMDF)方法提取基频,再线性插值,最后用非线性平滑滤波,并将所得结果和一个半自动的精确算法,以及简化倒滤波(SIFT)算法进行比较,说明我们提出的算法,对背景噪声40dB以下的连续语言是准确有效的。它避免了清音和无声间隙区的音调计算,且浊音和清音的判别比较准确。  相似文献   

11.
Pitch detection is an important part of speech recognition and speech processing. In this paper, a pitch detection algorithm based on second generation wavelet transform was developed. The proposed algorithm reduces the computational load of those algorithms that were based on classical wavelet transform. The proposed pitch detection algorithm was tested for both real speech and synthetic speech signal. Some experiments were carried out under noisy environment condition to evaluate the accuracy and robustness of the proposed algorithm. Results showed that the proposed algorithm was robust to noise and provided accurate estimates of the pitch period for both low-pitched and high-pitched speakers. Moreover, different wavelet filters that were obtained using second generation wavelet transform were considered to see the effects of them on the proposed algorithm. It was noticed that Haar filter showed good performance as compared to the other wavelet filters.  相似文献   

12.
王辉  张玲华 《声学学报》2012,37(5):534-538
自适应波束形成算法是数字助听器的核心算法之一。针对自适应波束形成算法中不可避免存在的语音泄漏,本文先对传统GSC结构自适应波束形成算法进行理论研究,并提出一种汉语处理技术,补偿泄漏的语音。这种汉语处理技术利用汉语语音特有的基音频率信息,调整语音幅度谱包络,提高谱包络与基频曲线形状的相似度以提高语音的可懂度。针对泄漏的语音在高频清辅音段有较大损失的特点,在频域上对清辅音进行放大,在不改变共振峰结构的情况下,提高清辅音的能量,同时降低语音间隔段GSC算法泄漏的噪声能量,提高对语音的辨别。仿真实验结果表明,这种汉语语音处理能够补偿自适应波束形成算法造成的语音泄漏,提高语音的可懂度。   相似文献   

13.
In this paper, a fundamental frequency (F(0)) tracking algorithm is presented that is extremely robust for both high quality and telephone speech, at signal to noise ratios ranging from clean speech to very noisy speech. The algorithm is named "YAAPT," for "yet another algorithm for pitch tracking." The algorithm is based on a combination of time domain processing, using the normalized cross correlation, and frequency domain processing. Major steps include processing of the original acoustic signal and a nonlinearly processed version of the signal, the use of a new method for computing a modified autocorrelation function that incorporates information from multiple spectral harmonic peaks, peak picking to select multiple F(0) candidates and associated figures of merit, and extensive use of dynamic programming to find the "best" track among the multiple F(0) candidates. The algorithm was evaluated by using three databases and compared to three other published F(0) tracking algorithms by using both high quality and telephone speech for various noise conditions. For clean speech, the error rates obtained are comparable to those obtained with the best results reported for any other algorithm; for noisy telephone speech, the error rates obtained are lower than those obtained with other methods.  相似文献   

14.
郭业才  胡苓苓  丁锐 《物理学报》2012,61(5):54304-054304
针对常数模盲均衡算法(CMA)均衡高阶正交振幅调制信号(QAM)存在收敛速度慢、稳态误差大的缺点, 提出了基于量子粒子群优化的正交小波加权多模盲均衡算法(QPSO-WTWMMA). 该算法根据高阶QAM信号星座图分布特点, 将量子粒子群优化算法(QPSO) 和正交小波变换融入于加权多模盲均衡算法(WMMA)中. 因而, 利用QPSO对均衡器权向量进行了优化, 利用正交小波变换降低了输入信号的自相关性, 利用WMMA选择了合适的误差模型匹配QAM星座图. 理论分析及水声信道仿真结果表明, QPSO-WTWMMA算法可以获得更快的收敛速度和更低的稳态误差, 在水声通信中具有重要的参考价值.  相似文献   

15.
We used linear prediction analysis to estimate a diver's vocal tract response for isolated vowels spoken in air at 1 atm and in heliox at simulated depths of 54-, 120-, 300-, and 500-m seawater. We specifically measured formant frequency, bandwidth, and Q changes as a function of environment. The formant frequencies shifted upward nonlinearly in helium speech. The formant bandwidths in helium speech increased as much as 14 times their corresponding bandwidths in normal speech. The ratios of formant Qs (helium speech to normal speech) ranges from 0.3 (low formants) to 2 (high formants).  相似文献   

16.
空间外差光谱仪是一种新式的超高分辨率光谱仪,可用于大气监测、卫星遥感等领域。为了减少空间外差光谱信号中的噪声,提出基于提升小波变换结合中值滤波方法来实现信号的降噪。改进的提升小波变换融合了一种双因子的阈值函数、分层阈值选取。与小波变换的软、硬阈值对比发现,它能提取空间外差光谱,减小峰宽和保留重要的细节特征,降噪效果优于小波变换的软、硬阈值法。最后用信噪比和均方误差两项定量指标来衡量算法的效果。实验结果表明:该算法比软阈值法在处理氙灯和积分球时信噪比提高了24.6%和31%,均方误差减少了43.2%和51.5%;与硬阈值法相比信噪比提高了21.5%和30.6%,均方误差减少了40.2%和51.2%。因此,算法在空间外差光谱降噪方面具有可行性。  相似文献   

17.
This paper presents a reliable speaker-independent method of recog-nizing Chinese tones.An unbiased center-clipping autocorrelation algorithm ofpitch period extraction is proposed.A two-dimensional decision vector is usedfor recognizing Chinese tones by passing the pitch period sequence through theprocedures of data selection,error correction,data smoothing and curve fitting.The average correct rate of tone recognition for isolated Chinese syllables isover 98%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号