首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
马英  于向飞 《应用声学》2010,29(5):387-390
在语音信号分析中,对于基音周期的提取目前已有较多的分析和处理方法,在现有的短时平均幅度差函数(AMDF)的处理方法中,只需要加、减和取绝对值运算,运算量较之短时自相关函数大大下降。同时,AMDF函数的谷点提取基音周期比自相关函数的峰值更加尖锐,错判率相对较少,稳健性更高。然而,传统的AMDF算法对窗长的要求较为严格,窗长较短就会有较大的误差。本文针对该缺陷做出的改进算法,使之无论窗长多大均会有较为准确的结果,大大拓展了AMDF算法的适用空间。进一步,将其与同态处理结合,会有更好的效果。  相似文献   

2.
本文给出一种以时域检测获取基音候选,以动态规划提取全局优化的基音轮廓,以多级逼近截取有效调型段的基音检测器,并利用基音特征参数进行声调识别的方法。 本系统可以在不作话者训练条件下,简单、快速、准确地进行基音检测和声调识别。系统对男、女话者各1252个不同单音节的实验结果表明,声调正识率分别为98.9%和99.4%。  相似文献   

3.
提升小波加权自相关函数的基音检测算法*   总被引:1,自引:0,他引:1       下载免费PDF全文
王晨  章小兵  刘美娟 《应用声学》2018,37(2):201-207
随着计算机技术的发展,语音信号处理作为人机交互的重要渠道,其在复杂噪声环境下的特征值检测算法直接关系到计算机的运算效率。基音周期是语音特征值提取的重要参数之一。针对传统基音检测算法在噪声环境下检测精度低的问题,提出了一种基于自适应提升小波变换加权线性预测误差自相关函数的基音检测算法。该方法用多级提升小波近似系数加权求和的方法来弥补自相关函数随着时间延迟量的增加幅值衰减的缺陷;用线性预测误差自相关函数的方法来抑制共振峰的干扰,然后将两种方法结合来突出基音周期处的峰值。实验结果表明,与传统的自相关函数法和小波加权法相比,该方法能有效减弱共振峰的影响,突出基音周期处的峰值,提高基音周期检测精度,鲁棒性更好。  相似文献   

4.
改进庞加莱截面基音检测方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
李正友  李天伟  黄谦  郭姣 《应用声学》2012,31(5):379-386
评述了Kubin等人提出的基于庞加莱截面的基音检测方法,指出其存在周期点筛选难、初始点选择方法不完善、要求时域波形具有明显的周期性等问题,导致其实用性不强。在此基础上,提出了变邻域和变初始点的改进算法,并与归一化互相关方法相结合,解决了上述问题。实验结果表明,改进后的基于庞加莱截面的基音检测方法具有时间分辨率高、误判率低、实用性强等优点。  相似文献   

5.
基音周期估计算法研究   总被引:3,自引:2,他引:1  
高戈  李明  胡瑞敏 《声学学报》2003,28(6):540-544
为了实现甚低码率下的透明质量语音编码,提出了一种基音周期估计算法。针对语句后部的变调和基音频率的衰减,采用改进的自相关函数计算方法增强快变基音周期的跟踪。基于改进的自相关函数,采用相邻基音周期平滑变化等决策准则确定基音周期估计参考轨迹。算法增强了在鼻化元音的颤音等情况下不规则基音周期的估计。非正式的测试表明这种算法改进了基音周期的估计值,能够极大地降低由于不准确的基音周期估计而引入的听觉失真。  相似文献   

6.
通过运用mat1ab软件编程对语音信号进行了基音提取,并以MFCC、基于基音周期和MFCC的特征组合参数作为特征参数,建立了基于GMM模型的说话人识别系统。并通过识别实验得出的实验结果,发现使用基于基音周期和MFCC的特征组合参数作为特征参数,在人数为50-180人范围内,能够有效提高基于GMM说话人识别系统识别率。  相似文献   

7.
薛帅强  陈波  陈菲 《应用声学》2016,24(4):253-256
在对语音信号静音、清音、浊音划分的基础上,针对语音信号周期特征明显段分布随机性问题,提出改进的变长度平均幅度差函数LVAMDF及综合多因素基音检测算法,该算法对语音信号进行周期特征明显段和周期特征不明显段的聚类划分,同时,获取周期特征明显语音段的基音周期,针对少数基音周期划分倍频或半频问题,提出识别、修正方法,其识别、修正率极高。在对大量真实语音处理中,能够精确的检测出语音特征明显段的基音周期端点,基本没有倍频和半频划分,并且和AMDF、ACF算法作了对比。  相似文献   

8.
基于基音参数规整及统计分布模型距离的语音情感识别   总被引:17,自引:0,他引:17  
提出一种根据基音提取的频率分辨率确定自适应窗口的改进Parzen窗方法估计基音概率密度,兼顾了基音统计分布模型在低频段的高分辨率和高频段的平滑;提出利用不同性别的基音分布规律的性别区分算法,对于长句可以达到98%的识别率;通过分析基音均值、方差、统计分布模型在性别上的差异,对基音参数进行基于性别差异的规整;引入规整后的基音均值和基音方差,以及基音统计分布模型距离作为情感特征参数;最后利用K最近邻方法对汉语情感语料进行识别。利用常规方法提取的参数最后得到的识别率为73.8%,而使用经过性别差异规整的基音参数和基音统计分布距离的识别率提高到81%。  相似文献   

9.
基于Hilbert-Huang变换的基音周期提取方法   总被引:6,自引:0,他引:6  
黄海  潘家强 《声学学报》2006,31(1):35-41
提出了一种基于Hilbert-Huang变换的语音信号基音周期提取方法。该方法无须对语音信号进行分帧截断。语音信号直接进行Hilbert-Huang变换后,通过基音频率搜索处理得到基音频率及其随时间的变化。实验结果表明,与传统的基音周期提取方法相比,该方法既能真实描述语音信号的非平稳非线性特性,又能提高基音周期提取的准确性和分辨率。  相似文献   

10.
本文介绍一种预分浊音型的LPC基音提取算法,对语言信号先用线性预测系数a0a1的差值分出浊音区,然后只对浊音部分进行基音提取。提取基频时,数据率减半,用LPC的自相关方法产生8个预测系数的倒滤波器,倒滤波后的误差信号,用平均幅差函数(AMDF)方法提取基频,再线性插值,最后用非线性平滑滤波,并将所得结果和一个半自动的精确算法,以及简化倒滤波(SIFT)算法进行比较,说明我们提出的算法,对背景噪声40dB以下的连续语言是准确有效的。它避免了清音和无声间隙区的音调计算,且浊音和清音的判别比较准确。  相似文献   

11.
基于数学形态滤波的语音信号基音特征提取   总被引:4,自引:1,他引:3  
蒋刚毅  郑义 《声学学报》1998,23(6):522-528
数学形态滤波是一种关于信号形状处理的非线性变换,它能简化信号、消除较小分量而保留信号的基本形状特征.本文基于数学形态滤波方法提出了两个分别在时域和频域提取语音信号基音周期的方案,在频域提取基音周期的同时还能提取出语音信号的谱包络。它们具有简单、直观和计算效率高等特点。由于数学形态滤波运算是并行的、局部的,新方案适于并行化处理和易于硬件化实现。实验结果表明,选择合理的数学形态滤波参数以及线性预测编码参数,能获得准确的语音信号基音特征。  相似文献   

12.
针对NVIDIA CUDA(Compute Unified Device Architecture)架构的第三代GPU高性能计算技术开展了研究,利用具有448个处理核心的NVIDIA GPU GTX470实现了脉冲压缩雷达的基本数据处理算法,包括脉冲压缩算法与相参积累算法。根据GPU的并行处理架构,将脉冲压缩、相参积累完成了并行算法优化设计,有效的将算法映射到GPU GTX470的448个处理核心中,完成了脉冲压缩雷达基本处理算法的GPU并行处理实现,并针对处理结果效果与实时性进行了评估。  相似文献   

13.
改进形态学相关算法以识别高相似度灰度图像   总被引:3,自引:3,他引:0  
余杨  黄惟一 《光学学报》2002,22(11):362-1367
从形态学角度定义了灰度联合图像相似度,提出两种基于位表示法形态学相关算法的改进算法,通过提取位表示法的图像片边缘特征或二元化位表示法的图像片功率谱,以提高位表示法形态学相关算法对高相似度灰度图像的识别能力。  相似文献   

14.
自动精确测定浊音中最大激励值的位置   总被引:2,自引:0,他引:2       下载免费PDF全文
本文阐述了一种改进的自相关算法原理和HILBERT变换原理,提出了运用这些原理以及精确的搜索算法来精确确定语音浊音中最大激励值的方法,同时设计了能自动确定语音最大激励位置的软件。通过对大量的不同种类的语音进行运算和统计,证明了这种算法的可能靠性是较高的。  相似文献   

15.
基音同步特征波形内插语音编码算法   总被引:3,自引:1,他引:2  
徐金标  杜利民 《声学学报》2000,25(6):499-503
研究了在特征波形语音编码算法中的特征波形分解算法,提出了一种基于基音同步的特征波形内插语音编码算法。特征波形的量化采用变维矢量量化(VDVQ)。通过实现的2.4kb/s的语音质量表明,这种语音压缩算法在低码率时能得到高通信质量的重建语音。  相似文献   

16.
探讨阈值分割算法,把其应用于痕量微生物图像的处理。基于阈值算法提出了适合痕量微生物图像的目标信号提取方法。对阈值分割算法进行分析,对比传统阈值方法和提出的改进阈值算法的实际图像处理效果。传统阈值算法可实现对图像中微生物信号的提取,但存在一定失真。基于阈值分割方法的改进算法具有抑制噪声信号,及区分背景与目标的能力,可高效实现微生物信号的提取。所成微生物分布二值图像具有轮廓清晰、易于观察的特点。  相似文献   

17.
线状目标实时检测算法的研究   总被引:4,自引:0,他引:4  
提出了一种基于FPGA和DSP的算法并设计了相应的硬件系统,能对大小为256×256像素、帧频为25帧/s的视频图像进行实时处理。即先对输入图像采用改进的Sobel算子提取边缘,再用改进的Hough变换算法进行直线检测。解决了传统的Sobel算子提取的边缘较粗及Hough变换算法计算量大、难以实时实现的难题。  相似文献   

18.
为了提高图像边缘检测的性能,缩短处理时间,提出了一种基于FPGA的实时视频边缘检测系统。该系统以EP2C8Q208C8为实验硬件平台,首先采用摄像头OV7670获取模拟视频数据,双端口SDRAM实现对图像数据的缓存,利用FPGA并行处理的特点,采用Verilog HDL硬件描述语言实现改进的Canny边缘检测算法,最终实现在VGA显示屏上显示图像边缘的效果。实验结果表明,较传统的边缘检测算法,该系统边缘检测定位精度高,对噪声的抗干扰能力强,能够准确快速的输出图像边缘信息。  相似文献   

19.
一种改进的SUSAN角点提取方法   总被引:2,自引:0,他引:2  
针对基本SUSAN算法存在漏检测、处理速度慢以及容易产生伪角点等问题,提出了一种改进的SUSAN角点提取算法。首先对图像的像素点按边缘点、内部点和背景点进行分类,在此基础上只对边缘点进行SUSAN算法处理,然后检查已经提取到的所有角点,剔除同一区域范围内的伪角点,从而实现对大部分角点的快速、准确提取。实验结果表明,该算法的运算速度比改进前提高约一倍,能够较准确地检测到目标角点。  相似文献   

20.
王俊生 《声学学报》1986,11(3):136-145
线性预测技术已广泛用于语言信号处理,特别是用于设计低比特率的声码器。但是传统的定帧长分析方法不能很好适应语言的非平稳过程,同时由此得到的语言参数(例如预测误差)用于提取音调也容易出错,因而影响了合成语言的质量。为此我们进行了三方面的改进:(1)用自适应梯型算法代替现有定帧分析的线性预测方法,以便得到更准确的声道参数;(2)有限的变帧抽样语言参数,改善了合成语音过渡区的性能;(3)改进Gold-Rabiner的基音提取技术,使音调提取方法更简单可靠。传送数据率为2400和1200比特每秒。在计算机上模拟结果表明,2.4kb/s的方案所合成的语言较为自然易懂,且不难分辨熟人口音,l.2kb/s方案的合成语言也未严重降级。采用缓存器后,两种方案均可在固定数据率信道上传输。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号