共查询到20条相似文献,搜索用时 15 毫秒
1.
在语音信号分析中,对于基音周期的提取目前已有较多的分析和处理方法,在现有的短时平均幅度差函数(AMDF)的处理方法中,只需要加、减和取绝对值运算,运算量较之短时自相关函数大大下降。同时,AMDF函数的谷点提取基音周期比自相关函数的峰值更加尖锐,错判率相对较少,稳健性更高。然而,传统的AMDF算法对窗长的要求较为严格,窗长较短就会有较大的误差。本文针对该缺陷做出的改进算法,使之无论窗长多大均会有较为准确的结果,大大拓展了AMDF算法的适用空间。进一步,将其与同态处理结合,会有更好的效果。 相似文献
2.
3.
随着计算机技术的发展,语音信号处理作为人机交互的重要渠道,其在复杂噪声环境下的特征值检测算法直接关系到计算机的运算效率。基音周期是语音特征值提取的重要参数之一。针对传统基音检测算法在噪声环境下检测精度低的问题,提出了一种基于自适应提升小波变换加权线性预测误差自相关函数的基音检测算法。该方法用多级提升小波近似系数加权求和的方法来弥补自相关函数随着时间延迟量的增加幅值衰减的缺陷;用线性预测误差自相关函数的方法来抑制共振峰的干扰,然后将两种方法结合来突出基音周期处的峰值。实验结果表明,与传统的自相关函数法和小波加权法相比,该方法能有效减弱共振峰的影响,突出基音周期处的峰值,提高基音周期检测精度,鲁棒性更好。 相似文献
4.
5.
6.
通过运用mat1ab软件编程对语音信号进行了基音提取,并以MFCC、基于基音周期和MFCC的特征组合参数作为特征参数,建立了基于GMM模型的说话人识别系统。并通过识别实验得出的实验结果,发现使用基于基音周期和MFCC的特征组合参数作为特征参数,在人数为50-180人范围内,能够有效提高基于GMM说话人识别系统识别率。 相似文献
7.
8.
基于基音参数规整及统计分布模型距离的语音情感识别 总被引:17,自引:0,他引:17
提出一种根据基音提取的频率分辨率确定自适应窗口的改进Parzen窗方法估计基音概率密度,兼顾了基音统计分布模型在低频段的高分辨率和高频段的平滑;提出利用不同性别的基音分布规律的性别区分算法,对于长句可以达到98%的识别率;通过分析基音均值、方差、统计分布模型在性别上的差异,对基音参数进行基于性别差异的规整;引入规整后的基音均值和基音方差,以及基音统计分布模型距离作为情感特征参数;最后利用K最近邻方法对汉语情感语料进行识别。利用常规方法提取的参数最后得到的识别率为73.8%,而使用经过性别差异规整的基音参数和基音统计分布距离的识别率提高到81%。 相似文献
9.
基于Hilbert-Huang变换的基音周期提取方法 总被引:6,自引:0,他引:6
提出了一种基于Hilbert-Huang变换的语音信号基音周期提取方法。该方法无须对语音信号进行分帧截断。语音信号直接进行Hilbert-Huang变换后,通过基音频率搜索处理得到基音频率及其随时间的变化。实验结果表明,与传统的基音周期提取方法相比,该方法既能真实描述语音信号的非平稳非线性特性,又能提高基音周期提取的准确性和分辨率。 相似文献
10.
本文介绍一种预分浊音型的LPC基音提取算法,对语言信号先用线性预测系数a0和a1的差值分出浊音区,然后只对浊音部分进行基音提取。提取基频时,数据率减半,用LPC的自相关方法产生8个预测系数的倒滤波器,倒滤波后的误差信号,用平均幅差函数(AMDF)方法提取基频,再线性插值,最后用非线性平滑滤波,并将所得结果和一个半自动的精确算法,以及简化倒滤波(SIFT)算法进行比较,说明我们提出的算法,对背景噪声40dB以下的连续语言是准确有效的。它避免了清音和无声间隙区的音调计算,且浊音和清音的判别比较准确。 相似文献
11.
基于数学形态滤波的语音信号基音特征提取 总被引:4,自引:1,他引:3
数学形态滤波是一种关于信号形状处理的非线性变换,它能简化信号、消除较小分量而保留信号的基本形状特征.本文基于数学形态滤波方法提出了两个分别在时域和频域提取语音信号基音周期的方案,在频域提取基音周期的同时还能提取出语音信号的谱包络。它们具有简单、直观和计算效率高等特点。由于数学形态滤波运算是并行的、局部的,新方案适于并行化处理和易于硬件化实现。实验结果表明,选择合理的数学形态滤波参数以及线性预测编码参数,能获得准确的语音信号基音特征。 相似文献
12.
针对NVIDIA CUDA(Compute Unified Device Architecture)架构的第三代GPU高性能计算技术开展了研究,利用具有448个处理核心的NVIDIA GPU GTX470实现了脉冲压缩雷达的基本数据处理算法,包括脉冲压缩算法与相参积累算法。根据GPU的并行处理架构,将脉冲压缩、相参积累完成了并行算法优化设计,有效的将算法映射到GPU GTX470的448个处理核心中,完成了脉冲压缩雷达基本处理算法的GPU并行处理实现,并针对处理结果效果与实时性进行了评估。 相似文献
13.
改进形态学相关算法以识别高相似度灰度图像 总被引:3,自引:3,他引:0
从形态学角度定义了灰度联合图像相似度,提出两种基于位表示法形态学相关算法的改进算法,通过提取位表示法的图像片边缘特征或二元化位表示法的图像片功率谱,以提高位表示法形态学相关算法对高相似度灰度图像的识别能力。 相似文献
14.
15.
基音同步特征波形内插语音编码算法 总被引:3,自引:1,他引:2
研究了在特征波形语音编码算法中的特征波形分解算法,提出了一种基于基音同步的特征波形内插语音编码算法。特征波形的量化采用变维矢量量化(VDVQ)。通过实现的2.4kb/s的语音质量表明,这种语音压缩算法在低码率时能得到高通信质量的重建语音。 相似文献
16.
17.
18.
为了提高图像边缘检测的性能,缩短处理时间,提出了一种基于FPGA的实时视频边缘检测系统。该系统以EP2C8Q208C8为实验硬件平台,首先采用摄像头OV7670获取模拟视频数据,双端口SDRAM实现对图像数据的缓存,利用FPGA并行处理的特点,采用Verilog HDL硬件描述语言实现改进的Canny边缘检测算法,最终实现在VGA显示屏上显示图像边缘的效果。实验结果表明,较传统的边缘检测算法,该系统边缘检测定位精度高,对噪声的抗干扰能力强,能够准确快速的输出图像边缘信息。 相似文献
19.
20.
线性预测技术已广泛用于语言信号处理,特别是用于设计低比特率的声码器。但是传统的定帧长分析方法不能很好适应语言的非平稳过程,同时由此得到的语言参数(例如预测误差)用于提取音调也容易出错,因而影响了合成语言的质量。为此我们进行了三方面的改进:(1)用自适应梯型算法代替现有定帧分析的线性预测方法,以便得到更准确的声道参数;(2)有限的变帧抽样语言参数,改善了合成语音过渡区的性能;(3)改进Gold-Rabiner的基音提取技术,使音调提取方法更简单可靠。传送数据率为2400和1200比特每秒。在计算机上模拟结果表明,2.4kb/s的方案所合成的语言较为自然易懂,且不难分辨熟人口音,l.2kb/s方案的合成语言也未严重降级。采用缓存器后,两种方案均可在固定数据率信道上传输。 相似文献