首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
本文根据倒谱系数矢量在特征空间的统计分布特性,提出了一种新的等方差加权倒谱失真测度,这种测度的加权函数充分刻画了语音倒谱矢量在特征空间分布的精细结构,从而有效地辨识不同讲话者的特征,实验表明,和常规的欧氏距离及方差倒数加权距离等相比,本文所提的失真测度能显著提高基于矢量量化的说话人识别的正识率。  相似文献   

2.
基于MFCC的说话人识别系统   总被引:9,自引:0,他引:9  
说话人识别可以被看作语音识别的一种,是当前的研究热点之一.本文实现的说话人辨认系统,采用能够反映人对语音的感知特性的Mel频率倒谱系数(Mel-Frequency Ceptral Coefficients ,MFCC)作为特征参数.试验比较了MFCC、差分MFCC组合MFCC分别与VQ、DTW相结合的识别率.得出差分MFCC组合MFCC优于MFCC.  相似文献   

3.
比较了基于因特网的说话人识别技术中Mel倒谱特征各阶参数的抗噪性能,并分析和验证了交织及丢失数据替代技术对改善基于因特网的说话人识别系统性能的重要作用。  相似文献   

4.
尹永  莫鸿强 《信息技术》2012,(10):85-91
在诊断一个有慢性咳嗽的病人时,他的咳嗽强度和频率评估能提供很有价值的信息。因此提高咳嗽识别率,对疾病的诊断有着重要意义。从语音识别中被广泛应用的Mel倒谱参数出发,寻找咳嗽和语音在Mel倒谱参数中的区别。基于Mel倒谱参数的原理,将其计算过程中的Mel刻度滤波器对数能量的极值数分布情况提取出来作为咳嗽的识别特征。在病房环境下对录音文件进行实验,得到的咳嗽识别率为90%以上,同时能够将语音等非咳嗽信号有效地剔除,实验结果显示90%以上的语音信号被排除。在录音设备及环境等各项参数不变的条件下,对不同病人样本,可使用同一阈值对咳嗽进行识别。该方法过程简单,数据计算量小,便于快速识别。  相似文献   

5.
张玲华  杨震  郑宝玉 《信号处理》2003,19(Z1):121-124
本文介绍了倒谱参数的特点,讨论了倒谱参数在基于隐马尔可夫模型(HMM)的说话人识别系统中的应用.推导了计算LPC倒谱的递推公式,并根据实验结果对该公式进行了修正,给出了实验公式.实验数据表明,修改后的倒谱公式用于与文本无关的说话人识别系统使系统的正确识别率显著提高.  相似文献   

6.
提出了一种新的说话人识别方法。该方法综合了VQ和GMM的优点,通过用VQ误差尺度取代传统GMM的输出概率函数,减少了建模时对训练数据量的要求,提高了识别速度。实验结果证明了该方法的有效性。  相似文献   

7.
论文通过提取输入语音的美尔倒谱系数,线性预测倒谱系数及其差分的双重方法,在建模过程中,对原有的矢量量化模型进行改进,形成一种新的连续码字分布的矢量量化模型,并与传统的动态时间规整算法和矢量量化方法比较,进行与文本有关的说话人识别实验,获得了较好的效果。  相似文献   

8.
高斯混合模型采用固定混合数结构的建模方法并不符合说话人语音特征分布的多样性,从而出现过拟合或者欠拟合的情况并影响系统的识别性能。提出一种混合数可变的自适应高斯混合模型并将其应用于说话人识别。模型训练中根据说话人语音特征参数分布的聚类特性,采用吸收合并与分裂机制动态调整混合数以获得更加精确的拟合性能,提高系统识别率。实验结果显示,在特征参数MFCC和BFCC(Bilinear Frequency Cepstrum Coefficients)下相对误识率分别下降了41.41%和22.21%。  相似文献   

9.
文中以语音信号的LPC倒谱系数、△倒谱系数、基音周期和△基音周期的混合特征参数作为识别说话人的特征,运用VQ技术实现了说话人自动识别。在10个说话人,1800个汉语数字和单词语音的语音库上进行了系统的识别实验,其中单音节语音的平均识别率达到了92%,双音节语音达到了96.67%,四音节语音达到了97.67%。  相似文献   

10.
将倒谱参数与基音信息有效结合进行说话人辨认   总被引:2,自引:0,他引:2  
李蕴华 《信号处理》2000,16(1):85-89
本文介绍了一种基于矢量量化技术的说话人识别系统,在特征参数上,选用动、静态倒谱互相补偿,充分描述说话人声道模型,同时选用能描述说话人声带激励源特点的基音参数,以全面反映说话人特征.识别时,对三个参数进行优化组合,构成最佳的归一化联合失真进行判决.实验证明,对16人进行测试,当语音长度为2秒时,识别率高达96.8%.  相似文献   

11.
檀蕊莲 《信息技术》2010,34(8):103-104
说话人识别是语音识别的一种特殊方式,其目的不是识别语音内容,而是识别说话人是谁,即从语音信号中提取个人特征。采用矢量量化(VQ)可避免困难的语音分段问题和时间归整问题,且作为一种数据压缩手段可大大减少系统所需的数据存储量。通过说话人识别相关技术的研究,提出并设计了一个基于VQ的说话人识别系统,实验证明,当用于训练的数据量较小时,可以得到比较稳定的识别性能。  相似文献   

12.
在粒子群优化(Particle Swarm Optimization, PSO)和混合蛙跳算法(Shuffled Frog-Leaping Algorithm, SFLA)的基础上,该文提出了一种新的混合粒子对优化(Shuffled Particle-Pair Optimizer, SPPO)算法,应用于矢量量化的说话人识别。该算法将全局信息交换和局部深度搜索相结合寻求最佳的说话人码本。群体按适应值分为3个粒子对,每个粒子对由两个粒子构成,按先后顺序执行PSO算法中的速度位置更新和LBG算法以实现局部细致搜索,间隔一定的迭代次数通过SFLA混合策略实现粒子对间的信息交换,从而使群体向全局最优解靠近。实验结果表明,本算法始终稳定地取得显著优于LBG,FCM,FRLVQ-FVQ和PSO算法的说话人识别性能,较好地解决了初始码本影响的识别性能的问题,且在计算时间和收敛速度方面有相当的优势。  相似文献   

13.
采用遗传算法的VQ码本设计及说话人识别   总被引:2,自引:0,他引:2  
芮贤义  俞一彪 《信号处理》2005,21(3):289-292
矢量量化(VQ)方法是文本无关说话人识别中广泛应用的建模方法之一。在矢量量化过程中,经典的LBG算法收敛速度快,但极易收敛于局部最优点,无法保证根据有限样本数据得到最优码本,并最终影响系统识别性能。考虑到遗传算法(GA)是一种具有全局化寻优搜索能力的算法,本文提出了遗传算法和K均值算法相结合的综合分析方法GA-K进行码本设计,改善了码本的质量。讨论了具体的算法实现,分析了在不同的特征参数LPCC及MFCC、不同测试语音长度下的说话人识别性能。实验结果显示,GA-K方法优于传统的LBG算法,可以很好地协调收敛性和识别率之间的关系。  相似文献   

14.
在语音识别中,MFCC 参数是说话人识别中常用的特征参数之一。文中针对说话人识别速度较慢以及占用资源较大的问题,提出了一种 MFCC 计算的有效方案。利用 MFCC 滤波器的频率响应函数的三角形结构,改进了 Mel 滤波器的设计方法。实验结果表明,文中所提方案在单帧内存访问时间上减少了 83.6%,在保证识别准确率不降低的情况下,使识别速度大幅度提高,降低了说话人识别计算的复杂性。  相似文献   

15.
基于可区分性加权的模糊核说话人识别   总被引:1,自引:1,他引:1       下载免费PDF全文
林琳  王树勋  陈建 《电子学报》2008,36(7):1446-1450
 针对训练和识别语音数据较少的情况,本文提出了一种新的说话人识别算法.通过核映射,在高维特征空间对说话人的语音特征进行模糊矢量量化.为了增加说话人之间的可区分性,提出了一种基于高维特征空间的码字矢量的权值分配方法,对具有较强区分性的码字矢量分配较大的权值,并将产生的权值和说话人的码书一起形成说话人数据库.识别时,提出一种模糊核加权最近邻近分类器,在高维特征空间中对说话人进行匹配.实验表明,该算法在训练语音少于8s,识别语音为1s时,能够得到较好的识别结果.  相似文献   

16.
秦伦明  丁晓明 《电声技术》2006,(8):50-53,56
在基于智能卡的说话人确认系统中,实现了一种新的端点检测方法:能频值端点检测方法,其取得了较好的效果;在鲁棒性方面,研究了Mel倒谱系数各分量在说话人识别中的贡献,以及在参数级上Mel倒谱系数的差分系数及倒谱均值相减法对说话人识别的贡献;最后,讨论了基于智能卡的生物特征识别技术的应用途径。  相似文献   

17.
针对梅尔倒谱系数特征难以满足短语音说话人确认的问题,本文从同样是模仿人耳听觉机理的伽马通滤波器为基础,提出让抗噪性能更佳的伽马通频率倒谱系数作为输入特征.首先,在短语音条件下,提取伽马通频率倒谱系数,采用加减特征分量法计算其不同维数的贡献度大小.其次,选取其中贡献较高的分量作为特征,保留那些最能表征不同说话人之间差异的...  相似文献   

18.
作为说话人识别特征参量的MFCC的提取过程   总被引:5,自引:0,他引:5  
说话人识别是人的个体特征识别中的一个重要分支,在实际生活中已得到广泛应用。而人的听觉系统是一个比较理想的说话人识别系统,MFCC(Mel倒谱系数)模拟了人的听觉特性,是符合人听觉特性的语音特征参量,在实际应用中取得了较高的识别率。文中通过一个卷积同态系统简单介绍了语音信号的倒谱分析方法,并通过对Mel频率刻度得到符合人听觉特性的Mel频率等效滤波器组,最后介绍了MFCC求取的一般过程和算法。  相似文献   

19.
基于神经网络的说话人识别方法可以在一定程度上模仿人脑的功能,是说话人识别中的一种主要技术,但它通常难以确定隐层单元的数目,收敛速度慢,易于收敛到极小点。该文研究了一种用于说话人识别的小波神经网络模型,给出了网络结构和学习算法。采用Mel频率倒谱系数作为与文本无关的说话人识别的特征参数,并利用该模型进行了5个人的说话人识别实验,得到99.5%的识别率。实验结果表明,小波网络和传统的BP网络相比,训练速度和识别率都有了较大提高,具有良好的应用前景和进一步研究的价值。  相似文献   

20.
基于加权特征值补偿的说话人识别   总被引:3,自引:0,他引:3  
于鹏  徐义芳  曹志刚 《信号处理》2002,18(6):513-517
背景噪声的存在,使得说话人识别系统的训练环境和测试环境发生失配,导致系统性能发生急剧下降。本论文提出一种加权特征值补偿算法,把由噪声引起的使带噪语音信号特征值与纯净语音特征值发生偏差的部分去除,从而使进入识别器的特征值接近纯净语音的特征值。在特征值补偿过程中引入了信噪比加权的方法。实验表明,这种方法能够有效的提高说话人识别系统的性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号