排序方式: 共有57条查询结果,搜索用时 0 毫秒
31.
高阶MFCC的话者识别性能及其噪声鲁棒性 总被引:6,自引:0,他引:6
在一个以MFCC为特征参数的语音识别系统中,人们通常采用低阶的MFCC系数作为语音帧的特征矢量.本文对MFCC的高、低阶系数在与文本有关的话者识别中体现出的识别性能和噪声鲁棒性分别进行了实验分析,发现高阶的MFCC系数在干净环境下对于话者识别而言具有与低阶MFCC系数相当的识别性能,并且当环境信噪比恶劣时,高阶的MFCC系数表现出比低阶MFCC系数更强的噪声鲁棒性.基于这个结果,本文将高阶系数的取值范围进一步向低阶拓展,只滤除最易受噪声影响的几个系数,并与Delta参数相结合形成新的特征矢量.实验证明,这种经过适当选取的MFCC系数同时具有良好的话者识别性能和噪声鲁棒性. 相似文献
32.
声音无处不在,声音的检测与识别一直是声音研究领域的重要内容。其中公共场所环境中的突发声音的检测一直是一个难题,本文提出了一种利用短时能量和短时平均过量率以及MFCC和DTW对枪声等特定声音的多级检测算法。实验结果表明,本算法具有较低的计算复杂度,易于实现,而且检测的漏检率和误检率都很理想。 相似文献
33.
基于内容的音频分类是一个有趣并有重要意义的问题。音频分类技术包括音频特征抽取和分类器两个基本部分。如今,基于内容的音频自动分类技术已经有了很大的发展。然而,现有的基于内容的音频自动分类方法在分类的准确性、有效性和算法复杂度等诸多方面存在一定的不足,探索性能更佳的方法就成为了该领域的研究热点。提取了基于内容的音频分类所使用的音频特征,得到了基于帧的音频特征和基于片段的音频特征两个层次的特征,并提出了一种基于MFCC的简化的特征;选取了最小距离分类器中的最近邻分类器和K近邻分类器,对这几种典型的音频分类器进行研究,进行仿真实验,分析了实验结果;最后设计并仿真了经过改进的最小距离音频分类器,它的性能相对于原有的最近邻和K近邻分类器有一定的提高,并具有很低的系统复杂度和很短的分类时间。 相似文献
34.
基于S3C2410的智能家居语音控制器的设计 总被引:1,自引:0,他引:1
结合智能家居控制系统的特点以及人机自然交互的理念,提出了一种利用S3C2410设计的智能家居语音控制器,该语音控制器既能对多对象进行统一控制,也能嵌入到具体的单个对象中。 相似文献
35.
适当均衡耳机到鼓膜的传递函数可有效提高耳机声重放效果。耳廓与耳道滤波效应引起的幅度峰谷有助于人耳听觉感知,以平直幅频响应为目标的幅度均衡无法保持适当的峰谷。该文提出了基于roex滤波器与Mel频率倒谱系数的耳机到鼓膜的传递函数平滑方法,用于模拟人耳听觉感知特性和平滑耳机到鼓膜的传递函数,使均衡后的幅频响应保持相应的峰谷,避免了幅度峰谷过渡均衡。实验结果表明,进行耳机到鼓膜的传递函数平滑的幅度均衡对提高耳机的音色有显著作用,基于Mel频率倒谱系数平滑的幅度均衡对提高耳机的音色最为显著。 相似文献
36.
37.
基于Fisher线性判别分析的语音信号端点检测方法 总被引:1,自引:0,他引:1
传统的语音端点检测方法对辅音,特别是受到噪声污染的清音部分与背景噪声之间分离能力不足。针对上述问题,该文提出一种基于Fisher线性判别分析的梅尔频率倒谱系数(F-MFCC)端点检测方法。将清音信号和背景噪声视为两类分类问题,采用Fisher准则求解具有判别信息的最佳投影方向,使得投影后的特征参数具有最小类内散度和最大类间散度,从而增大清音与背景噪声的可分离性。在不同语音库上的实验结果表明,F-MFCC能够在不同信噪比和背景噪声条件下提高语音端点检测的准确率。 相似文献
38.
基于小波包变换和MFCC的说话人识别特征参数 总被引:1,自引:0,他引:1
研究了小波包变换及MFCC参数的提取,结合二者特点,提取了基于小波包变换和MFCC的新参数DWT-MFCC.并在基于16阶GMM系统上进行说话人识别实验。实验结果表明,相对于传统的MFCC参数,在相同的噪声环境下,DWT—MFCC参数具有更高的说话人识别率。 相似文献
39.
通过对话音识别中的模板匹配技术DTW算法的研究和改进,实现了一种应用于判别骚扰电话录音的话音识别系统。实验结果表明,该系统具有较高的识别精度,是一种有效的应用于判别骚扰电话的话音识别系统,能显著提高骚扰电话人工审核的效率,进一步完善骚扰电话治理工作。 相似文献
40.
将小波变换的多分辨率特性用于改进Mel频率倒谱系数MFCC的前端处理中,给出了一种新的语音特征参数——小波MFCC。其特点在于采用小波变换、分层FFT和频率合成代替原来MFCC中的FFT部分,使频谱分辨率提高了一倍。试验证明,小波MFcc特征参数在较大词汇量情况下,其识别率优于MFCC特征参数的结果。 相似文献