首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 437 毫秒
1.
提出一种描述正常语音和变异语音之间关系的补偿因子。该补偿因子兼顾考虑了由于变异引起的特征分布中均值和方差的变化,并在k-均值初始化的参数基础上,采用期望最大化(EM)算法迭代估计变异补偿因子的值。通过估计出的补偿因子对变异语音特征进行补偿。对航空模拟飞行器中采集的应力变异下特定话者小词表孤立词的实验结果表明,利用所提出的方法可以将识别率提高32.3%。  相似文献   

2.
通过运用mat1ab软件编程对语音信号进行了基音提取,并以MFCC、基于基音周期和MFCC的特征组合参数作为特征参数,建立了基于GMM模型的说话人识别系统。并通过识别实验得出的实验结果,发现使用基于基音周期和MFCC的特征组合参数作为特征参数,在人数为50-180人范围内,能够有效提高基于GMM说话人识别系统识别率。  相似文献   

3.
针对支持向量机(Support Vector Machine,SVM)的参数优化问题,提出了一种改进的混合蛙跳算法(Improved Shuffled Frog Leaping Algorithm,Im-SFLA),提高了其在实用语音情感识别中的学习能力。首先,我们在SFLA中引入了模拟退火(Simulated Annealing,SA)、免疫接种(Immune Vaccination,IV)、高斯变异和混沌扰动算子,平衡了搜索的高效性和种群的多样性;第二,利用Im-SFLA优化SVM的参数,提出了一种Im-SFLA-SVM方法;第三,分析了烦躁等实用语音情感的声学特征,重点分析了基音、短时能量、共振峰和混沌特征随情感类别的变化特性,构建出144维的情感特征向量并采用LDA降维到4维;最后,在实用语音情感数据库上测试了算法性能,将提出的算法与混合蛙跳算法(Shuffled Frog Leaping Algorithm,SFLA)优化SVM参数的方法(SFLA-SVM方法)、粒子群优化(Particle Swarm Optimization,PSO)算法优化SVM参数的方法(PSO-SVM方法)、基本SVM方法、高斯混合模型(Gaussian Mixture Model,GMM)方法和反向传播(Back Propagation,BP)神经网络法等进行对比。实验结果表明,采用Im-SFLA-SVM方法的平均识别率达到77.8%,分别高于SFLA-SVM方法、PSO-SVM方法、SVM方法、GMM方法和BP神经网络法各1.7%,2.7%,3.4%,4.7%,7.8%,并且对于烦躁这种实用情感的识别率提高效果最为明显,从而证实了Im-SFLA是一种有效的SVM参数选择方法,并且Im-SFLA-SVM方法能显著提升实用语音情感的识别率。   相似文献   

4.
采用定点迭代进行变分图像恢复并在这个计算框架下提出利用噪声方差选择规整化参数的方法.假定已知观测图像中初始噪声统计特性.为了在反卷积过程中正确地估计噪声的方差,构造一幅纯噪声图像跟实际的观测图像同步进行反卷积计算,并把纯噪声图像的方差作为观测图像中噪声方差的估计值来辅助计算规整化参数.针对规整化的各项异性,提出了能够保持两种噪声同步变化的特殊的规整化项.在能够准确知道迭代过程中图像包含噪声的方差的时候,建立了规整化参数λ与图像噪声方差之间的关系式.实验证明新的算法不但更好地抑制了噪声而且避免了过平滑,明显提高了基于定点迭代法计算变分图像恢复的适应性.  相似文献   

5.
吴里银  王振国  李清廉  李春 《物理学报》2016,65(9):94701-094701
针对液体圆柱射流垂直喷入超声速横向气流中的非定常分布特性开展实验研究, 并建立穿透深度方向上的射流振荡分布模型. 利用脉冲激光背景成像方法“冻结”拍摄马赫2.1(Ma=2.1)气流中煤油射流/喷雾瞬态图像, 结合最大类间方差法(Otsu)和Canny算法提取瞬态图像特征, 基于统计方法并引入间歇因子(γ)定量描述射流振荡分布特性; 通过研究多参数协同作用下的射流振荡分布规律, 提出振荡分布数学模型, 研究的参数变量包括超声速来流总压(642-1010 kPa)、 液体喷注压降(0.36-4.61 MPa)、液体喷嘴流道直径 (0.48 mm/1.0 mm/1.25 mm/1.52 mm)、距离喷嘴的流向距离(10-125 mm)以及液气动量通量比(0.11-7.49). 研究中利用射流振荡分布模型成功预测出水射流在Ma=2.1气流中的的振荡分布, 预测分布与实验结果符合良好.  相似文献   

6.
提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率的方法比较,它能较多的滤除语义信息的影响,更好地体现说话人的个性特征。本文提取抗噪性能优于Mel倒谱参数的感知最小方差无失真参数作为识别特征,语音模型用经典的隐马尔可夫模型(HMM)。实验证明,本文方法与传统的语音识别参数和用声道第三共振峰进行谱规整的方法相比,在干净语音中单词错误识别率分别下降了4%和3%,在噪声环境下分别下降了9%和5%,有效地改善了非特定人语音识别系统的性能。   相似文献   

7.
王鹏辉  夏双志  潘勉  张学峰  杜兰  刘宏伟 《光学学报》2012,32(5):528004-293
为了解决雷达高分辨距离像识别系统对训练样本需求量过大的问题,提出了一种有限样本条件下的目标识别新方法。分析了距离像频谱幅度的统计特性,从其广义平稳性和多模态分布特性出发,定义一种线性混合高斯状态空间模型对其统计建模,利用期望最大化算法进行了模型参数估计。实验结果表明:即使在很少的训练样本条件下,该方法仍能获得较高的正确识别率和良好的拒判性能。  相似文献   

8.
语音是一种短时平稳时频信号,因此大多数的研究者都通过分帧来提取情感特征。然而,分帧后提取的特征为局部特征,无法准确反应情感语音动态特性,故单纯采用局部特征往往无法构建鲁棒的情感识别系统。针对这个问题,先在不分帧的语音信号里通过多尺度最优小波包分解提取语句级全局特征,分帧后再提取384维的语句级局部特征,并利用Fisher准则进行降维,最后提出一种弱尺度融合策略来将这两种语句级特征进行融合,再利用SVM进行情感分类。基于柏林情感库的实验结果表明本文方法较单纯使用语句级局部特征最后识别率提高了4.2%到13.8%,特别在小样本的情况下,语音情感识别率波动较小。   相似文献   

9.
说话人辨认中有效参数的研究   总被引:2,自引:0,他引:2       下载免费PDF全文
说话人辨认技术是语音识别中的一项重要应用,在我们研究的系统中,LPC参数并不是都很有效,我们用统计分析方法对12个预测系数、12个部分相关系数、12个对数面积比系数、12个倒谱系数、12个相关系数、短时能量、短时平均过零率及基音共63个参数,进行方差比检验,用10名男青年的三个元音的发音,在半年内采集97种语音作为试验材料,选出15个方差比比较大的作为识别参数,识别率为89.19%,采用样本刷新技术后,识别率达到97.3%。  相似文献   

10.
舰船辐射噪声的高阶统计量特征提取及特征压缩   总被引:2,自引:2,他引:0       下载免费PDF全文
提取了6类水中目标的11/2谱统计线谱特征和AR模型特征。实验结果表明基于11/2谱的统计线谱特征和AR模型特征有效的识别出了目标,达到了85%的综合识别率。最后利用主元分析技术对上述特征进行了压缩,在保持识别率的同时将特征维数从64维压缩至34维,有利于工程上的实现。  相似文献   

11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号