共查询到20条相似文献,搜索用时 437 毫秒
1.
2.
通过运用mat1ab软件编程对语音信号进行了基音提取,并以MFCC、基于基音周期和MFCC的特征组合参数作为特征参数,建立了基于GMM模型的说话人识别系统。并通过识别实验得出的实验结果,发现使用基于基音周期和MFCC的特征组合参数作为特征参数,在人数为50-180人范围内,能够有效提高基于GMM说话人识别系统识别率。 相似文献
3.
针对支持向量机(Support Vector Machine,SVM)的参数优化问题,提出了一种改进的混合蛙跳算法(Improved Shuffled Frog Leaping Algorithm,Im-SFLA),提高了其在实用语音情感识别中的学习能力。首先,我们在SFLA中引入了模拟退火(Simulated Annealing,SA)、免疫接种(Immune Vaccination,IV)、高斯变异和混沌扰动算子,平衡了搜索的高效性和种群的多样性;第二,利用Im-SFLA优化SVM的参数,提出了一种Im-SFLA-SVM方法;第三,分析了烦躁等实用语音情感的声学特征,重点分析了基音、短时能量、共振峰和混沌特征随情感类别的变化特性,构建出144维的情感特征向量并采用LDA降维到4维;最后,在实用语音情感数据库上测试了算法性能,将提出的算法与混合蛙跳算法(Shuffled Frog Leaping Algorithm,SFLA)优化SVM参数的方法(SFLA-SVM方法)、粒子群优化(Particle Swarm Optimization,PSO)算法优化SVM参数的方法(PSO-SVM方法)、基本SVM方法、高斯混合模型(Gaussian Mixture Model,GMM)方法和反向传播(Back Propagation,BP)神经网络法等进行对比。实验结果表明,采用Im-SFLA-SVM方法的平均识别率达到77.8%,分别高于SFLA-SVM方法、PSO-SVM方法、SVM方法、GMM方法和BP神经网络法各1.7%,2.7%,3.4%,4.7%,7.8%,并且对于烦躁这种实用情感的识别率提高效果最为明显,从而证实了Im-SFLA是一种有效的SVM参数选择方法,并且Im-SFLA-SVM方法能显著提升实用语音情感的识别率。 相似文献
4.
采用定点迭代进行变分图像恢复并在这个计算框架下提出利用噪声方差选择规整化参数的方法.假定已知观测图像中初始噪声统计特性.为了在反卷积过程中正确地估计噪声的方差,构造一幅纯噪声图像跟实际的观测图像同步进行反卷积计算,并把纯噪声图像的方差作为观测图像中噪声方差的估计值来辅助计算规整化参数.针对规整化的各项异性,提出了能够保持两种噪声同步变化的特殊的规整化项.在能够准确知道迭代过程中图像包含噪声的方差的时候,建立了规整化参数λ与图像噪声方差之间的关系式.实验证明新的算法不但更好地抑制了噪声而且避免了过平滑,明显提高了基于定点迭代法计算变分图像恢复的适应性. 相似文献
5.
针对液体圆柱射流垂直喷入超声速横向气流中的非定常分布特性开展实验研究, 并建立穿透深度方向上的射流振荡分布模型. 利用脉冲激光背景成像方法“冻结”拍摄马赫2.1(Ma=2.1)气流中煤油射流/喷雾瞬态图像, 结合最大类间方差法(Otsu)和Canny算法提取瞬态图像特征, 基于统计方法并引入间歇因子(γ)定量描述射流振荡分布特性; 通过研究多参数协同作用下的射流振荡分布规律, 提出振荡分布数学模型, 研究的参数变量包括超声速来流总压(642-1010 kPa)、 液体喷注压降(0.36-4.61 MPa)、液体喷嘴流道直径 (0.48 mm/1.0 mm/1.25 mm/1.52 mm)、距离喷嘴的流向距离(10-125 mm)以及液气动量通量比(0.11-7.49). 研究中利用射流振荡分布模型成功预测出水射流在Ma=2.1气流中的的振荡分布, 预测分布与实验结果符合良好. 相似文献
6.
提出在参数的提取过程中用不同的感知规整因子对不同人的参数归一化,从而实现在非特定人语音识别中对不同人的归一化处理。感知规整因子是基于声门上和声门下之间耦合作用产生声门下共鸣频率来估算的,与采用声道第三共振峰作为基准频率的方法比较,它能较多的滤除语义信息的影响,更好地体现说话人的个性特征。本文提取抗噪性能优于Mel倒谱参数的感知最小方差无失真参数作为识别特征,语音模型用经典的隐马尔可夫模型(HMM)。实验证明,本文方法与传统的语音识别参数和用声道第三共振峰进行谱规整的方法相比,在干净语音中单词错误识别率分别下降了4%和3%,在噪声环境下分别下降了9%和5%,有效地改善了非特定人语音识别系统的性能。 相似文献
7.
8.
语音是一种短时平稳时频信号,因此大多数的研究者都通过分帧来提取情感特征。然而,分帧后提取的特征为局部特征,无法准确反应情感语音动态特性,故单纯采用局部特征往往无法构建鲁棒的情感识别系统。针对这个问题,先在不分帧的语音信号里通过多尺度最优小波包分解提取语句级全局特征,分帧后再提取384维的语句级局部特征,并利用Fisher准则进行降维,最后提出一种弱尺度融合策略来将这两种语句级特征进行融合,再利用SVM进行情感分类。基于柏林情感库的实验结果表明本文方法较单纯使用语句级局部特征最后识别率提高了4.2%到13.8%,特别在小样本的情况下,语音情感识别率波动较小。 相似文献
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.