期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

张潇丹黄程韦赵力邹采荣《声学学报》2014,39(2):271-280

针对支持向量机(Support Vector Machine,SVM)的参数优化问题,提出了一种改进的混合蛙跳算法(Improved Shuffled Frog Leaping Algorithm,Im-SFLA),提高了其在实用语音情感识别中的学习能力。首先,我们在SFLA中引入了模拟退火(Simulated Annealing,SA)、免疫接种(Immune Vaccination,IV)、高斯变异和混沌扰动算子,平衡了搜索的高效性和种群的多样性;第二,利用Im-SFLA优化SVM的参数,提出了一种Im-SFLA-SVM方法;第三,分析了烦躁等实用语音情感的声学特征,重点分析了基音、短时能量、共振峰和混沌特征随情感类别的变化特性,构建出144维的情感特征向量并采用LDA降维到4维;最后,在实用语音情感数据库上测试了算法性能,将提出的算法与混合蛙跳算法(Shuffled Frog Leaping Algorithm,SFLA)优化SVM参数的方法(SFLA-SVM方法)、粒子群优化(Particle Swarm Optimization,PSO)算法优化SVM参数的方法(PSO-SVM方法)、基本SVM方法、高斯混合模型(Gaussian Mixture Model,GMM)方法和反向传播(Back Propagation,BP)神经网络法等进行对比。实验结果表明,采用Im-SFLA-SVM方法的平均识别率达到77.8%,分别高于SFLA-SVM方法、PSO-SVM方法、SVM方法、GMM方法和BP神经网络法各1.7%,2.7%,3.4%,4.7%,7.8%,并且对于烦躁这种实用情感的识别率提高效果最为明显,从而证实了Im-SFLA是一种有效的SVM参数选择方法,并且Im-SFLA-SVM方法能显著提升实用语音情感的识别率。相似文献

2.

一种基于并行混沌和SFLA的风电电网无功优化模型设计

刘建英《应用声学》2015,23(6)

针对已有方法在解决电网无功优化时,由于系统的无功不足和电网电压的不稳定,容易过早收敛到局部最优解的缺点,设计了一种基于并行混沌和混合蛙跳算法 (Shuffle Frog Leaping Algorithm, SFLA)的电网无功优化模型。首先,建立了最小化有功网损、最大化静态电压稳定裕度和最大化无功补偿单位投资收益的多目标数学优化模型,然后,对经典的SFLA进行改进,通过引入精英协同进化机制和划分种群的方式实现并行寻优,从而增加个体的多样性和加快最优解的求取速度,在不同种群中设计不同的适应度函数和个体更新进化方法。为了使得算法的初始解分布更为均匀,引入用混沌机制来对种群进行初始化,最后,对基于并行混沌和SFLA的总体算法进行了设计和分析。在Matlab环境下进行实验,实验结果表明文中方法得到的优化结果具有电网有功损耗小、单位投资收益高和静态电压稳定裕度大的优点,具有较强的可行性和适应性。相似文献

3.

仿选择性注意机制的语音情感识别算法

梁瑞宇赵力陶华伟王青云邹采荣《声学学报》2016,41(4):537-544

有效特征的选取一直都是语音情感识别算法的关键。为此,针对语音情感特征选择与构建的问题,一种仿选择性注意机制的语音情感识别算法被提出。考虑到语音信号的时频特性,算法首先计算语音信号的语谱图;其次,模仿选择性注意机制,计算语谱图的颜色、方向和亮度特征图,归一化后形成特征矩阵;然后,将特征矩阵重排列并进行PCA降维,形成情感识别特征向量;最后,利用改进的支持向量机分类方法进行语音情感识别。对愤怒、恐惧、高兴、悲伤和惊奇5种情感的识别实验显示,基于选择性注意的方法能够获得较好的识别效果,平均识别率为85.44%。相比于韵律特征和音质特征,语音情感识别率至少提高10%;相比于其它语谱特征,识别率提高7%左右。相似文献

4.

基于变分模态分解的语音情感识别方法*

下载免费PDF全文

王玮蔚张秀再《应用声学》2019,38(2):237-244

针对传统语音情感特征参数在进行情感分类时性能不佳的问题,该文提出了一种基于变分模态分解的语音情感识别方法。情感语音信号首先由变分模态分解提取固有模态函数,然后对所选主导固有模态函数进行重新聚合,再提取梅尔倒谱系数和各固有模态函数的希尔伯特边际谱。为了验证该文提出的特征性能,选用两种语音数据库(EMODB、RAVDESS)进行实验,按该文方法提取特征后使用极限学习机进行语音情感分类识别。实验结果表明:相比基于经验模态分解和集合经验模态分解的语音情感特征,该文提出的特征有更好的识别性能,验证了该方法的实用性。相似文献

5.

层叠式“产生/判别”混合模型的语音情感识别

下载免费PDF全文

黄永明章国宝董飞李悦《声学学报》2013,38(2):231-240

提出了层叠式“产生/判别”混合模型的语音情感识别方法。首先,提取63维语句级特征,运用Fisher从中选择12个最佳的语句级特征,建立小波神经网络(WNN)的层叠式产生式模型进行语音情感识别;然后提取69维帧级特征,采用SFS选择出待使用的8维特征,将高斯混合模型(GMM)进行多维概率输出,建立层叠式“产生/判别”混合模型进行语音情感识别。实验结果显示:(1)层叠式“产生/判别”混合模型较单独WNN、GMM、HMM (隐马尔可夫模型)、SVM (支持向量机)的识别率要高;(2)层叠式“产生/判决式”混合模型识别率较基于WNN的层叠产生式模型高;(3) M=13,D维GMM-MAP/SVM (MAP,最大后验概率)串联融合模型为最优的层叠式“产生/判别”混合模型,能获得最高85.1%的识别率。相似文献

6.

EEG-Based Emotion Recognition by Exploiting Fused Network Entropy Measures of Complex Networks across Subjects

Longxin Yao Mingjiang Wang Yun Lu Heng Li Xue Zhang 《Entropy (Basel, Switzerland)》2021,23(8)

It is well known that there may be significant individual differences in physiological signal patterns for emotional responses. Emotion recognition based on electroencephalogram (EEG) signals is still a challenging task in the context of developing an individual-independent recognition method. In our paper, from the perspective of spatial topology and temporal information of brain emotional patterns in an EEG, we exploit complex networks to characterize EEG signals to effectively extract EEG information for emotion recognition. First, we exploit visibility graphs to construct complex networks from EEG signals. Then, two kinds of network entropy measures (nodal degree entropy and clustering coefficient entropy) are calculated. By applying the AUC method, the effective features are input into the SVM classifier to perform emotion recognition across subjects. The experiment results showed that, for the EEG signals of 62 channels, the features of 18 channels selected by AUC were significant (p < 0.005). For the classification of positive and negative emotions, the average recognition rate was 87.26%; for the classification of positive, negative, and neutral emotions, the average recognition rate was 68.44%. Our method improves mean accuracy by an average of 2.28% compared with other existing methods. Our results fully demonstrate that a more accurate recognition of emotional EEG signals can be achieved relative to the available relevant studies, indicating that our method can provide more generalizability in practical use. 相似文献

7.

半透射高光谱成像技术与支持向量机的马铃薯空心病无损检测研究 总被引：1，自引：0，他引：1

黄涛李小昱徐梦玲金瑞库静徐森淼武振中《光谱学与光谱分析》2015,35(1):198-202

针对马铃薯空心病的难以检测问题,提出了一种基于半透射高光谱成像技术结合支持向量机(support vector machine,SVM)的马铃薯空心病无损检测方法。选取224个马铃薯样本(合格149个,空心75个)作为研究对象,搭建了马铃薯半透射高光谱图像采集系统,采集了马铃薯样本半透射高光谱图像(390~1 040 nm),对感兴趣区域内的光谱进行平均和光谱特征分析。采用变量标准化(normalize)对原始光谱进行光谱预处理,建立了全波段的SVM判别模型,模型对测试集样本的识别准确率仅为87.5%。为了提高模型性能,采用竞争性自适应重加权算法(competitive adaptive reweighed sampling algorithm, CARS)结合连续投影算法(successive projection algorithm, SPA)对光谱全波段520个变量进行变量选择,最终确定了8个光谱特征变量(454,601,639,664,748,827,874和936 nm),所选8个光谱变量建立的SVM模型对马铃薯测试集的识别率为94.64%。分别采用人工鱼群算法(artificial fish swarm algorithm,AFSA)、遗传算法(genetic algorithm,GA)和网格搜索法(grid search algorithm)对SVM模型的惩罚参数c和核参数g进行优化。经过建模比较分析,确定AFSA为最优优化算法,最优模型参数为c=10.659 1,g=0.349 7,确定AFSA-SVM模型为马铃薯空心病的最优识别模型,该模型总体识别率达到100%。试验结果表明：基于半透射高光谱成像技术结合CARS-SPA与AFSA-SVM方法能够对马铃薯空心病进行准确的检测,也为马铃薯空心病的快速无损检测提供技术支持。相似文献

8.

全局特征及弱尺度融合策略的小样本语音情感识别

下载免费PDF全文

黄永明章国宝李雄达飞鹏《声学学报》2012,37(3):330-338

语音是一种短时平稳时频信号,因此大多数的研究者都通过分帧来提取情感特征。然而,分帧后提取的特征为局部特征,无法准确反应情感语音动态特性,故单纯采用局部特征往往无法构建鲁棒的情感识别系统。针对这个问题,先在不分帧的语音信号里通过多尺度最优小波包分解提取语句级全局特征,分帧后再提取384维的语句级局部特征,并利用Fisher准则进行降维,最后提出一种弱尺度融合策略来将这两种语句级特征进行融合,再利用SVM进行情感分类。基于柏林情感库的实验结果表明本文方法较单纯使用语句级局部特征最后识别率提高了4.2%到13.8%,特别在小样本的情况下,语音情感识别率波动较小。相似文献

9.

Speech emotion recognition based on statistical pitch model 总被引：1，自引：0，他引：1

WANG Zhiping ZHAO Li ZOU Cairong 《声学学报：英文版》2006,25(1):87-96

A modified Parzen-window method, which keep high resolution in low frequencies and keep smoothness in high frequencies, is proposed to obtain statistical model. Then, a gender classification method utilizing the statistical model is proposed, which have a 98% accuracy of gender classification while long sentence is dealt with. By separation the male voice and female voice, the mean and standard deviation of speech training samples with different emotion are used to create the corresponding emotion models. Then the Bhattacharyya distance between the test sample and statistical models of pitch, are utilized for emotion recognition in speech. The normalization of pitch for the male voice and female voice are also considered, in order to illustrate them into a uniform space. Finally, the speech emotion recognition experiment based on K Nearest Neighbor shows that, the correct rate of 81% is achieved, where it is only 73.85% if the traditional parameters are utilized. 相似文献

10.

Three-class classification models of logS and logP derived by using GA–CG–SVM approach

Hui Zhang Ming-Li Xiang Chang-Ying Ma Qi Huang Wei Li Yang Xie Yu-Quan Wei Sheng-Yong Yang 《Molecular diversity》2009,13(2):261-268

In this investigation, three-class classification models of aqueous solubility (logS) and lipophilicity (logP) have been developed by using a support vector machine (SVM) method combined with a genetic algorithm (GA) for feature selection and a conjugate gradient method (CG) for parameter optimization. A 5-fold cross-validation and an independent test set method were used to evaluate the SVM classification models. For logS, the overall prediction accuracy is 87.1% for training set and 90.0% for test set. For logP, the overall prediction accuracy is 81.0% for training set and 82.0% for test set. In general, for both logS and logP, the prediction accuracies of three-class models are slightly lower by several percent than those of two-class models. A comparison between the performance of GA–CG–SVM models and that of GA–SVM models shows that the SVM parameter optimization has a significant impact on the quality of SVM classification model. Electronic supplementary material The online version of this article (doi:) contains supplementary material, which is available to authorized users. Hui Zhang and Ming-Li Xiang are contributed equally. 相似文献

11.

基于在线最小二乘支持向量机回归的混沌时间序列预测 总被引：31，自引：0，他引：31

下载免费PDF全文

叶美盈汪晓东张浩然《物理学报》2005,54(6):2568-2573

提出了一种基于在线最小二乘支持向量机（LS-SVM）回归的混沌时间序列的预测方法.与离线支持向量机相比，在线最小二乘支持向量机预测方法即使当混沌系统的参数随时间变化时仍然有效.以Chen's混沌系统、Rssler混沌系统、Hénon映射及脑电(EEG)信号四种混沌时间序列为例评估本文提出的预测方法，结果验证了其混沌时间序列预测的有效性. 关键词：混沌时间序列预测在线学习支持向量机相似文献

12.

ISG-FHEV等效燃油消耗最小控制策略

周祥宋璐付主木宋书中《应用声学》2016,24(4):83-86

针对室内复杂环境下火灾识别准确率会降低的问题,提出了一种改进的粒子群算法优化支持向量机参数进行火灾火焰识别的方法。首先在颜色空间进行火焰图像分割,对获得的火焰图像进行预处理并提取相关特征量;其次采用PSO算法搜索SVM的最优核参数和惩罚因子,并在PSO算法中加入变异操作和非线性动态调整惯性权值的方法,加快了搜索SVM最优参数的精度和速度;然后将提取的火焰各个特征量作为训练样本输入SVM模型进行训练,并建立参数优化后的SVM分类器模型;最后将待测试样本输入SVM模型进行分类识别。算法的火灾识别准确率达到94.09%,分类效果明显优于其他分类算法。仿真结果表明,改进的PSO优化SVM算法提高了火焰识别的准确率和实时性,算法的自适应性更强,误判率更低。相似文献

13.

长时语音特征在说话人识别技术上的应用 总被引：1，自引：0，他引：1

张建平李明索宏彬杨琳付强颜永红《声学学报》2010,35(2):267-269

本文除介绍常用的说话人识别技术外,主要论述了一种基于长时时频特征的说话人识别方法,对输入的语音首先进行VAD处理,得到干净的语音后,对其提取基本时频特征。在每一语音单元内把基频、共振峰、谐波等时频特征的轨迹用Legendre多项式拟合的方法提取出主要的拟合参数,再利用HLDA的技术进行特征降维,用高斯混合模型的均值超向量表示每句话音时频特征的统计信息。在NIST06说话人1side-1side说话人测试集中,取得了18.7%的等错率,与传统的基于MFCC特征的说话人系统进行融合,等错率从4.9%下降到了4.6%,获得了6%的相对等错率下降。相似文献

14.

近红外光谱结合化学计量学的常见中国蜂蜜掺杂糖浆鉴别

黄富荣宋晗郭鎏杨心浩李立群赵红霞杨懋勋《光谱学与光谱分析》2019,39(11):3560-3565

目前我国蜂蜜市场掺假现象严重,研究一种快速、准确的方法用于市场流通领域掺假蜂蜜的鉴别具有重要的现实意义。采用近红外光谱（NIR）结合化学计量学方法对常见的天然蜂蜜以及掺假（掺杂常见糖浆）蜂蜜进行建模识别,并比较偏最小二乘-判别分析（PLS-DA）及支持向量机（SVM）对糖浆掺假蜂蜜鉴别模型的影响。首先,采集来自中国10个省份、20种常见蜂蜜的112个天然纯蜂蜜样品,以及6种常见糖浆样品按不同糖浆含量（10%,20%,30%,40%,50%,60%）配制的112个掺假蜂蜜样品,共计224个样品;通过近红外光仪器扫描获得所有样品的近红外光谱数据（波长范围400~2 500 nm）;然后,分别采用一阶导数（FD)、二阶导数（SD）、多元散射校正（MSC)、标准正态变化(SNVT)四种方式对原始光谱进行预处理;再结合PLS-DA和SVM建立天然蜂蜜和糖浆掺假蜂蜜的鉴别模型,比较不同预处理方法对两种不同建模算法建立的蜂蜜掺假鉴别模型效果。其中SVM算法的惩罚参数c和核函数参数g通过网格搜索法（GS）、遗传算法（GA）、粒子群算法（PSO）三种寻优算法进行优化。分析结果表明：光谱数据进行预处理后所建立的模型准确率均有明显提升,而对于SVM模型,惩罚参数c和核函数参数g对模型准确率的提升效果要比光谱预处理带来的提升效果更明显。在PLS-DA算法中,经FD光谱预处理后建立的模型效果最好,最佳PLS-DA模型准确率为87.50%;在SVM算法中,经MSC预处理后,再通过GS寻优,获得惩罚参数c为3.0314,核函数参数g为0.3298的条件下所建立的模型效果最好,最佳SVM模型准确率为94.64%。由此可见,非线性的SVM算法结合NIR光谱数据所建立的天然蜂蜜与糖浆掺假蜂蜜鉴别模型要优于线性的PLS-DA模型,同时表明NIR光谱结合化学计量学方法对常见糖浆掺杂的中国蜂蜜鉴别是可行的。相似文献

15.

注意力机制融合前端网络中间层的语声情感识别

下载免费PDF全文

朱应俊周文君朱川马建敏《应用声学》2023,42(5):1090-1098

为了使机器能够更好地理解人的情感并改善人机交互体验,可对语声特征及分类网络进行融合以提升情感识别性能。本文从网络融合的角度,把基于梅尔倒谱系数和逆梅尔倒谱系数的二维卷积神经网络和基于散射卷积网络系数的长短期记忆网络作为前端网络,提取前端网络的中间层作为话语级的特征表示,利用压缩-激励(SE)通道注意力机制对前端网络的中间层的权重进行调整并融合,然后由深度神经网络后端分类器输出情感分类结果。在汉语情感数据集中进行五折交叉验证的对比实验,实验结果表明,基于SE通道注意力机制的网络融合方式可以有效地利用不同前端网络在语声情感识别任务中的优势,提高语声情感识别的准确率。相似文献

16.

A bio-inspired emotion recognition system under real-life conditions

Farah Chenchah Zied Lachiri 《Applied Acoustics》2017

相似文献

17.

支持向量机复合核函数的高光谱显微成像木材树种分类 总被引：1，自引：0，他引：1

赵鹏唐艳慧李振宇《光谱学与光谱分析》2019,39(12):3776-3782

采用体视显微高光谱成像方法,构建木材树种分类识别模型。利用SOC710VP体视显微高光谱图像采集系统获取可见光/近红外（372.53～1 038.57 nm）波段内的木材高光谱图像。首先,采用ENVI软件提取木材样本感兴趣区域（ROI）的平均光谱,分别采用连续投影算法（SPA）和竞争性自适应重加权算法(CARS)对光谱数据进行降维。再利用支持向量机（SVM）分别建立木材样本采集波段和特征波长下的分类模型。然后,在空间维采用第一主成分图像,计算基于灰度共生矩阵（GLCM）的木材纹理特征。在0°,45°,90°和135°四个方向计算能量、熵、惯性矩、相关性等16个特征参数后输入SVM进行木材树种分类处理。最后,采用四个复合核函数SVM进行光谱维和空间维的特征融合及分类识别。20个树种的分类实验结果表明,CARS的特征波长选择效果和运行速度较好一些,采用普通SVM进行木材光谱维特征分类处理时,测试集分类准确率达到了92.166 7%。采用基于GLCM的木材空间维纹理特征时,采用普通SVM的测试集分类准确率是60.333 0%,具有较低的分类精度。在将光谱维和空间维纹理特征进行数据融合及分类处理时,采用复合核函数SVM分类具有更好的效果。采用第二个复合核函数的SVM分类精度最高,测试集分类正确率是94.166 7%,运行时间为0.254 7 s。另外,采用第一个和第三个复合核函数的SVM的测试集分类准确率分别是93.333 3%和92.610 0%,运行时间分别为0.180 0和0.260 2 s。可以看出,采用这3种复合核函数的SVM进行木材树种分类,分类精度都高于采用普通SVM的光谱维或者空间维的分类识别精度。因此,利用体视显微高光谱成像和复合核函数SVM可以提高木材树种分类精度,为木材树种快速分类提供了参考。相似文献

18.

Multi-Stream Convolution-Recurrent Neural Networks Based on Attention Mechanism Fusion for Speech Emotion Recognition

Huawei Tao Lei Geng Shuai Shan Jingchao Mai Hongliang Fu 《Entropy (Basel, Switzerland)》2022,24(8)

The quality of feature extraction plays a significant role in the performance of speech emotion recognition. In order to extract discriminative, affect-salient features from speech signals and then improve the performance of speech emotion recognition, in this paper, a multi-stream convolution-recurrent neural network based on attention mechanism (MSCRNN-A) is proposed. Firstly, a multi-stream sub-branches full convolution network (MSFCN) based on AlexNet is presented to limit the loss of emotional information. In MSFCN, sub-branches are added behind each pooling layer to retain the features of different resolutions, different features from which are fused by adding. Secondly, the MSFCN and Bi-LSTM network are combined to form a hybrid network to extract speech emotion features for the purpose of supplying the temporal structure information of emotional features. Finally, a feature fusion model based on a multi-head attention mechanism is developed to achieve the best fusion features. The proposed method uses an attention mechanism to calculate the contribution degree of different network features, and thereafter realizes the adaptive fusion of different network features by weighting different network features. Aiming to restrain the gradient divergence of the network, different network features and fusion features are connected through shortcut connection to obtain fusion features for recognition. The experimental results on three conventional SER corpora, CASIA, EMODB, and SAVEE, show that our proposed method significantly improves the network recognition performance, with a recognition rate superior to most of the existing state-of-the-art methods. 相似文献

19.

A parallel chaotic sailfish optimization algorithm for estimation of DOA in wireless sensor array

《Physical Communication》2022

相似文献

20.

谱聚类结合LIF在矿井突水水源类型识别中的应用

周孟然宋红萍胡锋来文豪王锦国《光谱学与光谱分析》2021,41(2):435-440

突水事故威胁井下人员的生命安全和造成财产损失,因此准确检测出突水水源类型具有重大意义。使用水化学分析法检测水源类型耗时长、过程复杂。激光诱导荧光（LIF）技术具有快速、灵敏、干扰小等优点,将LIF技术结合智能算法建立突水水源识别模型可以准确检测出突水水源的类型。目前这类模型一般需要对荧光光谱进行去噪、降维、波段选取等处理,过程繁琐,并且模型都是在均匀分组的突水水源荧光光谱上建立的,并没有讨论不均匀分组对模型的影响,也没有针对不均匀分组建立模型。在实际工程应用中,采集的样本数量是有很大概率呈现不均匀的,因此本文提出一种飞蛾扑火（MFO）算法结合谱聚类（SC）的方法实现对不均匀分组的突水水源荧光光谱的识别。实验中,首先从淮南煤矿获取5种实验水样,使用激光诱导荧光实验设备采集所有水样的荧光光谱,五种水样的组数分别为75,80,80,30和135。其次,建立MFO-SC水样识别模型,通过对比后标签映射方式选择K-Means、相似矩阵的计算方式选择高斯核函数和划分准则选择ncut,用MFO对高斯核函数的参数寻优得到σ的值为1.745并且固定模型的初始聚类中心。随后,分别建立K-Means,SVM和MFO-SVM3种水样识别模型。对比MFO-SC模型与K-Means模型,得到MFO-SC模型的最优准确率为100%且平均准确率也为100%,K-Means模型的最优准确率为99.75%,而平均准确率为79.57%;再分别计算SVM模型和MFO-SVM模型的训练集准确率和测试集准确率,SVM模型训练集准确率为80%,测试集准确率为80%;MFO-SVM模型训练集准确率为100%,测试集准确率为95.625%。最后,使用4种模型对其他三个不均匀分组的突水水源荧光光谱进行识别,研究结果表明将MFO-SC算法用于突水水源类型的识别上是有效的,可以准确地检测出突水水源的类型,对煤矿生产安全有重要意义。相似文献