首页 | 本学科首页   官方微博 | 高级检索  
     

融合注意力机制轻量级网络的语音情感识别*
作者姓名:冀常鹏  佟婷婷  代巍
作者单位:辽宁工程技术大学,辽宁工程技术大学电子与信息工程学院,辽宁工程技术大学电子与信息工程学院
基金项目:辽宁省科技厅项目(2019-ZD-0038)
摘    要:在语音情感识别过程中,为解决缺乏方言数据库、识别模型准确率低等问题,建立辽西方言语音情感数据库,并提出一种融合注意力机制轻量级网络的语音情感识别模型。模型由特征组合网络、CBAM注意力机制、深度卷积网络及输出层四部分组成。利用三个大小不同的并行卷积提取浅层语音特征并进行拼接;引入CBAM注意力模块将空间特征与通道特征融合;融合后的特征输入深度卷积网络,提取语音深层次特征,输出多维特征向量;输出层对语音进行情感分类识别。模型在IEMOCAP、Emo-DB和自建辽西语音情感数据库上验证,分别取得82.5%、96.2%和90.8%的准确率。实验结果表明,与其他深度学习的模型相比,本文提出的模型在参数量更少的同时识别率更高。

关 键 词:语音情感识别  辽西方言  深度学习  轻量级
收稿时间:2023-03-24
修稿时间:2024-07-02
点击此处可从《应用声学》浏览原始摘要信息
点击此处可从《应用声学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号