融合注意力机制轻量级网络的语音情感识别* |
| |
作者姓名: | 冀常鹏 佟婷婷 代巍 |
| |
作者单位: | 辽宁工程技术大学,辽宁工程技术大学电子与信息工程学院,辽宁工程技术大学电子与信息工程学院 |
| |
基金项目: | 辽宁省科技厅项目(2019-ZD-0038) |
| |
摘 要: | 在语音情感识别过程中,为解决缺乏方言数据库、识别模型准确率低等问题,建立辽西方言语音情感数据库,并提出一种融合注意力机制轻量级网络的语音情感识别模型。模型由特征组合网络、CBAM注意力机制、深度卷积网络及输出层四部分组成。利用三个大小不同的并行卷积提取浅层语音特征并进行拼接;引入CBAM注意力模块将空间特征与通道特征融合;融合后的特征输入深度卷积网络,提取语音深层次特征,输出多维特征向量;输出层对语音进行情感分类识别。模型在IEMOCAP、Emo-DB和自建辽西语音情感数据库上验证,分别取得82.5%、96.2%和90.8%的准确率。实验结果表明,与其他深度学习的模型相比,本文提出的模型在参数量更少的同时识别率更高。
|
关 键 词: | 语音情感识别 辽西方言 深度学习 轻量级 |
收稿时间: | 2023-03-24 |
修稿时间: | 2024-07-02 |
|
| 点击此处可从《应用声学》浏览原始摘要信息 |
|
点击此处可从《应用声学》下载免费的PDF全文 |
|