首页 | 本学科首页   官方微博 | 高级检索  
     

面向风格多样化的多对多语音情感转换
作者姓名:周健  罗翔宇  王华彬  郑文明  陶亮
作者单位:1.安徽大学计算智能与信号处理教育部重点实验室 合肥 230601;2.东南大学儿童发展与学习科学教育部重点实验室 南京 210096
基金项目:国家自然科学基金 ( U2003207 );国家自然科学基金 ( 61902064 )
摘    要:针对现有基于生成对抗网络的语音情感转换仍然存在情感分离不明显,且转换后的语音情感缺乏多样性问题,提出了一种面向风格多样化的多对多语音情感转换方法。该方法基于一个双生成器结构的生成对抗网络模型,通过对不同生成器的中间编码进行一致性损失约束确保语音内容和说话人特征具有一致性,以提升转换后语音情感与目标情感的相似性。此外,该方法通过情感映射网络和情感特征编码器为生成器提供同类情感的多样化情感表征。实验结果表明,所提情感语音转换方法得到的语音情感更接近目标情感,且情感样式更加丰富。

关 键 词:情感语音转换  风格多样化  生成对抗网络  情感编码  
本文献已被 万方数据 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号