首页 | 本学科首页   官方微博 | 高级检索  
     

语音数据特征聚类分析
作者姓名:丰天韵  阮俊豪  王卓琛
作者单位:1. 武汉邮电科学研究院;2. 南京烽火天地通信科技有限公司
摘    要:由于语音的复杂与多变,传统声学方法并不能很好地提取出语音的公共特征,容易受到训练数据中说话人发声特点差异的影响,造成模型的不稳定并影响其精度。针对这一问题,文章提出利用语音特征的聚类中心替代原语音特征进行BERT模型预训练的方法,通过与普通BERT模型对比在自动语音识别(Automatic Speech Recognition,ASR)下游任务的表现,证明了对语音特征进行的聚类操作在聚类中心数量合适的情况下,聚类后的BERT模型拥有更好地下游任务契合度,聚类中心数量为100的预训练模型错词率比普通预训练模型降低了2.32%。

关 键 词:预训练  BERT  特征聚类  表征学习  无监督训练
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号