首页 | 本学科首页   官方微博 | 高级检索  
     

用于说话人识别的密集多分支时延神经网络
作者姓名:和椿皓  常铁原  潘立冬
作者单位:河北大学电子信息工程学院,河北大学电子信息工程学院,河北大学电子信息工程学院
摘    要:时延神经网络是较早应用于说话人识别领域的一类神经网络。为实现更好的识别性能,近年来一些改进工作围绕加深或拓宽其网络结构进行。在对密集连接卷积网络以及多分支网络结构进行研究的基础上,提出一种密集多分支时延神经网络,用以进一步提升小体积模型对说话人特征的提取能力。在使用密集连接实现特征重用的基础上,并行多分支结构能同时对同一输入在不同分辨率下进行特征提取。在VoxCeleb1测试集、VoxCeleb1-H、VoxCeleb1-E上进行测试表明,该网络能在模型参数量较小的前提下实现准确的说话人识别,以便应用在一些存储空间受限的本地说话人识别场景中。

关 键 词:说话人识别  时延神经网络  多分支神经网络  密集连接  深度学习
收稿时间:2023-05-15
修稿时间:2024-09-04
点击此处可从《应用声学》浏览原始摘要信息
点击此处可从《应用声学》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号