融合MPEG-7和声门特征的病理嗓音识别方法研究 |
| |
引用本文: | 朱欣程,伍远博,赵登煌,张晓俊,陶 智.融合MPEG-7和声门特征的病理嗓音识别方法研究[J].电子器件,2022,45(3):587-592. |
| |
作者姓名: | 朱欣程 伍远博 赵登煌 张晓俊 陶 智 |
| |
作者单位: | 苏州大学光电科学与工程学院 |
| |
基金项目: | 国家自然科学基金项目(61271359),教育部光电教指分委教育教学研究项目(gdyljs52),苏州大学高等教育教改研究课题(5731503920) |
| |
摘 要: | 本文提出了一种融合多媒体内容描述接口(MPEG-7)和声门特征的病理嗓音识别方法,以更细致地表征病理嗓音与健康嗓音之间的差异度,提高病理嗓音识别率。首先将声门特征与MPEG-7特征进行融合,随后通过贝叶斯网络、BP神经网络、逻辑回归、支持向量机、局部加权线性回归五种机器学习方法进行识别实验。采用DSP芯片TMS320VC5509A为核心实现该方案。采用MEEI数据库中的正常嗓音和病理嗓音进行十折交叉验证实验,实验结果表明,MFCC、LPCC和MPEG-7融合声门特征的平均识别率分别比融合前分别提高了2.87%、1.78%和0.6%。其中,融合MPEG-7和声门特征在支持向量机方法下性能最优,能达到100%的识别率。
|
关 键 词: | 特征提取 声门逆滤波 融合特征 MPEG-7 病理嗓音 |
|
| 点击此处可从《电子器件》浏览原始摘要信息 |
| 点击此处可从《电子器件》下载免费的PDF全文 |
|