期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李海烽张雪英段淑斐贾海蓉李良琦《复旦学报(自然科学版)》2023,(1):37-45

为研究广东话、客家话、潮州话和普通话的发音差异性，提出了一种基于发音特征的方言识别系统。本研究采用DKU-JNU-EMA数据库，以广东话、客家话、潮州话和普通话为研究对象，通过端点检测法实现对数据集的预处理，提取了数据集中发音器官的位移、速度和加速度参数，并对发音运动器官进行了空间和速度的统计学分析，然后选用随机森林和支持向量机分类器对所取的提特征集进行识别分类。实验结果表明，本文提取的发音特征在机器学习分类器的识别分类中是有效的，选用支持向量机做分类器时，在齿龈位置的分类平均准确率达到83.1%。相似文献

2.

自动物种识别中基于时频谱图形状的声学部件检测

白伟段淑斐《太原理工大学学报》2015,(2):176-182

概述了声音的自动物种识别在环境监测中发挥的重要的作用,创新性地利用时频谱图将可听的声音信号转换为可视的图像信号,并定义了构成动物叫声结构的基础声学部件。从图像处理的角度出发,设计了3种基于时频谱图形状检测声学部件warble,stacked harmonic和oscillation的算法;通过母考拉的叫声结构详细阐述这3种算法,并将这3种算法的识别结果与Raven和Song Scope进行了比较。实验结果表明,相较于Raven和Song Scope,本文设计的3种算法在识别精度上提高了10%。相似文献

3.

普通话多模态情感语音数据库构建与评测

李良琦张雪英段淑斐肖仲喆贾海蓉梁慧芝《复旦学报(自然科学版)》2024,(1):18-31

本文设计并建立了一个包含发音运动学、声学、声门和面部微表情的多模态情感语音汉语普通话数据库,分别从语料设计、被试选择、录制细节和数据处理等环节进行了详细的描述,其中信号被标记为离散情感标签(中性、愉悦、高兴、冷漠、愤怒、忧伤、悲痛)和维度情感标签(愉悦度、激活度、优势度)。本文对维度标注的数据进行统计学分析,验证标注的有效性,同时验证标注者的SCL-90量表数据并与PAD标注数据结合后进行分析,探究标注中存在的离群现象与标注者心理状况之间的内在联系。为验证该数据库的语音质量和情感区分度,本文使用SVM、CNN、DNN3种基础模型计算了7种情感的识别率。结果显示,单独使用声学数据时7种情感的平均识别率达到了82.56%;单独使用声门数据时平均识别率达到了72.51%;单独使用运动学数据时平均识别率也达到了55.67%。因此,该数据库具有较高的质量,能够作为语音分析研究的重要来源,尤其是多模态情感语音分析的任务。相似文献

4.

一种利用多参数进行实时语音边界检测与音节分割算法

段淑斐《太原理工大学学报》2009,40(5)

在对语音信号5种特征参数:短时能量、平均过零率、相对能频比、相对能频积、短时自相关函数语音分段效果详细对比的基础上,提出了利用多参数结合进行语音边界检测与音节分割.同时较之当前主流一帧20 ms的处理方式,提出以2.5 ms为一帧处理,确保在20 ms内检测到信号边界,缩小了搜索时间,提高了实时性. 相似文献

5.

基于发音空间特征的构音障碍患者的病情分级

段淑斐王俊芹 DINGAM Camille 张雪英孙颖《复旦学报(自然科学版)》2021,60(3):288-296

现有的较多对运动性构音障碍病理语音的研究是以声学特征为条件来进行的,而对发音运动空间的研究较少,且数据库中普遍缺乏病患的发音及语音数据.本文基于多伦多大学开发的TORGO数据库,对比分析了构音障碍患者与正常人、不同病情程度的构音障碍患者之间在发音运动空间上的差异,提取发音空间特征,对构音障碍患者进行病情分级,为医学上诊... 相似文献