首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   5篇
  免费   0篇
综合类   5篇
  2024年   1篇
  2023年   1篇
  2021年   1篇
  2015年   1篇
  2009年   1篇
排序方式: 共有5条查询结果,搜索用时 31 毫秒
1
1.
为研究广东话、客家话、潮州话和普通话的发音差异性,提出了一种基于发音特征的方言识别系统。本研究采用DKU-JNU-EMA数据库,以广东话、客家话、潮州话和普通话为研究对象,通过端点检测法实现对数据集的预处理,提取了数据集中发音器官的位移、速度和加速度参数,并对发音运动器官进行了空间和速度的统计学分析,然后选用随机森林和支持向量机分类器对所取的提特征集进行识别分类。实验结果表明,本文提取的发音特征在机器学习分类器的识别分类中是有效的,选用支持向量机做分类器时,在齿龈位置的分类平均准确率达到83.1%。  相似文献   
2.
概述了声音的自动物种识别在环境监测中发挥的重要的作用,创新性地利用时频谱图将可听的声音信号转换为可视的图像信号,并定义了构成动物叫声结构的基础声学部件。从图像处理的角度出发,设计了3种基于时频谱图形状检测声学部件warble,stacked harmonic和oscillation的算法;通过母考拉的叫声结构详细阐述这3种算法,并将这3种算法的识别结果与Raven和Song Scope进行了比较。实验结果表明,相较于Raven和Song Scope,本文设计的3种算法在识别精度上提高了10%。  相似文献   
3.
本文设计并建立了一个包含发音运动学、声学、声门和面部微表情的多模态情感语音汉语普通话数据库,分别从语料设计、被试选择、录制细节和数据处理等环节进行了详细的描述,其中信号被标记为离散情感标签(中性、愉悦、高兴、冷漠、愤怒、忧伤、悲痛)和维度情感标签(愉悦度、激活度、优势度)。本文对维度标注的数据进行统计学分析,验证标注的有效性,同时验证标注者的SCL-90量表数据并与PAD标注数据结合后进行分析,探究标注中存在的离群现象与标注者心理状况之间的内在联系。为验证该数据库的语音质量和情感区分度,本文使用SVM、CNN、DNN3种基础模型计算了7种情感的识别率。结果显示,单独使用声学数据时7种情感的平均识别率达到了82.56%;单独使用声门数据时平均识别率达到了72.51%;单独使用运动学数据时平均识别率也达到了55.67%。因此,该数据库具有较高的质量,能够作为语音分析研究的重要来源,尤其是多模态情感语音分析的任务。  相似文献   
4.
在对语音信号5种特征参数:短时能量、平均过零率、相对能频比、相对能频积、短时自相关函数语音分段效果详细对比的基础上,提出了利用多参数结合进行语音边界检测与音节分割.同时较之当前主流一帧20 ms的处理方式,提出以2.5 ms为一帧处理,确保在20 ms内检测到信号边界,缩小了搜索时间,提高了实时性.  相似文献   
5.
现有的较多对运动性构音障碍病理语音的研究是以声学特征为条件来进行的,而对发音运动空间的研究较少,且数据库中普遍缺乏病患的发音及语音数据.本文基于多伦多大学开发的TORGO数据库,对比分析了构音障碍患者与正常人、不同病情程度的构音障碍患者之间在发音运动空间上的差异,提取发音空间特征,对构音障碍患者进行病情分级,为医学上诊...  相似文献   
1
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号