首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
基于标准语音的识别系统在识别带有发音变异的口语语料时,识别率较低。针对这一问题,提出了一种在标准维吾尔语发音字典的基础上生成多发音字典的方法。采用基于专家经验和数据驱动相结合的方法分析了维吾尔语方言口音发音变异规则,构造发音变异集合,生成初始的多发音字典,并运用了自动数据处理算法和门限阈值法,使得能够从方言口音训练语音数据中自动获得精简的多发音字典。实验结果表明:该方法对维吾尔语方言口音的识别性能有提升作用。  相似文献   

2.
维语口语发音中很多音素相对标准语产生了发音变异,基于标准语音的识别系统在识别带有发音变异的口语语料时识别率较低。该文针对维吾尔语同化、弱化、脱落、元音和谐等语流音变难点进行分析,对语音、韵律特性进行知识融合与技术创新,运用基于数据驱动和基于专家经验相结合的方法对维吾尔语方言口语中存在的发音变异现象进行研究,统计元音、辅音多发音变化映射对,建立音素混淆矩阵,为维吾尔语方言口语语音识别研究奠定基础。  相似文献   

3.
设想一套汉语方言语音识别系统。该系统将具有声、韵、调自动识别,中古声母、韵母、声调以及声母开齐合撮检索,同音和有音无字词检索,轻声、连读变调识别和文白异读识别等5个功能,汉语方言识别系统的构建将提高汉语方言研究的工作效率。  相似文献   

4.
针对发音偏误检测系统语音标注费时、费力和标注不一致的问题, 基于发音特征, 构建偏误检测系统, 给出Top-N的识别结果, 通过praat软件呈现机器初步标注文本, 在此基础上进行人工二次标注。实验结果表明, 与单纯的人工标注相比, 所提出的自动标注加人工二次标注方法在标注一致性上从80.7%提高到92.48%, 平均每个句子的标注时间从10分钟减少到3分钟。所提方法有效地提高了人工标注的效率, 可以在有限时间内为识别系统提供更多可靠的标注语料。  相似文献   

5.
为了提升计算机辅助发音训练(CAPT)系统中发音偏误趋势(PET)的检测效果,确保反馈信息的准确性与有效性,提出一种基于对数似然比的发音特征方法。该方法将多个基于深度神经网络的发音特征提取器用于生成帧级别的对数似然比,然后将对数似然比组成的发音特征用于PET的检测,为学习者提供发音位置和发音方法的正音信息。实验结果表明,发音特征对PET的检测效果优于常用声学特征(MFCC,PLP和f Bank),当发音特征与MFCC特征相结合时,可以进一步提升性能,达到错误接受率为5.0%,错误拒绝率为30.8%,诊断正确率为89.8%的检测效果。  相似文献   

6.
任何人在学习一门外语时,总是会受到母语或是方言的影响。荆沙方言在语音系统上与英语有很多不同,因此学习者在英语发音上或多或少受到方言的影响。其主要表现在元音及辅音两方面。元音主要表现在/i/,/u/,/Λ/以及二合元音/aun/。辅音主要表现在/n/和/η/,/l/和/n/,/v/和/w/,/f/与/h/等音位上。当然,在语音语调方面也有影响。  相似文献   

7.
将深层神经网络(Deep Neural Network)应用于汉语方言种属语音识别.基于优化的QuickNet软件,为方言识别实现了一种有监督的DNN逐层预训练方法.在训练时,从3层开始逐层做有监督的神经网络训练,每增长一层的初始权值包含前一层训练好的部分权值和输出端的随机权值.在得到最大层的初始权值后,再进行传统的BP网络训练.该方法和普通神经网络相比识别率有较大提升,可用于移动互联网标准语音识别人口、方言口音鉴识等领域.  相似文献   

8.
顾明亮 《广西科学》2007,14(4):423-425
将声学特征与韵律特征相结合,提出一种新的混合区间特征,并将该特征和常见的美尔倒谱系数(MFCC)特征与线性预测倒谱系数(LPCC)特征进行对比,通过符号化语言辨识方法对北方方言、吴方言、粤方言和闽方言进行辨识,以验证混合区间特征的有效性。结果表明,混合区间特征比MFCC特征和LPCC特征具有更好的方言辨识效果,对4种汉语方言15s语音片段的方言辨识率可以达到92%。4种方言中,混合区间特征对闽方言和粤方言的识别率最高,分别达到了96%和95%。  相似文献   

9.
10.
方言机器识别技术研究   总被引:1,自引:0,他引:1  
本文旨在讨论如何将方言学与计算机科学结合起来,根据录音材料,实现话语者方言特征机器识别、以迅速判断话语者所出方域,推进侦破工作的现代化。  相似文献   

11.
基于小数据量的方言普通话语音识别声学建模   总被引:1,自引:0,他引:1  
为在少量数据情况下显著提高方言普通话的识别率,针对标准普通话和方言普通话之间发音差异是连续变化的特点,在少量方言普通话的基础上,提出了基于距离度量的识别基元扩展方法,并将扩展基元与状态相关的基于基元的模型归并方法相结合.采用1 h的上海普通话数据作为开发集,用本方法,使音节错误率降低了17.3%. 另外与自适应方法的结合使用,还可以将音节错误率再降低6.6%, 这比单纯应用自适应方法错误率多降低了5.4%.  相似文献   

12.
基于音素的发音质量评价算法   总被引:6,自引:0,他引:6  
面对广大的外语学习者,计算机辅助语言学习系统已经成为一种最佳的口语学习方式。该文提出了一种新的应用于计算机辅助语言学习系统的面向英语学习人群的发音质量评价算法,名为PASS(phone-basedautomaticscoreforl2speechquality)。PASS算法以基于隐含Markov模型的语音识别和口音自适应技术为基础,考察了音素发音的准确性和流利性信息,定义了音素级的发音质量分数,从而可以综合得到整句的评分结果。在实验室自行采集和精细标注的非母语语音库上与其他评分算法进行比较实验,PASS与专家评分的句子级相关性达到了0.66,优于其他算法。目前PASS算法已经被成功地应用于清华大学出版社的互动式语言学习系统中。  相似文献   

13.
肖瑞珠 《科技信息》2010,(21):I0293-I0293,I0417
本文介绍老湘方言的一般特征及其对英语发音的影响,同时针对这些“负迁移”提出了一些应对的教学策略。  相似文献   

14.
汉语作为我们的母语,与日常生活联系密切。由于汉语的深入人心,一些人的汉语发音习惯或多或少的影响着他们的英语发音。本文列举了教学过程中遇到的几种错误发音,阐述了汉语发音对英语发音产生的影响。使人们在发现问题的基础上,有针对性地纠正英语发音,力求实现发音的纯正。  相似文献   

15.
面向情感变化检测的汉语情感语音数据库   总被引:3,自引:0,他引:3  
该文介绍了面向普通话情感变化检测的情感语音数据库CESD。该数据库的语音以对话形式录制,包括男女声情感对话语音1 200段。以生气、着急、中性、愉悦、高兴为基本情感,共包含20种情感变化模式。除语音文件外,还包含带有静音段/有效语音段、情感类别、情感变化段、情感质量等内容的标注文件。为了使更多的研究人员可以使用该数据库,利用P raat工具提取出67维常用声学特征,作为特征文件一同存储在该数据库中。对该数据库进行主观评价和情感变化检测的结果表明:语音情感状态自然、情感变化真实,能够满足语音情感识别和语音情感变化检测研究的双重需求。  相似文献   

16.
文章提出了一个可以同时面向语音识别和说话人识别的汉语语音数据库,并对该语音数据库的录音方案、录音内容以及标注与存储设计作了详细说明,并部分实现了语音特征的分析功能.  相似文献   

17.
魏圆圆 《科技信息》2013,(16):198-198
当前,无论是哪一个阶段的学习活动,对于英语都非常重视。作为一门语言,我们进行英语教学的最终目的是为了加强中国在世界范围内学术间的融合,促进民族文化与世界文明之间的相互渗透。但由于汉语与英语属于不同的语系,我们在后天学习英语的过程中,自然会在语调、节奏、重音、停顿等方面受到母语的影响,进而影响学生的英语发音,影响学生使用英语进行交流交际的能力提升。本文就江苏各地方方言对于英语发音的影响展开论述,并提出了几点对策。  相似文献   

18.
本文研究发音人识别特征参量的选择和提取,探讨参量选择的原则,提出一种混合特征矢量,并以时间域规正法规正语音长短。  相似文献   

19.
宁武县位于山西省北中部,宁武方言属晋方言五台片。文章对宁武方言全面布点调查后,将宁武方言细分为十二腔,并从声母、韵母、声调三个方面整理出宁武方言内部语音特征共9条,简单介绍各特征在山西省境内的大致分布范围,以及相关语音现象在山西省境内的不同表现形式。最终认为宁武方言作为晋方言五台片的一个方言点,其一致性特征在整个山西方言框架里,并不是孤立的。  相似文献   

20.
为了在语种识别时充分利用人的听感知特性提高识别性能,提出了一种基于听感知模型的特征。听感知特征采用Gammatone滤波器组代替常用的三角滤波器组计算语音信号各子带能量;根据等效矩形带宽模型,确定各滤波器的中心频率与带宽;使用反置等响度曲线模拟人耳对信号不同频率成分的主观响度感受。在基本听感知特征的基础上,还提出了一、二阶差分特征和偏移差分特征用于语种识别。对比实验表明,该文所提的听感知特征性能均优于目前普遍使用的Mel频率倒谱系数(MFCC)特征及其衍生特征。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号