首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 218 毫秒
1.
汉语综合资料库的设计   总被引:1,自引:0,他引:1       下载免费PDF全文
语言是人类最重要的交际工具,随着现代信息技术的发展,语言也是人与机器之间交际的有效工具.近年来世界各国纷纷建立本国的言语资料库作为言语科学研究和言语技术开发的基础.汉语综合资料库的语音材料有:汉语全部有调音节、数字串、单词、韵律特征材料,以及语言清晰度试验用音节表、词表、句表和有代表性的短文等.汉语综合资料库在语言学和语音学特征以及声学特征方面充分体现汉语的基本特点.首先要解决语料选取问题,考虑各种语言单位的使用频率,不仅要包括全部高频词,也要反映较全面的语音现象.数据库在结构上是开放的模块式的,同时配有灵活的数据库管理系统.  相似文献   

2.
基于网格维数的汉语语音分形特征研究   总被引:4,自引:1,他引:3  
应用分形理论来研究汉语语音信号的分形特征。木文首先在传统盘维数基础上提出了一种等差尺度网格维数算法来快速计算语音信号的分维数;在此基础上,对汉语男女声的21种声母和38种韵母语音信号的分维数进行了计算和统计分析,得到了汉语语音分维数的统计分布规律。本文实验结果表明,汉语语音信号具有分形标度不变性,网格维数能够反映语音信号波形的复杂程度。  相似文献   

3.
基于连续高斯混合密度HMM的汉语全音节语音识别研究   总被引:5,自引:0,他引:5  
本文在大量语音分析实验的基础上,对HMM用于汉语全音节语音识别进行了较为深入的探讨,建立了一个连续高斯混合密度HMM的汉语全音节语音识别系统.该系统在训练算法上撇开了传统的Baum-Welch算法,代之以计算复杂度小、存储量小、迭代次数少且具有自动分割效应的分段K平均算法。对于HMM的模型单元的选择,单元的结构以及模型参数的选取,充分考虑了汉语语音的特点;并在语音特征上做了深入的实验分析工作,采用了符合人耳听觉特性的Mel-Scaled参数,用FFT倒谱代替了LPC倒谱,同时利用了语音的动态谱特征和能量特征。另外,本文还针对汉语声母的特点,独特地提出了变帧移分析策略。整个识别系统的首选正识率为91.1%.  相似文献   

4.
汉语听觉视觉双模态数据库CAVSR1.0   总被引:8,自引:0,他引:8  
听觉视觉双模态语音识别在国际上已经逐渐成为当前语音识别的热点之一,汉语的双模态识别研究也已开始启动。然而,由于视觉信息获取及处理难度极大,目前的双模态语音数据库的建设尚显薄弱,汉语方面更是空白。鉴于此,我们在进行听觉视觉双模态语音识别关键技术研究的同时,在分析国外同类数据库的结构的基础上,结合汉语语音的特点,建立了汉语语音的第一个双模态数据库CAVSR1.0。它具有如下特点:采用的语料涵盖所有声韵母,其规模(总数据量、音节量)超出目前国际上同类数据库;语料分布符合汉语声韵母的实际分布概率,因此其反映的规律具有代表性;捆绑了自动音节分割程序及脸部主要特征标定程序,使数据库具有很强的可扩展性。  相似文献   

5.
汉语语音的非线性动力学特征及其降噪应用   总被引:4,自引:0,他引:4  
分析了汉语语音的相关维、最小嵌入维数以及重构相图。分析结果表明汉语语音具有混沌特征。根据这些非线性特征可以有效区分汉语中的浊音、清音和随机噪声,从而可以用于语音降噪。介绍了本地投影法混沌语音降噪的原理与算法,并利用该算法对一些典型的元音和辅音进行降噪,获得了较好的降噪效果。  相似文献   

6.
汉语普通话区别特征系统   总被引:3,自引:2,他引:1  
张家騄 《声学学报》2005,30(6):506-514
语音区别特征是构成语音信号的基本元素。它不但是语音学和音系学研究的重要内容,也是语音信号处理技术所面对的重要处理对象。本文首先根据汉语普通话语音知觉混淆的群集分析结果,确定汉语的声韵调音位系统。继而按照Jakobson,Fant和Halle的语音区别特征划分的二分法原理,以声学参数为基础结合普通话的特点,建立了声韵调体系的区别特征系统。文中给出了区别特征在声学上的定义和发音生理上的说明。为便于理解声母韵母音位与其区别特征之间的关系和在语音处理中的应用,在附录中还列出了普通话声母(包括变体)、韵母的国际音标和计算机可输入/输出的SAMPA音标,以及声调的SAMPROSA音标。  相似文献   

7.
中国科学院声学研究所建立了一个汉语普通话语音数据库,这个语音数据库由声母、韵母、1282个单音节、几百个双音词和三音词、语音试验句、短文及数字0—9等构成。该语音数据库的发音人有六位(三男三女),他们是广播学院的教师和职业播音员,讲标准的汉语普通话。语音材料录制在高质量的磁带上,其中有一部分已数字化。已有许多汉语语音研究部门使用该语音数据库。  相似文献   

8.
汉语普通话双基频检测   总被引:1,自引:0,他引:1  
鉴于传统方法在语音双基频检测方面的局限性,本文提出了汉语双基频检测(DDPM)的方法.该方法利用混合汉语语音在短时帧之内的准周期性,经搜索得到每一帧内的双基频候选点,再根据正常情况下人的发音在相邻帧内基频不产生突变的特点,实现了双基频检测.应用此方法,在纯净与加噪的情形下,对汉语四种声调单音节的各种组合分别进行了检测实验,检测效果十分理想.新方法也可以直接应用到连续语音双基频的检测.  相似文献   

9.
基于发音特征的汉语普通话语音声学建模   总被引:3,自引:0,他引:3  
将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概率作为语音识别的输入特征建立声学模型。在汉语普通话非特定人大词表自然口语对话识别系统中进行了实验验证,并与基于频谱特征的声学模型进行了比较,在相同解码速度下,由此方法建立的声学模型汉字错误率相对下降6.8%;将发音特征和频谱特征进行了融合实验,融合以后的识别系统相对基于频谱特征系统的汉字错误率相对下降10.1%。上述结果表明,基于发音特征的声学模型更加有效的实现了对语音特性的表征,通过利用发音特征和频谱特征的互补性,能够进一步实现对语音识别性能的提高。   相似文献   

10.
本项研究从实际语音材料出发,运用曲线拟合和矢量量化的方法,对汉语双音节调位的模型进行了系统地研究。研究结果表明;(1)利用曲线拟合和矢量量化技术对汉语双字词声调组合进行模式归类是一种可行和有效的方法。(2)虽然在部分声调组合中不同样品间的离散比较小,但大部分双音节词的声调组合模式可以分为几个子类,因此用一个总体平均的统计模式是不够的.(3)音高曲线的差异明显表现为声调高音点的不同,它是与双字词的音节重音模式相关联的。  相似文献   

11.
基于主成分分析的汉语连续语音切分算法   总被引:1,自引:0,他引:1       下载免费PDF全文
张永锋  杨影  肖莹莹 《应用声学》2011,30(5):366-369
连续语音切分是汉语连续语音识别中的一项重要技术。本文将通常用于图像处理的主成分分析(PCA)方法引入汉语连续语音切分领域,目的是通过PCA,降低语音帧之间的频谱相关性。再利用相邻语音帧特征构成的三维子空间的大小,实现连续语音切分,取得了不错的切分效果。  相似文献   

12.
汉语孤立字全音节实时识别系统   总被引:1,自引:0,他引:1  
本文在大量语音实验的基础上,对汉语语音识别方法进行了较为深入的探讨,并以IBMPC/AT配以自行研制开发的TMS320C25-E型高速信号处理板为硬件基础,建立了一个特定人汉语普通话全音节实时识别系统.该系统针对汉语普通话的语音特点,采用了分层识别策略.整个系统响应时间小于0.2秒,用4遍1240个全音节语音对系统进行的严格测试表明:系统四声识别的平均正确率为99%左右,音节识别前5个候选的正确识别率分别为82%,91%,94%,96%,97%;同时,本文根据这一测试结果建立了相应的声韵母混淆矩阵和基于Shepard方法的相似度集群分析树图,并对照汉语语音合成清晰度测试结果及汉语语音知觉结构的集群分析结果,对本系统各部分进行了较为深入的分析,提出了相应的改进措施.  相似文献   

13.
汉语音节音联感知特性研究   总被引:1,自引:0,他引:1  
汉语音联可分为:闭音联、音节音联、节奏音联和停顿音联等四级,其中团音朕最强、音节音联次之,另外两种音联较弱。在以音节为基本单元的汉语合成系统中,闭音联已保留在语音库中,因此需要着重考虑的是音节音联。本文以服务于汉语文语转换系统为目的,通过两个阶段的感知实验,研究了汉语音节音联在听觉感知中的作用。得到以下结论:①从总体上看,听音人对汉语双音节词中音高模式的变化的感知比较灵敏,而对音节间共振峰过波段的感知不灵敏,共振峰过波段对合成语音的自然度的影响不显著。②有语音学知识背景的专家或专业人员在判别合成语音的自然度时,比普通听音人更注意音节间的共振峰过渡。但即使是专家,也不容易判别在合成语音中音节间是否包含了共振蜂的平滑过渡。③双音节调的语音结构对音节间共振峰过渡的感知有影响。双音节词的声调组合对它也有一定影响。  相似文献   

14.
汉语耳语音孤立字识别研究   总被引:6,自引:0,他引:6       下载免费PDF全文
杨莉莉  林玮  徐柏龄 《应用声学》2006,25(3):187-192
耳语音识别有着广泛的应用前景,是一个全新的课题.但是由于耳语音本身的特点,如声级低、没有基频等,给耳语音识别研究带来了困难.本文根据耳语音信号发音模型,结合耳语音的声学特性,建立了一个汉语耳语音孤立字识别系统.由于耳语音信噪比低,必须对其进行语音增强处理,同时在识别系统中应用声调信息提高了识别性能.实验结果说明了MFCC结合幅值包络可作为汉语耳语音自动识别的特征参数,在小字库内用HMM模型识别得出的识别率为90.4%.  相似文献   

15.
汉语塞音选择性特征自动萃取的小波变换方法   总被引:1,自引:0,他引:1  
本文提出了汉语语音导引特征的概念,讨论了语音导引特征在自动语音识别中用于导引匹配搜索的运用方式和重要作用;提出并设计了汉语塞音选择性特征自动萃取的小波变换方法和数字信号处理算法。本文方法和算法从声学信号处理和检测的角度,将汉语清辅音声波输入信号自动分为塞音子集BDG:{b,d,g}、塞音子集ZZHJGPTcCHQK:{z,zh,j,g,p,t,c,ch,q,k}和擦音集FsSHhX:{f,s,sh,x,h};对输入的合清辅音的音节,计算检测并输出汉语自动语音识别系统可以利用的清辅音类属标记b.d.g、STOP/BD和f.s.sh.x.h以及它们的音段起始时标;从声学信息计算检测的角度为汉语自动语音识别系统提供一种新的“从粗到细”的辅助匹配结构。算法可用性模拟实验采用实际语音的数据库数据,以手工标注信息作为自动检测分类正确与否的对比标准。对1267个汉语全音节中,总数913个待分类清辅音的初步分类结果表明:正确分类率分别为b.d.g:96.1%,STOP/BD:95.1%和f.s.sh.x.h:89.0%,总体平均正确分类率为93.6%。  相似文献   

16.
汉语普通话区别特征系统树状图   总被引:9,自引:2,他引:7  
张家騄 《声学学报》2006,31(3):193-198
本文是“汉语普通话区别特征系统”的继续与发展。文中对汉语区别特征的定义及其在语音中的具体的物理的和心理的体现作了进一步的说明。对汉语普通话区别特征表进行了修订。对发音可能有动程的单韵母/er/做了专门的讨论。为了更直观地表现各音位间区别特征的关系,同时也为了便于语音工程的应用,分别设计绘出了普通话声母和韵母的树状图。文中对音位区别特征的分配及其间的关系作了说明。  相似文献   

17.
非线性加权能量特征在英语词重音检测中的应用   总被引:1,自引:0,他引:1  
为了解决传统特征在重音检测中鲁棒性不高的问题,根据重音的定义,以单词为单位,考察词内各音素携带基音同步动态短时帧能量的差异,同时引入非线性加权因子,提出非线性加权能量特征.使用非线性加权能量特征以及与传统特征的特征组合对英语连续语音的实验结果表明,非线性加权能量特征比传统特征鲁棒性更高,联合使用新特征与传统特征,可使系统误识率下降3.58%.  相似文献   

18.
提出了基于帧特征、段特征联合建模的语音识别模型。该模型采用描述谱参数轨迹的段特征,在段尺度上实现了对语音信号帧间相关性的显式建模;采用段特征依赖的非平稳时间序列产生模型,实现了段特征与帧特征间的相关性建模,并在帧尺度上通过参数化的均值轨迹函数,实现了对语音信号帧间相关性的隐式建模。本文给出了基于帧特征、段特征联合统计距离优化的分段算法以及内嵌EM迭代的模型参数估计算法。对非特定人汉语孤立韵母以及多话者汉语基本音节的识别实验表明,该模型的识别性能优于标准HMM及趋势HMM。  相似文献   

19.
主要关于上海同步辐射装置(SSRF)储存环电子引发产生的韧致辐射和中子辐射的研究.中子和光子经多种组合材料(厚度在5cm-115cm之间)屏蔽后的剂量特征由蒙特卡罗代码McNP和EGSnrc估算得到;蒙特卡罗计算表明,单一的材料如铅,铁和聚乙烯对高能中子是无效的生物屏蔽材料,而组合材料如铅或者铁加聚乙烯和铅或者铁加混凝土被认为是屏蔽高能中子很好的组合材料.铅铁等高Z材料加点包含有氢的低Z材料如聚乙烯是同时屏蔽高能中子和韧致辐射的一种比较好的组合材料选择.  相似文献   

20.
主要关于上海同步辐射装置(SSRF)储存环电子引发产生的韧致辐射和中子辐射的研究. 中子和光子经多种组合材 料(厚度在5cm~115cm之间)屏蔽后的剂量特征由蒙特卡罗代码MCNP和EGSnrc估算得到; 蒙特卡罗计算表明, 单一的材料如铅, 铁和聚乙烯对高能中子是无效的生物屏蔽材料, 而组合材料如铅或者铁加聚乙烯和铅或者铁加混凝土被认为是屏蔽高能中子很好的组合材料. 铅铁等高Z材料加点包含有氢的低Z材料如聚乙烯是同时屏蔽高能中子和韧致辐射的一种比较好的组合材料选择.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号