首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
汉语普通话区别特征系统树状图   总被引:9,自引:2,他引:7  
张家騄 《声学学报》2006,31(3):193-198
本文是“汉语普通话区别特征系统”的继续与发展。文中对汉语区别特征的定义及其在语音中的具体的物理的和心理的体现作了进一步的说明。对汉语普通话区别特征表进行了修订。对发音可能有动程的单韵母/er/做了专门的讨论。为了更直观地表现各音位间区别特征的关系,同时也为了便于语音工程的应用,分别设计绘出了普通话声母和韵母的树状图。文中对音位区别特征的分配及其间的关系作了说明。  相似文献   

2.
中国科学院声学研究所建立了一个汉语普通话语音数据库,这个语音数据库由声母、韵母、1282个单音节、几百个双音词和三音词、语音试验句、短文及数字0—9等构成。该语音数据库的发音人有六位(三男三女),他们是广播学院的教师和职业播音员,讲标准的汉语普通话。语音材料录制在高质量的磁带上,其中有一部分已数字化。已有许多汉语语音研究部门使用该语音数据库。  相似文献   

3.
汉语普通话机读音标SAMPA-SC   总被引:2,自引:0,他引:2  
机读音标SAMPA在欧共体语言中已得到普遍应用,在国际言语资料库和言语输入/输出系统评价协调委员会(CO-COSDA)的主持下,已向世界上众多语言推广.本文是对汉语机读音标的修改和扩展.汉语普通话机读音标,是以汉语拼音方案为基础,分别列出声母(辅音)、元音、韵母和声调的机读音标SAMPA和国际音标,并给出相应的例字.本文还特别把机读音标扩展到儿化韵,以适应语音识别、文-语转换技术和语言教学的需要.  相似文献   

4.
基于发音特征的汉语普通话语音声学建模   总被引:3,自引:0,他引:3  
将表征汉语普通话语音特点的发音特征引入汉语普通话语音识别的声学建模中,根据普通话发音特点,确定了用于区别普通话元音、辅音以及声调信息的9种发音特征,并以此为目标值训练神经网络得到语音信号属于各类发音特征的后验概率,将此概率作为语音识别的输入特征建立声学模型。在汉语普通话非特定人大词表自然口语对话识别系统中进行了实验验证,并与基于频谱特征的声学模型进行了比较,在相同解码速度下,由此方法建立的声学模型汉字错误率相对下降6.8%;将发音特征和频谱特征进行了融合实验,融合以后的识别系统相对基于频谱特征系统的汉字错误率相对下降10.1%。上述结果表明,基于发音特征的声学模型更加有效的实现了对语音特性的表征,通过利用发音特征和频谱特征的互补性,能够进一步实现对语音识别性能的提高。   相似文献   

5.
本文在分析了汉语单音节发音的音节结构的基础上,定义了基于声韵母类的语音识别单元,从声学角度确定了用于汉语全音节识别系统的声学单元,并研究了这些声学单元的检测一致性及基于这些单元的识别系统的鲁棒性。文中还对大量的发音人的声母类发音的长度作了统计,给出了基于本文给出的分割算法和本文定义的声母单元下的声母长度预分类方法。通过在非特定人全音节汉语语音识别系统上的应用表明,本文定义的语音识别单元具有很高的检测一致性,建立在其上的识别,系统也具有很高的鲁棒性;文中给出的预选方法在最好的情况下,可以减少一半以上的运算量,而预选精度几乎达到100%。  相似文献   

6.
汉语语音资料库的语音学标记及人工切分   总被引:2,自引:0,他引:2  
介绍了汉语语音综合资料库的一个子库:CAS-SYL。该数据库包括汉语全部有调音节1267个,共计10个发音人;全部语音数据由人工完成音段切分及语音学标注。针对汉语音节的声韵结构,语音学标注水平被定位在半音节层次上.语音学标注符号系统采用了计算机可读的音标符号系统一汉语SAMPA-X(extendedSAMPhoneticAlphabet).还介绍了语音学标注策略,音段定位原则,基于语音波形的声门关闭时刻:GCI(GlottalClosedInstant)的声学线索。同时对声韵间的协同发音的声学体现进行了总结。最后对人工切分带来的非稳定性进行了分析.  相似文献   

7.
本文对普通话书面语中声母、韵母的动态与静态分布特性及其差异作了统计分析,结果表明:普通话声母间的、韵母的动态与表态的相对分布关系一致,语音间的相对分布主要与发声系统有关,不受频度的影响。普通话声母、韵母的动态与静态的出现率差异,与声母发音方法和韵线组合结构、声母发音部位与韵母四呼的配合关系、音节的成字率和字的频度有关,主要受送气与不送气声母、韵母的动态与静态的出现率差异最大,多音节词中的韵母的动态  相似文献   

8.
根据混响环境下的汉语单音节清晰度实验,采用多维尺度和聚类分析的方法得到了混响作用下声母、韵母的知觉空间结构和层次逻辑关系。发现混响环境下声母的主要知觉特征是舌的发音部位(摩擦部位)和送气一不送气,其中舌的发音部位是声母最重要的知觉特征;韵母的主要知觉特征是起始部分元音的舌位。声母的清一浊特征和韵母的韵尾在混响环境下对语音知觉几乎不起作用。实验结果也揭示出语音的知觉特征与物理传递条件的相关性。   相似文献   

9.
李皓  唐朝京 《声学学报》2012,37(3):339-345
为实现鲁棒的声韵母切分,以满足大词汇量连续语音识别系统的需求,提出一种建立损失函数,并利用浊音的“准”周期性和声母时长进行声韵母切分的方法。首先计算语音的自相关函数,接着建立代价损失函数,对计算结果采用动态规划方法检测浊音,然后根据声母时长分布规律确定声母的检测范围,最后在检测范围内对浊音段起始点前后采用听觉事件检测方法分割出声韵母。实验结果表明,采用动态规划方法相对于阈值方法提高了浊音段的检测性能,在浊音段的基础上对声韵母进行切分能够提高切分的正确率,减少噪声及汉语音变现象的影响,切分性能受声母发音方式影响较小。   相似文献   

10.
基于网格维数的汉语语音分形特征研究   总被引:4,自引:1,他引:3  
应用分形理论来研究汉语语音信号的分形特征。木文首先在传统盘维数基础上提出了一种等差尺度网格维数算法来快速计算语音信号的分维数;在此基础上,对汉语男女声的21种声母和38种韵母语音信号的分维数进行了计算和统计分析,得到了汉语语音分维数的统计分布规律。本文实验结果表明,汉语语音信号具有分形标度不变性,网格维数能够反映语音信号波形的复杂程度。  相似文献   

11.
基于听觉模型的耳语音的声韵切分   总被引:5,自引:0,他引:5       下载免费PDF全文
丁慧  栗学丽  徐柏龄 《应用声学》2004,23(2):20-25,44
本文分析了耳语音的特点,并根据生理声学及心理声学的基本理论与实验资料,提出了一种利用听觉模型来进行耳语音声韵切分的方法。这种适用于耳语音声韵切分的听觉感知模型主要分为四个层次:耳蜗对声音频率的分解机理;听觉系统的时域和频域非线性变化;中枢神经系统的侧抑制机理。这种模型能反映在噪声环境下人对低能量语音的听觉感知特性,因而适于耳语音识别,在耳语音声韵母切分实验中得到了满意的结果。  相似文献   

12.
基于熵函数的耳语音声韵分割法   总被引:11,自引:3,他引:8  
耳语音声韵分割是耳语音识别和转换的前期工作。由于耳语发音不同于正常音,一般用于正常音的声韵分割法对耳语音不再适用。通过分析耳语音的发音及声学特点,利用宽带语谱图的声韵变化规律,提出了适用于耳语音的信息熵端点检测法,以及相对熵、音长和谱重心相结合的声韵分割法。并对两组信噪比为2-10 dB的380个汉语单音节耳语音进行声韵分割,女声的正确率为87.9%,男声的正确率为90.3%,高于频域法、聚类法和谱平坦度声韵分割法。实验表明,相对熵法可做为耳语音识别和转换的预处理,它改善了汉语耳语音转换为正常音的音质。  相似文献   

13.
汉语听觉视觉双模态数据库CAVSR1.0   总被引:8,自引:0,他引:8  
听觉视觉双模态语音识别在国际上已经逐渐成为当前语音识别的热点之一,汉语的双模态识别研究也已开始启动。然而,由于视觉信息获取及处理难度极大,目前的双模态语音数据库的建设尚显薄弱,汉语方面更是空白。鉴于此,我们在进行听觉视觉双模态语音识别关键技术研究的同时,在分析国外同类数据库的结构的基础上,结合汉语语音的特点,建立了汉语语音的第一个双模态数据库CAVSR1.0。它具有如下特点:采用的语料涵盖所有声韵母,其规模(总数据量、音节量)超出目前国际上同类数据库;语料分布符合汉语声韵母的实际分布概率,因此其反映的规律具有代表性;捆绑了自动音节分割程序及脸部主要特征标定程序,使数据库具有很强的可扩展性。  相似文献   

14.
根据汉语语音特点,为汉语人机对话系统设计了反映汉语语音主要特征、现象的语音试验材料集,作为汉语人机对话系统语音知识库的素材,用于研究语音合成规则、训练语音识别模板等.语音材料的选择以全面、典型、适量为原则,以反映汉语语音的韵律特征和音色特征的变化规律为目的,分别以声调及其组合、声韵组合为基础选择语音材料.全部材料已用数字录音机录制完毕.  相似文献   

15.
汉语孤立字全音节实时识别系统   总被引:1,自引:0,他引:1  
本文在大量语音实验的基础上,对汉语语音识别方法进行了较为深入的探讨,并以IBMPC/AT配以自行研制开发的TMS320C25-E型高速信号处理板为硬件基础,建立了一个特定人汉语普通话全音节实时识别系统.该系统针对汉语普通话的语音特点,采用了分层识别策略.整个系统响应时间小于0.2秒,用4遍1240个全音节语音对系统进行的严格测试表明:系统四声识别的平均正确率为99%左右,音节识别前5个候选的正确识别率分别为82%,91%,94%,96%,97%;同时,本文根据这一测试结果建立了相应的声韵母混淆矩阵和基于Shepard方法的相似度集群分析树图,并对照汉语语音合成清晰度测试结果及汉语语音知觉结构的集群分析结果,对本系统各部分进行了较为深入的分析,提出了相应的改进措施.  相似文献   

16.
尹辉  谢湘  匡镜明 《声学学报》2012,37(1):97-103
分数阶Fourier变换在处理非平稳信号尤其是chirp信号方面有着独特的优势,而人耳听觉系统具有自动语音识别系统难以比拟的优良性能。本文采用Gammatone听觉滤波器组对语音信号进行前端时域滤波,然后对输出的各个子带信号用分数阶Fourer变换方法提取声学特征。分数阶Fourier变换的阶数对其性能有着重要影响,本文针对子带时域信号提出了采用瞬时频率曲线拟合求取阶数的方法,并将其与采用模糊函数的方法作了比较。在干净与含噪汉语孤立数字库上的语音识别结果表明,采用新提出的声学特征得到的识别正确率相对MFCC基线系统有了显著提高;根据瞬时频率曲线搜索阶数的算法与模糊函数方法相比,计算量大大减少,并且根据该方法提取的声学特征得到了最高的平均识别正确率。   相似文献   

17.
语音波形过零率是一个很重要的语音特征.它通常是语音端点判别和音素粗分类的基本要素.但是,它也有不稳定的一面,所以很少看到有人将它用到语音细分类和识别中.本文提出了把一串过零点间时间间隔作为辨认普通话声母的语音特征的方法.本文做了以过零点间时间间隔作为HMM的输入符号,对送气塞音类声母P、T、K,不送气塞擦音Z、ZH和喉擦音H等六个声母进行辨认实验.在连机的环境下,我们取得78%的声母正确辨认率.以过零点间时间间隔作为语音特征的优点是计算简单,易于实现.此外,它可以不经转换直接作为离散HMM的输入符号.本文介绍过零点间时间间隔的计算方法和使用HMM对上述六个声母进行识别的实验过程.  相似文献   

18.
普通话单韵母的听觉规范   总被引:1,自引:0,他引:1  
用普通话若干孤立单韵母作语音材料,有三级性别或年龄不同的发音人,通过声学分析和统计分析,比较了言语识别预加工的三种听觉模型.这些模型由几种不同的听觉变换和规范构成.实验的效果表明,最佳的听觉变换为Erb,但几种规范之间却没有明显的差别.Chistovich的频谱重心效应对普通话单韵母也是适用的,韵母的临界距离估算为3.0Bark或3.5Erb.  相似文献   

19.
音高和时长在普通话轻声知觉中的作用   总被引:4,自引:2,他引:2  
目的在于探讨音高和时长两种因素在普通话轻声知觉中的作用方式以及比较两种因素所起作用的大小。使用了心理-声学的实验方法,所用刺激为音高和时长得到控制的15组合成的双音节语音词,要求33名普通话母语者对所有刺激的重音类型进行“重重”或“重轻”的强迫性选择判断。结果表明: (1)音高和时长对于普通话轻声的知觉均有显著作用, (2)音高对于轻声知觉的作用明显大于时长, (3)音高曲线的起点、高音点和调型曲拱均对轻声的知觉起作用。这些实验结果与自然语音中轻声的声学特征基本上是互相对应的,但也存在一定程度的差别。这些差别说明,自然语音中轻声的某些声学特征只是羡余特征而非音系特征。  相似文献   

20.
张家■:中国科学院声学所研究 员,中国声学学会常务理事,语 言、听觉和音乐声学分会主任, 《应用声学》副主编。主要从事 言语科学和言语技术研究。设计 了汉语普通话清晰度试验方法和建立了汉语可懂度理论基础;导出了汉语清晰度指数;建立了不同语言单位清晰度试验得分之间的统计关系,并且证明了汉语音节结构有助于提高可懂度。在不同语速、不同声级下测得了远场和近场的语言长时平均频谱。定量地证明了汉语声调对提高可懂度的作用。揭示汉语元音的内在音高规律并实验研究语音产生中的相互作用。曾获国家自然科学三等奖,中国科学院…  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号