排序方式: 共有4条查询结果,搜索用时 0 毫秒
1
1.
汉语连续语音数据库的语料设计 总被引:10,自引:0,他引:10
质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持.在目前阶段,汉语语音数据库应限制在朗读言语(readspeech)的音段方面。为了描写语流中的音变现象,考虑如下语音单元:(1)不计声调的音节(401个)。(2)音节间的双音子415个。(3)音节间的三音子3035个,这是根据37个基本音子,利用音节间共振峰过渡的研究结果,按规则规纳的结果.(4)所有音节间过渡段的韵母一声母结构,采用和同三音子相同的归并方法,共781个.为了增加不同的韵律结构,并考虑语音识别系统的后处理,语料还包括汉语的17类基本句型.选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料,从中选出2185个句子和388个短语作为朗读语料,它们覆盖了99.8%个无调音节,100%的双音子,99.6%的三音子,以及17类句型。 相似文献
2.
本研究的实验材料取自中国社会科学院语言研究所语音数据库.库中存有15个男青的语音材料,共有15×15=225个三合元音音节.本研究的主要目的是从普通话三合元音入手,在对15个说话人的语音材料统计的基础上,通过对最小时间感知阈Tlim的测量与研究,从声学和感知的角度,给出三合元音必不可少的信息,指出多余信息.实验结果表明,TIim内的共振峰变化情况可分为两类.一是动态特性,它的表现是:(a)△F1>90%,△F2约50%;(b)Tlim内至少包括F1,F3两个拐点中的一个;(C)Tlim内包括F2变化最剧烈的部分.这四点对四个三合元音是一致的.第二类是边界条件,Tlim受到位置和大小两方面的限制,证明其边界共振峰频率十分重要. 相似文献
3.
语句的基频曲线预测 总被引:1,自引:1,他引:0
基频曲线预测是文语转换系统中韵律控制的重要内容。基于决策树的分析,本文提出了一个采用三个控制参数,修改一组归一化的音节基频曲线模板,从而生成连续语流基频曲线的预测模型。由于前一音节的声调动态目标将在该音节的偏后部分实现,甚至影响到连接紧密的后一个音节的起始部分,在预测当前音节的控制参数时,前一音节的基频终止值也作为语境参数之一,参与预测,其结果既保持了前后音节基频的连续性,也提高了基频曲线整体预测的准确率。测试表明:预测基频与实际基频的音节内标准误差小于10 Hz。将这一方法应用于PSOLA语音合成系统后,合成语音的自然度令人满意。 相似文献
4.
研究了语调短语边界处焦点、词重音位置与上升的边界调对语调短语末词基频模式的影响。通过分析两个美式英语语料库语调短语末词的声学特征,我们发现当该单词是焦点时,重音的基频峰值比边界调的尾值高;边界调在重音实现后才充分体现出来;词重音在音节结构中后移会压缩词重音后基频调域范围。当语调短语末词不是焦点时,边界调的上升趋势从开始就体现出来,并压制了词重音的基频凸显。我们的结论是,焦点可以通过提升词重音基频峰值的高度完成;焦点和边界调实现的力度受词重音所处位置限制,在极端的情况下,边界调只能在语调短语最末音节的尾部实施。在有限音段上这些韵律特征都有表达其功能最彻底的一段位置,它们竞相展现,此消彼长。 相似文献
1