首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
李贤  於俊  汪增福 《声学学报》2014,39(4):509-516
面向情感语音转换,该文提出了一种韵律转换方法。该方法包含基频转换和时长转换两个部分,前者选择离散余弦变换(DCT)参数化基频,根据基频的层次结构特点,将基频分解为短语层和音节层两个层次,使用基于混合高斯模型(GMM)的转换方法对两个层次分别进行转换;后者使用基于分类回归树(CART)的方法以声韵母为基本单位对时长进行转换。一个包含三种基本情感的语料库用作训练和测试,客观评测以及主观评测实验结果显示该方法可有效进行情感韵律转换,其中悲伤情感在主观实验中达到了接近100%的正确率。   相似文献   

2.
元音的内在基频与讲话方式对共振峰的影响   总被引:1,自引:0,他引:1  
为探讨声源与声道间的相互作用现象,做了两个试验。结果表明:1.汉语中也发现了元音的内在基频;2.高元音与低元音的内在基频的差与音调有关,在一定的动态范围内内在基频差与音调高低成线性关系,但是,超过一定范围便出现非线性关系;3.用力程度和讲话快慢不仅影响基频F_o也影响元音三角图。  相似文献   

3.
汉语和外语的基频模式的对比研究   总被引:3,自引:1,他引:2  
利用声门电阻抗仪(Laryngograph)精确地提取嗓音基频,在宏观(篇章)和微观(基音周期)两个层次上,对汉语和英语、德语、日语的基频模式进行了对比研究。发音人是14名中国人,14名外国人。试验结果表明:1.90%音域汉语与外语无大差别;2.连续言语的基频正负颤动对于不同的语言和男女发音人来说,是差不多相同的;3、在连续言语中负颤动因数大于正颤动因数;4.以音节每秒计的说话速度,中国人要比外国人低。  相似文献   

4.
基于隐马尔科夫模型的汉语韵律词基频模型   总被引:3,自引:1,他引:2  
提出了一种基于隐马尔科夫模型(HMM)的汉语韵律词的统计基频模型。模型能反映韵律环境和基频曲线参数之间的映射关系,从模型可以估计一段基频曲线和一段文本之间的相关度,也可以从文本生成相应的基频曲线。本方法使用HMM作为基木框架,具有HMM理论体系所能支配的各种优点。同时将韵律作为模型单元,使得模型能够反映韵律层次级的连续变调。最后给出了实验结果并对模型的应用前景进行了展望。  相似文献   

5.
超音段特征间的相互作用   总被引:2,自引:1,他引:1  
在五种不同的发音方式(大声、正常、小声、加快和放慢)下,研究说话声级、说话速度和言语基频F_O之间的相互作用。发音人一男一女,言语材料为四个元音/a,i,u,u/,在不同声调下嵌入负载句。结果表明:1.说话声级提高导致基频升高、音域扩大,说话速度变化对基频影响较小,只是速度加快音域下限略有上升;2.单句的起始基频主要决定于说话声级;3.单句的基频F_O下降率既与说话速度又与说话声级都有关系;4.句尾基频跟说话方式关系不大。  相似文献   

6.
提出一种用于分析硅纳米梁动态特性的改良型半连续体模型,对比传统的连续体理论,这种新模型使用了Keating势,并考虑了纳米梁在宽厚两个维度的分立特性。依据Sun-Zhang模型思想和能量守恒定律,建立了改良型Keating模型,并进行了双端固支梁的基频计算。在这个过程中,对一些表面效应也进行系统分析。结果表明,该改良模型一方面在纳米尺度下与Material StudioTM软件仿真结果较为符合,另一方面也能在微观尺度下较好的接近连续体模型的计算数据。同时,该模型还反映了基频随纳米梁宽度变化的特性,这也符合一些实际实验。  相似文献   

7.
提出一种用于分析硅纳米梁动态特性的改良型半连续体模型,对比传统的连续体理论,这种新模型使用了Keating势,并考虑了纳米梁在宽厚两个维度的分立特性。依据Sun-Zhang模型思想和能量守恒定律,建立了改良型Keating模型,并进行了双端固支梁的基频计算。在这个过程中,对一些表面效应也进行系统分析。结果表明,该改良模型一方面在纳米尺度下与Material StudioTM软件仿真结果较为符合,另一方面也能在微观尺度下较好的接近连续体模型的计算数据。同时,该模型还反映了基频随纳米梁宽度变化的特性,这也符合一些实际实验。  相似文献   

8.
自然风格言语的汉语句重音自动判别研究   总被引:6,自引:2,他引:6  
重音是语音合成中韵律处理的一个重要参数。本文分析了轻声和重读音节同正常重音在各声学参数上的差异,包括基频、音节时长、强度、停顿长度等,还特别考察了时长同基频参数之间的关系,以及上声音调同基频的关系。建立了基于人工神经网络的三种重音预测模型,即声学预测模型、语言学预测模型和混合预测模型,对汉语句重音(包括轻声、正常重音、重读)进行了自动判别,结果显示混合模型要优于另外两种模型。此外,本文还根据重音标注的多样性现象设计了支持率的评价方法。  相似文献   

9.
对科学探究实验室中的铝棒发音实验进行了多组对比实验,借助多媒体音频软件Cool Edit 2000,探究了铝棒发音的规律,得到了铝棒发音的初步实验结论.  相似文献   

10.
蒿晓阳  张鹏远 《声学学报》2022,47(3):405-416
常见的多说话人语音合成有参数自适应及添加说话人标签两种方法。参数自适应方法获得的模型仅支持合成经过自适应的说话人的语音,模型不够鲁棒。传统的添加说话人标签的方法需要有监督地获得语音的说话人信息,并没有从语音信号本身无监督地学习说话人标签。为解决这些问题,提出了一种基于变分自编码器的自回归多说话人语音合成方法。方法首先利用变分自编码器无监督地学习说话人的信息并将其隐式编码为说话人标签,之后与文本的语言学特征送入到一个自回归声学参数预测网络中。此外,为了抑制多说话人语音数据引起的基频预测过拟合问题,声学参数网络采用了基频多任务学习的方法。预实验表明,自回归结构的加入降低了频谱误差1.018 dB,基频多任务学习降低了基频均方根误差6.861 Hz。在后续的多说话人对比实验中,提出的方法在3个多说话人实验的平均主观意见分(MOS)打分上分别达到3.71,3.55,3.15,拼音错误率分别为6.71%,7.54%,9.87%,提升了多说话人语音合成的音质。   相似文献   

11.
在教育信息化的大背景下,提出了基于学生面部情绪识别的物理实验教学评价方法.在实验课堂中若干个重要节点捕获学生面部表情样本作为学习情感状态的评价依据,结合传统实验教学的认知评价方法,实现对学生学习状态实时、客观的细粒度评价.分析了7种基本表情在PAD三维情感空间的分布状况,采用经典卷积神经网络AlexNet完成面部表情情感识别预训练调优,平均准确率达到92%以上.通过在物理实验课堂中对比该方法与传统评价方法的评估效能,证明该模型能实现更智能、更高效的物理实验教学评价.  相似文献   

12.
李国锋  刘莹 《应用声学》1996,15(5):41-44
本文介绍了一种利用复倒谱来实现气声发音重建的方法。首先分析了气声发音的语音特征;进而在复倒谱序列中加入基频特征使其恢复到正常的语音。对元音[a]以及实际语音段进行了处理,均有较好的效果。  相似文献   

13.
采用MgO掺杂的周期性极化铌酸锂晶体作为非线性晶体,搭建了线性平-凹腔结构的外腔式倍频系统,分析了增益介质和输入耦合镜之间的距离对二次谐波转换效率的影响。实验中,使用光纤耦合二极管泵浦Nd: YVO4激光器作为基频光源,通过改变增益介质和输入耦合镜的间距,测量了激光器的纵模数量、锁模脉冲稳定性、基频光线宽以及光-光转换效率。实验结果显示,增加增益介质和输入耦合镜之间的距离,可以在一定程度上提升自锁模脉冲的稳定性并有效减小基频光线宽。当泵浦功率较高时,适当增加该间距可以有效提升二次谐波转换效率。  相似文献   

14.
针对目前基于情绪的音乐分类研究存在的弊端,为了方便音乐检索,本文提出一种音乐情绪参数化的方法。该方法通过提取反映音乐情绪的特征向量,然后利用fisher算法进行维数压缩,再通过大量的音乐样本训练得到节奏、音调和音色3个描述音乐情绪的参数,参数的大小反映了情绪的强弱。实验结果表明,音乐情绪参数化的结果符合音乐实际的情绪。  相似文献   

15.
对话中有很多能影响可懂度的因素,以前处理起来不太容易,最近的技术已使此成为可能。本实验旨在研究从一连串对话中摘出语句的可懂度,而以说话的速度作为测试的变量。 测试方法是由四位女性发音人在消声室中,正对电容受话器,距离约10英寸,分别录下问答语句。发音人均为大学生,由实验人分别带入消声室,另一实验  相似文献   

16.
一种频域基频提取新方法   总被引:3,自引:0,他引:3  
提出了一种基于二值侧抑制网络的频域基频提取方法。即利用二值侧抑制网络对语音的短时谱进行峰值提取,得到包括语音基频及其谐波的线谱,根据谐波间的距离平均值估算出基频.该算法在COSDIC数据库上进行了测试,并与自相关基频提取法和倒谱基频提取法进行了比较.实验数据表明,本算法具有更高的精度和更强的抗噪声性能.  相似文献   

17.
张璐  祖漪清  闫润强 《声学学报》2012,37(4):448-456
研究了语调短语边界处焦点、词重音位置与上升的边界调对语调短语末词基频模式的影响。通过分析两个美式英语语料库语调短语末词的声学特征,我们发现当该单词是焦点时,重音的基频峰值比边界调的尾值高;边界调在重音实现后才充分体现出来;词重音在音节结构中后移会压缩词重音后基频调域范围。当语调短语末词不是焦点时,边界调的上升趋势从开始就体现出来,并压制了词重音的基频凸显。我们的结论是,焦点可以通过提升词重音基频峰值的高度完成;焦点和边界调实现的力度受词重音所处位置限制,在极端的情况下,边界调只能在语调短语最末音节的尾部实施。在有限音段上这些韵律特征都有表达其功能最彻底的一段位置,它们竞相展现,此消彼长。   相似文献   

18.
正弦相位调制双法布里—珀罗干涉术的实验研究   总被引:5,自引:1,他引:4  
朱若谷 《光学学报》1994,14(5):08-512
讨论了光纤传光、正弦相位调制的双法布里-珀罗干涉术实验结果。通过光强信号的傅里叶分析,证实基频幅值和相位均合谐振腔长度或程函变化信息,从而提出实现基频相位或幅值测量的时间间隔测量法或幅值整流基频幅值测量法。在已研制的实验装置上,测试两种方法的灵敏度阈,结果表明:作者提出的平行双通道结构和光纤传光的测试方法能补偿谐振腔温漂影响,简化信号处理过程,更适合实时测量。  相似文献   

19.
情绪和情感是客观事物是否满足自己需要而产生的心理体验.它伴随着认识过程而产生,并影响着认识活动的进行.现代心理学的研究已证明:积极丰富的情绪和情感是人的认识和实践活动的内驱力,愉快、欢乐、适度平稳的情绪能使中枢神经活动处于最佳状态,保证体内各系统的协调一致,充分发挥机体的潜能.在教学活动中,情感具有引  相似文献   

20.
宋黎明  李明  颜永红 《声学学报》2015,40(2):294-299
我们提出的谐波显著度的基频提取方法,目的是从语音信号中自动获取人声基频,该方法利用抑制因子计算出基频的谐波显著度谱,对各次谐波显著度加权求和之后进行基频轨迹跟踪确定语音的基频序列。在TIMIT掺噪数据集和音乐信息检索评测2005主旋律数据集上,谐波显著度方法的准确率分别达到了88.5%和73.3%,使倍频、半频错误相对降低了80%。实验表明,基于谐波显著度的基频提取方法增强了系统的抗噪性能以及抗倍半频错误的能力。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号