期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

李贤於俊汪增福《声学学报》2014,39(4):509-516

面向情感语音转换,该文提出了一种韵律转换方法。该方法包含基频转换和时长转换两个部分,前者选择离散余弦变换(DCT)参数化基频,根据基频的层次结构特点,将基频分解为短语层和音节层两个层次,使用基于混合高斯模型(GMM)的转换方法对两个层次分别进行转换;后者使用基于分类回归树(CART)的方法以声韵母为基本单位对时长进行转换。一个包含三种基本情感的语料库用作训练和测试,客观评测以及主观评测实验结果显示该方法可有效进行情感韵律转换,其中悲伤情感在主观实验中达到了接近100%的正确率。相似文献

2.

元音的内在基频与讲话方式对共振峰的影响 总被引：1，自引：0，他引：1

张家騄《声学学报》1989,(6)

为探讨声源与声道间的相互作用现象,做了两个试验。结果表明:1.汉语中也发现了元音的内在基频;2.高元音与低元音的内在基频的差与音调有关,在一定的动态范围内内在基频差与音调高低成线性关系,但是,超过一定范围便出现非线性关系;3.用力程度和讲话快慢不仅影响基频F_o也影响元音三角图。相似文献

3.

汉语和外语的基频模式的对比研究 总被引：3，自引：1，他引：2

张家胡兴慧《声学学报》1995,(1)

利用声门电阻抗仪（Ｌａｒｙｎｇｏｇｒａｐｈ）精确地提取嗓音基频，在宏观（篇章）和微观（基音周期）两个层次上，对汉语和英语、德语、日语的基频模式进行了对比研究。发音人是１４名中国人，１４名外国人。试验结果表明：１．９０％音域汉语与外语无大差别；２．连续言语的基频正负颤动对于不同的语言和男女发音人来说，是差不多相同的；３、在连续言语中负颤动因数大于正颤动因数；４．以音节每秒计的说话速度，中国人要比外国人低。相似文献

4.

基于隐马尔科夫模型的汉语韵律词基频模型 总被引：3，自引：1，他引：2

朱东来王仁华凌震华李威《声学学报》2002,(6)

提出了一种基于隐马尔科夫模型（HMM）的汉语韵律词的统计基频模型。模型能反映韵律环境和基频曲线参数之间的映射关系,从模型可以估计一段基频曲线和一段文本之间的相关度,也可以从文本生成相应的基频曲线。本方法使用HMM作为基木框架,具有HMM理论体系所能支配的各种优点。同时将韵律作为模型单元,使得模型能够反映韵律层次级的连续变调。最后给出了实验结果并对模型的应用前景进行了展望。相似文献

5.

超音段特征间的相互作用 总被引：2，自引：1，他引：1

张家騄《声学学报》1993,(4)

在五种不同的发音方式(大声、正常、小声、加快和放慢)下,研究说话声级、说话速度和言语基频F_O之间的相互作用。发音人一男一女,言语材料为四个元音/a,i,u,u/,在不同声调下嵌入负载句。结果表明:1.说话声级提高导致基频升高、音域扩大,说话速度变化对基频影响较小,只是速度加快音域下限略有上升;2.单句的起始基频主要决定于说话声级;3.单句的基频F_O下降率既与说话速度又与说话声级都有关系;4.句尾基频跟说话方式关系不大。相似文献

6.

Keating改良模型的硅纳米梁动态特性

下载免费PDF全文

张致彬于虹张鹏陈宏博《强激光与粒子束》2015,27(2):024149

提出一种用于分析硅纳米梁动态特性的改良型半连续体模型,对比传统的连续体理论,这种新模型使用了Keating势,并考虑了纳米梁在宽厚两个维度的分立特性。依据Sun-Zhang模型思想和能量守恒定律,建立了改良型Keating模型,并进行了双端固支梁的基频计算。在这个过程中,对一些表面效应也进行系统分析。结果表明,该改良模型一方面在纳米尺度下与Material StudioTM软件仿真结果较为符合,另一方面也能在微观尺度下较好的接近连续体模型的计算数据。同时,该模型还反映了基频随纳米梁宽度变化的特性,这也符合一些实际实验。相似文献

7.

Keating改良模型的硅纳米梁动态特性（英文）

张致彬于虹张鹏陈宏博《强激光与粒子束》2015,(2):263-266

提出一种用于分析硅纳米梁动态特性的改良型半连续体模型,对比传统的连续体理论,这种新模型使用了Keating势,并考虑了纳米梁在宽厚两个维度的分立特性。依据Sun-Zhang模型思想和能量守恒定律,建立了改良型Keating模型,并进行了双端固支梁的基频计算。在这个过程中,对一些表面效应也进行系统分析。结果表明,该改良模型一方面在纳米尺度下与Material StudioTM软件仿真结果较为符合,另一方面也能在微观尺度下较好的接近连续体模型的计算数据。同时,该模型还反映了基频随纳米梁宽度变化的特性,这也符合一些实际实验。相似文献

8.

自然风格言语的汉语句重音自动判别研究 总被引：6，自引：2，他引：6

邵艳秋韩纪庆刘挺赵永贞《声学学报》2006,31(3):203-210

重音是语音合成中韵律处理的一个重要参数。本文分析了轻声和重读音节同正常重音在各声学参数上的差异,包括基频、音节时长、强度、停顿长度等,还特别考察了时长同基频参数之间的关系,以及上声音调同基频的关系。建立了基于人工神经网络的三种重音预测模型,即声学预测模型、语言学预测模型和混合预测模型,对汉语句重音(包括轻声、正常重音、重读)进行了自动判别,结果显示混合模型要优于另外两种模型。此外,本文还根据重音标注的多样性现象设计了支持率的评价方法。相似文献

9.

铝棒发音的实验研究

罗志恒《物理实验》2008,28(7)

对科学探究实验室中的铝棒发音实验进行了多组对比实验,借助多媒体音频软件Cool Edit 2000,探究了铝棒发音的规律,得到了铝棒发音的初步实验结论. 相似文献

10.

使用变分自编码器的自回归多说话人中文语音合成

下载免费PDF全文

蒿晓阳张鹏远《声学学报》2022,47(3):405-416

常见的多说话人语音合成有参数自适应及添加说话人标签两种方法。参数自适应方法获得的模型仅支持合成经过自适应的说话人的语音,模型不够鲁棒。传统的添加说话人标签的方法需要有监督地获得语音的说话人信息,并没有从语音信号本身无监督地学习说话人标签。为解决这些问题,提出了一种基于变分自编码器的自回归多说话人语音合成方法。方法首先利用变分自编码器无监督地学习说话人的信息并将其隐式编码为说话人标签,之后与文本的语言学特征送入到一个自回归声学参数预测网络中。此外,为了抑制多说话人语音数据引起的基频预测过拟合问题,声学参数网络采用了基频多任务学习的方法。预实验表明,自回归结构的加入降低了频谱误差1.018 dB,基频多任务学习降低了基频均方根误差6.861 Hz。在后续的多说话人对比实验中,提出的方法在3个多说话人实验的平均主观意见分(MOS)打分上分别达到3.71,3.55,3.15,拼音错误率分别为6.71%,7.54%,9.87%,提升了多说话人语音合成的音质。相似文献

11.

基于面部情绪识别的物理实验教学过程评价

《物理实验》2020,(9)

在教育信息化的大背景下,提出了基于学生面部情绪识别的物理实验教学评价方法.在实验课堂中若干个重要节点捕获学生面部表情样本作为学习情感状态的评价依据,结合传统实验教学的认知评价方法,实现对学生学习状态实时、客观的细粒度评价.分析了7种基本表情在PAD三维情感空间的分布状况,采用经典卷积神经网络AlexNet完成面部表情情感识别预训练调优,平均准确率达到92%以上.通过在物理实验课堂中对比该方法与传统评价方法的评估效能,证明该模型能实现更智能、更高效的物理实验教学评价. 相似文献

12.

利用倒谱方法实现气声发育的重建

下载免费PDF全文

李国锋刘莹《应用声学》1996,15(5):41-44

本文介绍了一种利用复倒谱来实现气声发音重建的方法。首先分析了气声发音的语音特征；进而在复倒谱序列中加入基频特征使其恢复到正常的语音。对元音［a］以及实际语音段进行了处理，均有较好的效果。相似文献

13.

增益介质位置对腔外倍频效率的影响

下载免费PDF全文

李嘉琦冯国英邓国亮陈永富周寿桓《强激光与粒子束》2018,30(4):041002-1-041002-6

采用MgO掺杂的周期性极化铌酸锂晶体作为非线性晶体,搭建了线性平-凹腔结构的外腔式倍频系统,分析了增益介质和输入耦合镜之间的距离对二次谐波转换效率的影响。实验中,使用光纤耦合二极管泵浦Nd: YVO₄激光器作为基频光源,通过改变增益介质和输入耦合镜的间距,测量了激光器的纵模数量、锁模脉冲稳定性、基频光线宽以及光-光转换效率。实验结果显示,增加增益介质和输入耦合镜之间的距离,可以在一定程度上提升自锁模脉冲的稳定性并有效减小基频光线宽。当泵浦功率较高时,适当增加该间距可以有效提升二次谐波转换效率。相似文献

14.

一种音乐情绪参数化的方法

下载免费PDF全文

吴忻生徐凯春戚其丰高红霞《应用声学》2013,32(1):28-33

针对目前基于情绪的音乐分类研究存在的弊端,为了方便音乐检索,本文提出一种音乐情绪参数化的方法。该方法通过提取反映音乐情绪的特征向量,然后利用fisher算法进行维数压缩,再通过大量的音乐样本训练得到节奏、音调和音色3个描述音乐情绪的参数,参数的大小反映了情绪的强弱。实验结果表明,音乐情绪参数化的结果符合音乐实际的情绪。相似文献

15.

从对话中摘出词句的可懂度

齐鲁《声学学报》1964,(2)

对话中有很多能影响可懂度的因素,以前处理起来不太容易,最近的技术已使此成为可能。本实验旨在研究从一连串对话中摘出语句的可懂度,而以说话的速度作为测试的变量。测试方法是由四位女性发音人在消声室中,正对电容受话器,距离约10英寸,分别录下问答语句。发音人均为大学生,由实验人分别带入消声室,另一实验相似文献

16.

一种频域基频提取新方法 总被引：3，自引：0，他引：3

张红张红黄泰翼宋俊寿《声学学报》1999,(4)

提出了一种基于二值侧抑制网络的频域基频提取方法。即利用二值侧抑制网络对语音的短时谱进行峰值提取,得到包括语音基频及其谐波的线谱,根据谐波间的距离平均值估算出基频．该算法在ＣＯＳＤＩＣ数据库上进行了测试,并与自相关基频提取法和倒谱基频提取法进行了比较．实验数据表明,本算法具有更高的精度和更强的抗噪声性能．相似文献

17.

焦点、词重音与边界调对语调短语末词基频模式的影响

下载免费PDF全文

张璐祖漪清闫润强《声学学报》2012,37(4):448-456

研究了语调短语边界处焦点、词重音位置与上升的边界调对语调短语末词基频模式的影响。通过分析两个美式英语语料库语调短语末词的声学特征,我们发现当该单词是焦点时,重音的基频峰值比边界调的尾值高;边界调在重音实现后才充分体现出来;词重音在音节结构中后移会压缩词重音后基频调域范围。当语调短语末词不是焦点时,边界调的上升趋势从开始就体现出来,并压制了词重音的基频凸显。我们的结论是,焦点可以通过提升词重音基频峰值的高度完成;焦点和边界调实现的力度受词重音所处位置限制,在极端的情况下,边界调只能在语调短语最末音节的尾部实施。在有限音段上这些韵律特征都有表达其功能最彻底的一段位置,它们竞相展现,此消彼长。相似文献

18.

正弦相位调制双法布里—珀罗干涉术的实验研究 总被引：5，自引：1，他引：4

朱若谷《光学学报》1994,14(5):08-512

讨论了光纤传光、正弦相位调制的双法布里－珀罗干涉术实验结果。通过光强信号的傅里叶分析，证实基频幅值和相位均合谐振腔长度或程函变化信息，从而提出实现基频相位或幅值测量的时间间隔测量法或幅值整流基频幅值测量法。在已研制的实验装置上，测试两种方法的灵敏度阈，结果表明：作者提出的平行双通道结构和光纤传光的测试方法能补偿谐振腔温漂影响，简化信号处理过程，更适合实时测量。相似文献

19.

情感在物理教学中的催化作用

王苏冶《技术物理教学》2003,11(2):2-3

情绪和情感是客观事物是否满足自己需要而产生的心理体验.它伴随着认识过程而产生,并影响着认识活动的进行.现代心理学的研究已证明:积极丰富的情绪和情感是人的认识和实践活动的内驱力,愉快、欢乐、适度平稳的情绪能使中枢神经活动处于最佳状态,保证体内各系统的协调一致,充分发挥机体的潜能.在教学活动中,情感具有引相似文献

20.

谐波显著度的基频提取方法

宋黎明李明颜永红《声学学报》2015,40(2):294-299

我们提出的谐波显著度的基频提取方法,目的是从语音信号中自动获取人声基频,该方法利用抑制因子计算出基频的谐波显著度谱,对各次谐波显著度加权求和之后进行基频轨迹跟踪确定语音的基频序列。在TIMIT掺噪数据集和音乐信息检索评测2005主旋律数据集上,谐波显著度方法的准确率分别达到了88.5%和73.3%,使倍频、半频错误相对降低了80%。实验表明,基于谐波显著度的基频提取方法增强了系统的抗噪性能以及抗倍半频错误的能力。相似文献