首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
利用为电话传输质量评价而设计的试验句,对汉语语音的动态特性进行了分析研究。发音人男女各六人,每个人分别在消声室中发音。试验条件包括:(1)五种不同的发话声级(距发音人唇部1m远,声级为55、60、65、70和75dB),(2)两种不同的说话速度(正常的和加快的)。试验结果表明:(1)语言的长时平均频谱随着总声级而改变,特别是低频和中频部分;(2)元音的基频F_O和共振峰,特别是F_1、F_2,随总声级的提高而提高,在相同坐标下所绘元音三角图平移并加大;(3)说话速度加快,元音三角图缩小,元音有央化的倾向;(4)总声级加大,元音-辅音(能量)比提高,但与辅音的发音方式有密切关系。  相似文献   

2.
张家■:中国科学院声学所研究 员,中国声学学会常务理事,语 言、听觉和音乐声学分会主任, 《应用声学》副主编。主要从事 言语科学和言语技术研究。设计 了汉语普通话清晰度试验方法和建立了汉语可懂度理论基础;导出了汉语清晰度指数;建立了不同语言单位清晰度试验得分之间的统计关系,并且证明了汉语音节结构有助于提高可懂度。在不同语速、不同声级下测得了远场和近场的语言长时平均频谱。定量地证明了汉语声调对提高可懂度的作用。揭示汉语元音的内在音高规律并实验研究语音产生中的相互作用。曾获国家自然科学三等奖,中国科学院…  相似文献   

3.
超音段特征间的相互作用   总被引:2,自引:1,他引:1  
在五种不同的发音方式(大声、正常、小声、加快和放慢)下,研究说话声级、说话速度和言语基频F_O之间的相互作用。发音人一男一女,言语材料为四个元音/a,i,u,u/,在不同声调下嵌入负载句。结果表明:1.说话声级提高导致基频升高、音域扩大,说话速度变化对基频影响较小,只是速度加快音域下限略有上升;2.单句的起始基频主要决定于说话声级;3.单句的基频F_O下降率既与说话速度又与说话声级都有关系;4.句尾基频跟说话方式关系不大。  相似文献   

4.
言语平均频谱是言语信号的主要物理特性之一.它对于计算言语可懂度和设计言语传递系统是必不可少的参数.本文讨论根据测量数据通过近似、修匀以后计算得出汉语标准频谱.言语标准频谱与实际测得的言语平均频谱相差不大,但其形状简单,便于应用,甚至可用简单的解析式来代表,从而大大便利于各种工程设计.总观汉语平均频谱,可以看出,男声在250赫和500赫、女声在300赫和600赫左右有两个谱级最大的区域.在这两个区域之间,有一略为下降的小谷.这两个峰与基频和第一共振峰有关(有些音的第一共振峰与基频相距甚近).男声在500赫以上、女声在800赫以上开始下跌,平均斜率为12分贝/倍频程.但由于第二、第三共振峰的影响,使得曲线在1600到3000赫之间又略有起伏.  相似文献   

5.
包紫薇  魏荣爵 《物理学报》1960,16(6):338-347
语言是一个物理现象。从物理的角度来研究语言的工作有着多方面的内容,其中最主要的一项是语音能谱的分析——包括各个音素的频谱分析和整个语言的平均频谱分析。所谓“平均”频谱,就是人们日常谈话时声压按频率的统计分布。它是设计传送语言的系统(电话、广播、电影录音等)时很重要的参考资料。本文所述的是测量汉语中的普通话和上海方言平均频谱的结果。测量时采取的是分析语噪声的方式,包括在万人以上的大会中的现场测量和在消声窒中的测量。语噪声方式比别的方式有着一定的优越性。文中列出了普通话和沪语的平均谱曲线,并将汉语(普通话)与  相似文献   

6.
本工作研究了在一次持续百余天的模拟试验中强噪声(95—110分贝,每天8小时)、高室温(35℃)等环境因素对人听觉功能的影响.9名受试者在进入模拟环境后,听力在30多天时下降最多达25—35分贝,以后即趋于稳定.音调辨别阈△F在60天后才开始增大,并有随时间而继续增大的趋势.响度辨别阈、声源定位误差、短期记忆正确率等在整个试验中均无明显的规律性变化.在离开模拟环境后,听力和△F在数天至一月内完全恢复正常.试验结果表明,所给的环境条件对人听觉功能的影响是暂时性的.文中讨论了环境因素对神经系统总功能状态的影响及其评定问题.  相似文献   

7.
用1/3倍频程滤波器作精密频率测量   总被引:1,自引:0,他引:1  
这里我们提出一种“邻带差值法”,利用三个滤波器电压输出差值,以较精确地测量信号频率.这种方法不但可以较精确地测量稳定纯音,也可以测量复杂周期信号的基频,并对时间变化有较好的分辨能力.当电庄读数精度为1分贝时,测量频率精度优于0.4%(频率). 在对各种信号进行频率分析时,经常会遇到在频率维和时间维上的要求相互矛盾:要准确测定频率,便不能准确测定时间;而要准确测定时间,又不能准确测定频率.特别是常用的频率分析设备多半是由通带较宽的滤波器组成的,如在声学测量中常用1/3或1/1倍频程滤波器.利用这样的滤波器对离散频谱(如语音)进行…  相似文献   

8.
一种改进的基于层次聚类的说话人自动聚类算法   总被引:1,自引:0,他引:1  
王炜  吕萍  颜永红 《声学学报》2008,33(1):9-14
说话人聚类是语音识别以及音频检索等众多语音应用的重要组成部分.提出一种改进的基于层次聚类的说话人聚类算法,对层次聚类法做出了进一步改进:(1)改进误差平方和准则以提高聚类速度;(2)引入假设检验方法确定类别数目;(3)提出一种稳健的在线聚类方法以解决对新到来的语音段进行聚类的问题.在聚类实验中,算法的平均类纯度和说话人纯度分别为96.7%和96.6%.实验结果还表明,相比手工标注说话人信息,将该算法的聚类结果应用于说话人自适应可降低系统的误识率.  相似文献   

9.
Mel子带谱质心和高斯混合相关性在鲁棒话者识别中的应用   总被引:1,自引:0,他引:1  
邓菁  郑方  刘建  吴文虎 《声学学报》2006,31(5):471-475
提出了两种方法以克服背景噪音的干扰并提高说话人识别系统的鲁棒性:一种方法是基于频谱峰值位置受背景噪音影响相对较小的考虑,将子带幅度信息和子带Mel频谱质心(SMSC)相结合;另一种方法是通过计算类转移概率矩阵来对隐藏于高斯混合相关(GMC)中的说话人高层信息进行建模。实验表明SMSC和GMC都能够在平稳噪音环境下提高说话人识别系统的鲁棒性,并且采用SMSC和GMC的GMM-UBM系统跟使用传统MFCC的GMM-UBM基准系统相比,平均错误率下降了11.7%。  相似文献   

10.
通过对高频语抗噪声通讯系统的研究,并经实验证明该系统的高频语通讯具有很强的抗环境噪声功能,较好地解决了噪声环境中的传递语音,高频语生成的数学表达。高频语通讯装置的研究设计;采用该装置在实验室内分别用语音声级85、90,95dB(A)在高于该声级的噪声环境下作或懂度实验研究;高频语声级90dB(A)在舰船主机舱室105dB(A)环境下载与不载耳塞的可懂度试验,该系统的形成,在语音,环境噪声比为-10至-15dB时语言可懂度可达90%以上,从理论上升到研制装置成功,突破了传统的语言传递遵循部位机理的信噪比必须为+5dB的论点。  相似文献   

11.
本文在文献(1)的基础上,试验用两种声源和多次声暴露研究次声对人血压的影响,此外还观察了异常血压和和人年龄的关系,这些试验结果对制定安全次声级有参考意义。  相似文献   

12.
数值模拟不等距叶片对贯流风机的影响   总被引:3,自引:0,他引:3  
贯流风机的通过频率(BPF)是其重要的噪声频率.降低BPF噪声可以降低基频处的声压级,其中一种方法是采用不等距叶片.本文采用3种叶片距分布形式,采用realizable k-ε两方程和大涡模拟(LES)湍流模型模拟了风机的内流场,计算线性欧拉方程(LEE)中声源项得到声源位置及强度,采用基于Lighthill声类比的FW-H积分方程获得了叶轮和蜗舌处偶极子型的离散噪声频谱.比较了不同叶片距对风机性能,噪声特别是BPF噪声的影响.计算结果表明在对性能影响较小的情况下,不等距叶轮可降低BPF噪声和总A声级噪声.  相似文献   

13.
本文试验研究了扩压器几何参数对一高速离心风机的噪声的影响。扩压器的几何参数包括叶片数、叶轮与扩压器的径向间隙和倾斜前缘倾角以及它们的耦合作用对风机噪声的影响。试验结果表明:(1)风机A声级噪声随扩压器叶片数增加而下降,但气动性能也随之下降;(2)扩压器前缘半径从R_3/R_2=1.03增加到1.07,在设计点风机A声级噪声降了约3 dB(A),继续增大至1.09则基本不变;(3)适当倾斜扩压器前缘可有效降低风机噪声,在设计点30°倾角扩压器相应的风机A声级噪声下降了约3.6 dB(A);(4)倾斜扩压器前缘与增大径向间隙的降噪效果不能叠加。  相似文献   

14.
采用归一化补偿变换的与文本无关的说话人识别   总被引:10,自引:0,他引:10  
在噪声环境下,特别是当说话人识别最常用的模型——高斯混合模型(GMM)失配的情况下,需要对其输出帧似然概率的统计特性进行补偿。文章根据说话人识别的声学特性,提出了一种非线性变换方法——归一化补偿变换。理论分析和实验结果表明:与常用的最大似然(ML)变换相比,该变换能够提高系统识别率,最大可达3.7%,同时可降低误识率,最大可达45.1%。结果说明归一化补偿变换方法基本克服了在与文本无关说话人识别系统中,当说话人的个性特征不断变化、语音与噪声不能很好地分离或者降噪算法对语音有损伤、模型不能很好地匹配时,需要对模型输出的似然概率(得分)进行补偿的局限。这也说明对模型输出的似然概率进行处理是降低噪声和干扰的影响、提高说话人识别率的有效方法。  相似文献   

15.
文章给出了水声波导模型下垂直阵和单水听器测量水下目标辐射噪声的误差和修正方法,以便使两种测量结果一致和统一。在设定典型水声波导的参数后,用波数积分方法计算出声源到垂直阵各阵元的信道传输函数,再推导出垂直嵌套阵聚焦波束的信道传输函数,从而得到单水听器和垂直嵌套阵的测量误差。数值计算表明在70 m海深条件下,不同深度单水听器测量单频信号频谱级起伏达15 dB以上,总声级测量误差的均值为3 dB,而垂直嵌套阵测量单频信号频谱级起伏仅4 dB,总声级测量误差的均值趋于0 dB。海上实验测量单频信号声源级的结果与数值计算的起伏一致,海试中垂直阵获得较高的空间增益。结论是在浅海条件下垂直阵的测量精度高于单水听器的测量精度,用单水听器测量的目标总声级需要修正时可以修正,而用单水听器测量的单频信号声源级则难以修正。  相似文献   

16.
本文叙述抑制声反馈的频移器的设计,并进行了实验研究.当语言扩声系统的传声器和扬声器之间插入频移器时,传声器信号的所有频率分量都偏移一个常量,这种方法可以减少语言扩声系统在有声反馈时产生的两类畸变.对于一般厅堂,扩声声级大约可提高5—8分贝.对于具有分布式扬声器的窒外扩声系统,也有类似的效应.若语言扩声系统临近不稳定状态工作,频移器可以有效地减少再生混响干扰.  相似文献   

17.
平交路口交通噪声的测量分析与模型计算结果   总被引:1,自引:0,他引:1  
本文给出了对有交通控制信号的十字型平交路口,交通噪声(以下简称路口噪声)的测量及统计分析结果。指出用统计声级L_50和L_90来衡量时,路口噪声比所谓自由车流噪声要高出3—7dB(A);而用L_10和等效声级L_eq的衡量时,两者几乎没有区别,虽然两者给人的感觉有所不同。通过与点声源路口噪声模型的计算结果对比,得出路口噪声统计声级L_50增高是因为两条道路相交,横路上车辆的运动噪声对总噪声能量的贡献。文中还讨论了路口噪声的统计分布和瞬时噪声级与交通控制信号之间的关系等问题。  相似文献   

18.
提出了一种融合梅尔谱增强与特征解耦的噪声鲁棒语音转换模型,即MENR-VC模型。该模型采用3个编码器提取语音内容、基频和说话人身份矢量特征,并引入互信息作为相关性度量指标,通过最小化互信息进行矢量特征解耦,实现对说话人身份的转换。为了改善含噪语音的频谱质量,模型使用深度复数循环卷积网络对含噪梅尔谱进行增强,并将其作为说话人编码器的输入;同时,在训练过程中,引入梅尔谱增强损失函数对模型整体损失函数进行了改进。仿真实验结果表明,与同类最优的噪声鲁棒语音转换方法相比,所提模型得到的转换语音在语音自然度和说话人相似度的平均意见得分方面,分别提高了0.12和0.07。解决了语音转换模型在使用含噪语音进行训练时,会导致深度神经网络训练过程难以收敛,转换语音质量大幅下降的问题。  相似文献   

19.
分析了由于说话人受到重力加速度变化而产生的变异语音(应力影响下的变异语音)的特点,把变异语音分成主体部分和变异部分两方面进行研究,提出一种动态时间规正与差别子空间相结合的孤立词语音识别方法。该方法构造差别子空间去除变异部分的影响,利用语音的主体部分进行识别,采用动态时间规正技术对语音特征矢量进行长度对齐,并提出了相应的判别标准。实验结果表明,本方法对应力影响下的变异语音具有良好识别效果,对15个词的小词表,系统平均识别率达到98.3%,与正常语音的识别率基本相当。克服了话者在应力影响下由于心理紧张和生理情况的变化,语音发生严重变异,导致常规语音识别系统性能急剧下降的缺点。  相似文献   

20.
肖东  莫福源  陈庚  郭圣明  马力 《声学学报》2013,38(5):589-596
中远距离(>10 km)水声语音通信时,由于可利用带宽窄、复杂多变等不利因素对信息传输率的制约,语音编码速率应降到尽可能的低。利用水声信道传播时延大的特点,结合人耳听觉感知的特性,在深入研究混合激励线性预测编码(MELP)标准之后,提出一种语音编码速率可调节的变比特率语音编码算法。其平均码速率约600 bps,主观语音质量评估平均得分(PESQ MOS)约2.8分。对该编码算法性能进行了计算机仿真和海上实验验证。实验及仿真表明,在误码率不高于10-3时,本算法表现良好且稳定,合成语音清晰可懂,易于辨认说话人。   相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号