期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

利用微机产生彩色语图的方法

下载免费PDF全文

孙金城吕士楠《应用声学》1988,7(4):20-23

本文在参考现有国内外计算机作语图的方法的基础L,提出用微机产生语图的方法,在不需要增加任何设备的条件下,利用软件作出彩色三维语图(没有彩色显示器时可作出黑白语图),质量可以和语图仪作出的语图相比拟。相似文献

2.

语声频谱分析与显示的新方法

滕文善《声学学报》1986,(1)

本文介绍一种声谱分析及显示方法,旨在使用计算机对语声或其他类似信号进行综合研究的环境下,获得象在实验室中使用语图仪和示波器那样方便而且直观的分析手段。本方法利用计算机的图形显示器以人机对话形式进行信号频谱和波形分析。除了显示时间波形外,它可以显示辉度调制、透视和等值线等三种形式的时变功率谱图,对已生成的谱图还可进一步解剖截面和定量分析,允许用户任意指定的作图参数达15种。相似文献

3.

用计算机行印机产生语图

下载免费PDF全文

滕文善《应用声学》1984,3(3):24-26

本文介绍用计算机在标准行印机上产生语图的方法.它主要应用于使用数字计算机进行语声信号处理的环境中.它不需要特殊设备,在不脱机的情况下获得语图,以便于随时观察处理效果从而提高了整个工作效率.文中给出了实例及与通常语图仪产生的语图进行对照.文后附有FORTRAN程序文本. 相似文献

4.

仿选择性注意机制的语音情感识别算法

梁瑞宇赵力陶华伟王青云邹采荣《声学学报》2016,41(4):537-544

有效特征的选取一直都是语音情感识别算法的关键。为此,针对语音情感特征选择与构建的问题,一种仿选择性注意机制的语音情感识别算法被提出。考虑到语音信号的时频特性,算法首先计算语音信号的语谱图;其次,模仿选择性注意机制,计算语谱图的颜色、方向和亮度特征图,归一化后形成特征矩阵;然后,将特征矩阵重排列并进行PCA降维,形成情感识别特征向量;最后,利用改进的支持向量机分类方法进行语音情感识别。对愤怒、恐惧、高兴、悲伤和惊奇5种情感的识别实验显示,基于选择性注意的方法能够获得较好的识别效果,平均识别率为85.44%。相比于韵律特征和音质特征,语音情感识别率至少提高10%;相比于其它语谱特征,识别率提高7%左右。相似文献

5.

汉语普通话辅音音长分析 总被引：10，自引：0，他引：10

齐士钤张家騄《声学学报》1982,(1)

汉语普通话辅音音长是语音的基本参数之一,在语言合成、语言识别等研究中,这一参数有很大实用价值。本测量是对七个男声、六个女声进行分析,得到普通话22个辅音的平均音长及其标准偏差。按照测量的需要,设计了试验词表。词表是由22个词组成,每个词有两个音节,每个音节有相同的辅音,不同的元音和声调。当然,每个音节长度各不相同。这样便于考察在连读中辅音音长与所在位置、相拼元音、声调的关系;比较音长绝对值与相对值的关系。发音人在消声室进行录音。他们绝大部分是青年,能讲纯正的普通话。通过录音,由语图仪进行分析。由于有些辅音频带宽、能量弱、作用时间短,在语图分析时使用高速档并提高放声电压和烧灼电压,使辅音部分在语图中能得到清晰的反映。经过统计处理,得到以下几点初步结论: 1.辅音音长与送气状态有直接关系,不送气塞音最短,送气塞擦音最长。各种发音方式之间有一定的音长比值。而音长与发音部位关系不大。 2.辅音音长与声调、全音节长度关系不大,但送气塞擦音受后接元音影响,元音开口度大音长短。 3.在连读中,前后两音节中的辅音长度与所在前后位置无关。相似文献

6.

声源追踪训练对语音型噪声中语音识别的影响

下载免费PDF全文

杜衣杭方卫宁《声学学报》2019,44(5):945-950

听觉训练可以提升人在噪声环境中语音识别的绩效.首先设计了一种以稳定声源为刺激的听觉追踪任务,在20个训练单元后,采用由干扰语音类型和信噪比两个因素构成3×5语音型噪声掩蔽下的语音识别测试验证了该训练方法的有效性.结果发现,训练组的语音识别率显著高于对照组,证明听觉注意力可以通过声源追踪任务的训练得到提高。实验结果表明,声源追踪训练可以使人在语音型噪声掩蔽下的听觉注意力水平趋于稳定。相似文献

7.

电子切音器及其在语音实验中的应用

下载免费PDF全文

吴阿华《应用声学》1985,4(1):17-21

在实验语音学中,为获得语音的时长参数,需要采用切音的办法.我们研制了电子语音切音器,既可以方便准确地切取不同部位,不同长度的音段,还可以做语音时长的测量,语流的重新组合等语音学实验,所得结果用数字显示. 用它做了一些音节互换,在听感上造成声调变化的初步实验.结果表明,对语音学研究有一定的意义. 相似文献

8.

全息声谱显示

下载免费PDF全文

朱榕成张礼和《应用声学》1992,11(1):22-25

本文提出了一种全息声谱的编码和显示方法，全息声谱图是在二维屏幕上显示四维的声谱函数语图，它同时表征了语声的幅度谱和相位谱，在显示坐标上，除了时间轴和频率轴两维外，还分别用亮度来表示幅度谱，用色彩来表示相位谱，通过编码，我们成功地实现了这一显示系统。相似文献

9.

用计算机绘制语音信号波形的方法及其在语音信号处理中的应用 总被引：1，自引：0，他引：1

下载免费PDF全文

刘淑媛《应用声学》1988,7(2):17-20

本文介绍了一种在IBM-XT机上绘制语音信号(自然语音或合成语音)波形图的方法。这一方法可以使语音波形在屏幕上连续卷动或稳定显示某一特定帧,并给出波形上任意一点的X、y坐标,使语音工作者可以形象、直观地了解一段语音的全貌或某一局部的细节,对深入研究语音有很大帮助。文章给出了一些语音信号的波形图。相似文献

10.

混合双语语音识别的研究 总被引：1，自引：0，他引：1

张晴晴潘接林颜永红《声学学报》2010,35(2):270-275

随着现代社会信息的全球化,双语以及多语混合的语言现象日趋普遍,随之而产生的双语或多语语音识别也成为语音识别研究领域的热门课题。在双语混合语音识别中,主要面临的问题有两个:一是在保证双语识别率的前提下控制系统的复杂度;二是有效处理插入语中原用语引起的非母语口音现象。为了解决双语混合现象以及减少统计建模所需的数据量,通过音素混合聚类方法建立起一个统一的双语识别系统。在聚类算法中,提出了一种新型基于混淆矩阵的两遍音素聚类算法,并将该方法与传统的基于声学似然度准则的聚类方法进行比较;针对双语语音中非母语语音识别性能较低的问题,提出一种新型的双语模型修正算法用于提高非母语语音的识别性能。实验结果表明,通过上述方法建立起来的中英双语语音识别系统在有效控制模型规模的同时,实现了同时对两种语言的识别,且在单语言语音和混合语言语音上的识别性能也能得到有效保证。相似文献

11.

融合梅尔谱增强与特征解耦的噪声鲁棒语音转换

陈乐乐张雄伟孙蒙张星昱《声学学报》2023,(5):1070-1080

提出了一种融合梅尔谱增强与特征解耦的噪声鲁棒语音转换模型,即MENR-VC模型。该模型采用3个编码器提取语音内容、基频和说话人身份矢量特征,并引入互信息作为相关性度量指标,通过最小化互信息进行矢量特征解耦,实现对说话人身份的转换。为了改善含噪语音的频谱质量,模型使用深度复数循环卷积网络对含噪梅尔谱进行增强,并将其作为说话人编码器的输入;同时,在训练过程中,引入梅尔谱增强损失函数对模型整体损失函数进行了改进。仿真实验结果表明,与同类最优的噪声鲁棒语音转换方法相比,所提模型得到的转换语音在语音自然度和说话人相似度的平均意见得分方面,分别提高了0.12和0.07。解决了语音转换模型在使用含噪语音进行训练时,会导致深度神经网络训练过程难以收敛,转换语音质量大幅下降的问题。相似文献

12.

共振峰编辑法区别鼻化元音中口、鼻音共振峰的实证探究*

下载免费PDF全文

赵擎华杨俊杰《应用声学》2021,40(6):937-945

为解决司法话者识别中利用鼻化元音构建元音声学空间图时如何准确判别鼻化元音的口、鼻音共振峰的问题。本文通过计算机语音工作站对语音样本的共振峰进行编辑操作，利用生成的语音样本构建不同的对照组分别进行听辨。结果表明，口音、鼻音共振峰分别被衰减后的语音变化特点呈现一定规律，使用此方法可以准确区分鼻化元音的口、鼻共振峰的阶次。本文建立的“共振峰编辑”与“听觉感知”相结合的判别方法，可以为司法话者识别及语音感知、识别等相关领域通过构建元音声学空间图进行声学特征研究的模型提供口音、鼻音共振峰的判别依据。相似文献

13.

面向语音情感识别的改进可辨别完全局部二值模式

陶华伟张昕然梁瑞宇查诚赵力王青云《声学学报》2016,41(6):905-912

为了研究语音情感与语谱图特征间的关系,本文研究并提出一种面向语音情感识别的改进可辨别完全局部二值模式特征。首先,基于语谱图灰度图像,计算图像的完全局部二值符号模式(CLBP_S)、幅度模式(CLBP_M)的统计直方图。然后,将CLBP_S,CLBP_M统计直方图输入可区别特征学习模型中,训练得到全局显著性模式集合。最后,采用全局显著性模式集合对CLBP_S,CLBP_M直方图进行处理,将处理后的特征级联,得到面向语音情感识别的改进可辨别完全局部二值模式特征(IDisCLBP_SER)。基于柏林库、中文情感语音库的语音情感识别实验显示,IDisCLBP_SER特征召回率比纹理图像信息(TII)等特征提高了8%以上,比声学频谱特征平均提高了4%以上。而且,本文提出的特征可以和现有声学特征进行较好融合,融合后的特征召回率比现有声学特征召回率提高1%~4%。相似文献

14.

低信噪比下采用感知语谱结构边界参数的语音端点检测算法

吴迪赵鹤鸣陶智张晓俊肖仲喆许宜申《声学学报》2014,39(3):392-399

提出了一种采用感知语谱结构边界参数(PSSB)的语音端点检测算法,用于在低信噪比环境下的语音信号预处理。在对含噪语音进行基于听觉感知特性的语音增强之后,针对语音信号的连续分布特性与残留噪声的随机分布特性之间的不同点,对增强后语音的时-频语谱进行二维增强,从而进一步突出连续分布的纯净语音的语谱结构。通过对增强后语音语谱结构的二维边界检测,提出PSSB参数,并用于端点检测。实验结果表明,在白噪声-10 dB到10 dB的各种信噪比环境下,采用PSSB参数的端点检测算法,相对于其它端点检测算法,更有效地检测出语音的端点。在-10 dB的极低信噪比下,提出的方法仍然有75.2%的正确率。采用PSSB参数的端点检测算法,更适合于低信噪比白噪声环境下的语音端点检测。相似文献

15.

语音通信降噪研究

下载免费PDF全文

田玉静左红伟王超《应用声学》2020,39(6):932-939

语音通信系统中，语音通过信道传输将不可避免地引入码间串扰和信号畸变，同时受到噪声污染。本文在分析自适应盲均衡算法CMA(constant modulus algorithm）和改进盲均衡算法的基础上，考虑到自适应盲均衡技术在语音噪声控制方面能力有限，将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用，形成一种基带语音增强新方法。仿真试验结果显示自适应盲均衡技术可以使星座图变得清晰而紧凑，有效减小误码率。研究证实该方法在语音信号ISI和畸变严重情况下，在白噪及有色噪声不同的噪声环境中都具有稳定的降噪能力，消噪同时可获得汉语普通话良好的听觉效果。相似文献

16.

语音信号元音检测的新方法 总被引：1，自引：0，他引：1

屈丹王炳锡《声学学报》2003,(1)

给出了语音信号元音检测的新方法。该方法基于语音声学信号的频谱分析,不需要任何学习过程,而且适用于多种语言。利用OGI多语占语音库的英语、汉语、日语、法语四种语音对该算法进行了检测,并给出了改进算法,以及两种算法的检测率。实验结果表明该方法是检测元音的一种有效方法。相似文献

17.

粤语文语转换系统研究 总被引：2，自引：0，他引：2

龙庆华金惠生任平司徒锡康《声学学报》1993,(2)

由于计算机辅助数学(CAI)发展的需要,我们基于IBM系列微机,建立了一个粤语(广州话)文语转换系统。通过对粤语发音规律及语音参数的研究,此系统应用了共振峰参数语音合成技术,以无调音节和声调模式为基本合成单元,从自然语流中提取每个音节的共振峰语音参数并建立了供合成用的语音参数库。为实现计算机上的文语转换,自行编制了语音管理程序。此系统实现了国家一、二级汉字的广州话读音。日、英、俄文字母的发音及若干科学符号的广州话读音。且实现了计算机显示及相应发音的自由控制。相似文献

18.

基于小波变换和矢量量化的语音压缩编码方案 总被引：3，自引：1，他引：2

李淑红桑恩方《声学学报》2000,(1)

对于一种新的语音压缩编码方法——基于小波变换和矢量量化的语音压缩编码方案进行了开发和研究。该方法先对语音进行小波变换和小波包变换,然后使用矢量量化来压缩数据．我们还研究了使用摘编码方法进一步降低比特率的算法,实验结果表明对于采样频率为８ｋＨｚ,每样本量化为８ｂｉｔ的６４ｋｂｉｔ／ｓ语音信号压缩到６ｋｂｉｔ／ｓ～８ｋｂｉｔ／ｓ时,具有良好的语音质量．同时该算法还具有低延迟的优点,其算法延迟只有８ｍｓ。相似文献

19.

汉语孤立字全音节实时识别系统 总被引：1，自引：0，他引：1

陈韬李昌立莫福源《声学学报》1993,(3)

本文在大量语音实验的基础上,对汉语语音识别方法进行了较为深入的探讨,并以IBMPC/AT配以自行研制开发的TMS320C25-E型高速信号处理板为硬件基础,建立了一个特定人汉语普通话全音节实时识别系统.该系统针对汉语普通话的语音特点,采用了分层识别策略.整个系统响应时间小于0.2秒,用4遍1240个全音节语音对系统进行的严格测试表明:系统四声识别的平均正确率为99％左右,音节识别前5个候选的正确识别率分别为82％,91％,94％,96％,97％;同时,本文根据这一测试结果建立了相应的声韵母混淆矩阵和基于Shepard方法的相似度集群分析树图,并对照汉语语音合成清晰度测试结果及汉语语音知觉结构的集群分析结果,对本系统各部分进行了较为深入的分析,提出了相应的改进措施. 相似文献

20.

面向自定义语音唤醒的关键词相关的单通道语音增强

下载免费PDF全文

刘作桢吴愁黎塔赵庆卫《声学学报》2023,48(2):415-424

提出一种面向自定义语音唤醒的单通道语音增强方法。该方法预先将关键词音素信息存入文本编码矩阵,并在常规语音增强模型基础上添加一个基于注意力机制的音素偏置模块。该模块利用语音增强模型中间特征从文本编码矩阵中获取当前帧的音素信息,并将其融入语音增强模型的后续计算中,从而提升语音增强模型对关键词相关音素的增强效果。在不同噪声环境下的实验结果表明,该方法可以更有效地抑制关键词部分噪声。同时所提出方法对比常规语音增强方法与其他文本相关语音增强方法,在自定义语音唤醒性能上可以分别获得14.3%和7.6%的相对提升。相似文献