期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

《汉语人机语音通信基础》介绍

下载免费PDF全文

张毅颖《应用声学》2010,29(3):240-240

2010年4月,中国科学院声学研究所研究员张家騄先生所著的《汉语人机语音通信基础》一书在上海科学技术出版社出版。张家騄先生是新中国从事语言声学研究的老一代科研工作者之一,长期从事语言通讯和语音学等领域的相似文献

2.

汉语普通话语音数据库

孙金城陈希清李昌立莫福源倪宏李彤《声学学报》1991,16(6):466-471

中国科学院声学研究所建立了一个汉语普通话语音数据库,这个语音数据库由声母、韵母、1282个单音节、几百个双音词和三音词、语音试验句、短文及数字0—9等构成。该语音数据库的发音人有六位(三男三女),他们是广播学院的教师和职业播音员,讲标准的汉语普通话。语音材料录制在高质量的磁带上,其中有一部分已数字化。已有许多汉语语音研究部门使用该语音数据库。相似文献

3.

语音通信降噪研究

下载免费PDF全文

田玉静左红伟王超《应用声学》2020,39(6):932-939

语音通信系统中,语音通过信道传输将不可避免地引入码间串扰和信号畸变,同时受到噪声污染。本文在分析自适应盲均衡算法CMA(constant modulus algorithm）和改进盲均衡算法的基础上,考虑到自适应盲均衡技术在语音噪声控制方面能力有限,将自适应盲均衡技术与小波包掩蔽阈值降噪算法联合使用,形成一种基带语音增强新方法。仿真试验结果显示自适应盲均衡技术可以使星座图变得清晰而紧凑,有效减小误码率。研究证实该方法在语音信号ISI和畸变严重情况下,在白噪及有色噪声不同的噪声环境中都具有稳定的降噪能力,消噪同时可获得汉语普通话良好的听觉效果。相似文献

4.

汉语语音的动态频谱

张家齐士钤《声学学报》1984,(4)

利用为电话传输质量评价而设计的试验句,对汉语语音的动态特性进行了分析研究。发音人男女各六人,每个人分别在消声室中发音。试验条件包括:(1)五种不同的发话声级(距发音人唇部1m远,声级为55、60、65、70和75dB),(2)两种不同的说话速度(正常的和加快的)。试验结果表明:(1)语言的长时平均频谱随着总声级而改变,特别是低频和中频部分;(2)元音的基频F_O和共振峰,特别是F_1、F_2,随总声级的提高而提高,在相同坐标下所绘元音三角图平移并加大;(3)说话速度加快,元音三角图缩小,元音有央化的倾向;(4)总声级加大,元音-辅音(能量)比提高,但与辅音的发音方式有密切关系。相似文献

5.

提高汉语清晰度的语音处理

张伟平秦诒纯《声学学报》1987,12(6):442-449

根据语音不同频区在清晰度中所起的作用及感音性聋患者听力改变的多样性,作者设计和试制了一台具有滤波、动态范围压缩及频率补偿等功能的TB—1型听力补偿测定仪。用它可以选定不同患者所需的最佳听力补偿方式,为配制专用助听器提供依据。选择该仪器提供的语音处理,可使正常人在信噪比为0dB时的语音清晰度从66.6%提高到87.4%;使感音性聋患者在安静环境、信噪比为6dB和0dB时的语音清晰度分别从42.1％提高到66.0%,从45.8%提高到78.0%及从40.3%提高到71.0%。文章讨论了该仪器的语音处理方式及其应用方面的一些问题。相似文献

6.

汉语语音视位的研究 总被引：7，自引：0，他引：7

下载免费PDF全文

王志明蔡莲红《应用声学》2002,21(3):29-34

MPEG-4首次作为国际标准正式定义了视位（Viseme）的概念，它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究，将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图象，从MPEG-4所规定的68个面部动画参数（FAP）中提取出28个来描述这些口形，并实现了部分FAP参数的自动测量，最后，我们给出一个视位研究应用的实例。相似文献

7.

单通道语音增强算法对汉语语音可懂度影响的研究 总被引：1，自引：0，他引：1

杨琳张建平颜永红《声学学报》2010,35(2):248-253

考察了当前常用的几种单通道语音增强算法对汉语语音可懂度的影响。受不同类型噪音干扰的语音经过5种单通道语音增强算法的处理后,播放给具有正常听力水平的被试进行听辩,考察增强后语音的可懂度。实验结果表明,语音增强算法并不能改进语音的可懂度水平;通过分析具体的错误原因,发现听辩错误主要来自于音素错误,与声调关系不大;而且,同英文的辨识结果相比,一些增强算法对于中、英文可懂度影响差异显著。相似文献

8.

汉语连续语音数据库的语料设计 总被引：10，自引：0，他引：10

祖漪清《声学学报》1999,(3)

质量优良的语音识别系统或语音合成系统需要高质量的、在语音学和语言学知识指导下设计的科学合理简洁有效的连续语音数据库的支持．在目前阶段,汉语语音数据库应限制在朗读言语（readspeech）的音段方面。为了描写语流中的音变现象,考虑如下语音单元：（1）不计声调的音节（401个）。（2）音节间的双音子415个。（3）音节间的三音子3035个,这是根据37个基本音子,利用音节间共振峰过渡的研究结果,按规则规纳的结果．（4）所有音节间过渡段的韵母一声母结构,采用和同三音子相同的归并方法,共781个．为了增加不同的韵律结构,并考虑语音识别系统的后处理,语料还包括汉语的17类基本句型．选用1993、1994两年的“人民日报”、“百家报刊精选”及若干电视剧本、词典词库作为语料库的原始语料,从中选出2185个句子和388个短语作为朗读语料,它们覆盖了99．8％个无调音节,100％的双音子,99．6％的三音子,以及17类句型。相似文献

9.

汉语耳语音孤立字识别研究 总被引：6，自引：0，他引：6

下载免费PDF全文

杨莉莉林玮徐柏龄《应用声学》2006,25(3):187-192

耳语音识别有着广泛的应用前景,是一个全新的课题.但是由于耳语音本身的特点,如声级低、没有基频等,给耳语音识别研究带来了困难.本文根据耳语音信号发音模型,结合耳语音的声学特性,建立了一个汉语耳语音孤立字识别系统.由于耳语音信噪比低,必须对其进行语音增强处理,同时在识别系统中应用声调信息提高了识别性能.实验结果说明了MFCC结合幅值包络可作为汉语耳语音自动识别的特征参数,在小字库内用HMM模型识别得出的识别率为90.4%. 相似文献

10.

噪声环境中的汉语浊语音检测 总被引：1，自引：0，他引：1

李正友李天伟黄谦隋振庚《声学学报》2014,39(4):517-522

为了在低信噪比和复杂噪声环境下检测汉语浊语音,根据浊语音谐波结构特性,提出了一种鲁棒的浊语音检测方法。通过改进的谱跟踪算法,得到能表征浊语音谐波特性的一簇谱线;从谱线簇中提取谐波特征作为汉语浊语音检测的依据。在不同信噪比和不同噪声环境下的浊语音检测对比实验中全面优于传统方法,在0 dB信噪比时正识率高于传统方法约30%。实验结果表明,该方法在低信噪比和非平稳复杂噪声环境下都具有较好的浊语音检测效果。相似文献

11.

汉语语音的非线性动力学特性分析 总被引：2，自引：0，他引：2

胡水清张宇华一满杜功焕《声学学报》2000,25(4):329-334

用非线性动力学方法对正常语速的汉语语音进行了初步研究,对关税维算法进行了改进以适合语音信号的特点,文章给出了摩擦音和单元音汉语的相空间重构图及关联维曲线,发现由于它们在发声机制上的不同,关联维算法能够区分摩擦音和单元音,同时初步研究表明,关联维算法也能为区分汉语四声提供信息。相似文献

12.

汉语单音语音的频谱分析实验 总被引：1，自引：0，他引：1

姚若河钟子敏邱桂明吴魏雄《广西物理》2001,(1)

介绍了一个用频谱分析的方法对汉语单音语音进行分析的实验。通过对不同发声人对同一汉字的发音进行频谱分析 ,得出其相应的频谱特性或变化规律。相似文献

13.

第三届全国人机语音通讯学术会议在重庆召开

下载免费PDF全文

齐士钤《应用声学》1995,14(2):47-45

第三届全国人机语音通讯学术会议（NCMMSC－94）于1994年10月24日至27日在重庆西南师范大学学术交流中心举行．这次会议是由中国自动化学会模式识别与机器智能专业委员会、中国电子学会信号处理学会语音图象通讯专业委员会、中国声学学会语言、听觉和音乐声学分会、中国中文信息学会基础理论专业委员会、中国通信学会通信理论专业委员会和国家高技术智能计算机系统专家组等六单位联合主办，由四川大学计算中心承办．会议主席由平国声学学会语言、听觉和音乐声学分会主任委员张家股教授担任、副主席有方像棠教授等七人、程序委员会由王仁… 相似文献

14.

基于连续HMM的汉语数码语音识别系统

钟明辉曹乃文黄汉明郑建华陈芽玲《广西物理》2007,28(4):24-26

探讨了连续隐马尔可夫模型的基本原理及其在汉语数码语音识别中的应用,实现了一个汉语数码语音识别系统,其正确识别率达到99%以上。相似文献

15.

汉语连续语音识别的语速自适应算法 总被引：4，自引：3，他引：1

王作英李健《声学学报》2003,28(3):229-234

在连续语音中,不同的说话者在不同语境下说话的速度差异是很大的。偏离正常语速往往会造成识别错误,使识别性能下降。考虑到语速对于语音单元段长的影响是同步增长或同步下降的,相邻语音单元的段长之间存在很强的相关性,本文从利用段长的相关信息出发,在基于段长分布的隐含马尔可夫模型(DDBHMM:Duration Distribution Based HMM)的框架上,提出了一种语速自适应算法。对数字串和大词汇量连续语音识别的试验表明这个算法是有效的。相似文献

16.

汉语人机对话系统语音试验材料集设计

孙金城李昌立莫福源李彤倪宏《声学学报》1993,18(6):455-462

根据汉语语音特点,为汉语人机对话系统设计了反映汉语语音主要特征、现象的语音试验材料集,作为汉语人机对话系统语音知识库的素材,用于研究语音合成规则、训练语音识别模板等.语音材料的选择以全面、典型、适量为原则,以反映汉语语音的韵律特征和音色特征的变化规律为目的,分别以声调及其组合、声韵组合为基础选择语音材料.全部材料已用数字录音机录制完毕。相似文献

17.

汉语通信系统客观音质评价方法 总被引：5，自引：0，他引：5

吴淑珍 LouisC.W.Pols 《声学学报》1998,23(2):170-174

提出一种使用语音频谱动态特性的倒谱距离测量对通信系统或通信设备进行客观音质评价方法.它是在对语音通信中主、客观音质评价的研究并在使用LPC倒谱距离评价普通话语音质量的基础上发展起来的。语音频谱动态特性是利用倒谱系数对时间的回归分析来表示的.这种方法中,使用倒谱系数,回归系数和能量三个参数计算距离。比较了四种距离估算方法和主观音质评价(MOS)的相关性,结果表明该方法的综合评价与MOS得分的相关性最好,相关系数为0.954,取得了客观评价方法与主观评价方法一致的结果。相似文献

18.

汉语连续语音识别中语音处理和语言处理统合方法的研究 总被引：4，自引：1，他引：4

赵力邹采荣吴镇扬《声学学报》2001,26(1):73-78

提出了一种语音处理和语言处理按帧同步统合的汉语连续语音识别方法。该方法把基于 CFG语言模型和 Top Down型句法分析器的语言处理过程结合进基于有限状态自动机控制的 One Pass Viterbi语音识别算法中,实现了帧同步的语音语言处理的统合。为完成帧同步句法分析的单词预测和语音识别过程的结合,本文提出了一种类似于Earley法的 TopDown型句法分析方法以及 One Pass Viterbi算法中的有限状态自动机动态展开建立法. 60个音素单位和 8个声调单位的 HMM作为识别用基元模型被用于识别实验,识别结果表明,对于一个识别困难度(Perplexity)为27.3的任务(Task)的识别系统,利用本文提出的方法,10名话者发音的 1070句子的平均识别率达到 94.4%,比利用传统的基于单词确认(Word Spotting)以及从单词串(列)(lattice)进行句法分析的阶层性语音·语言统合方式的识别率提高约8%. 相似文献

19.

基于X射线的空间语音通信系统

下载免费PDF全文

邓宁勤赵宝升盛立志鄢秋荣杨颢刘舵《物理学报》2013,62(6):60705-060705

提出了栅控X射线源作为发射器和基于微通道板的X射线单光子探测器作为接收器的X射线通信方案. 搭建了基于X射线的空间语音通信系统, 详细介绍了信号调制发射器、基于微通道板的X射线单光子探测器及信号接收解调器的设计及工作原理. 报道了基于X射线的空间语音通信系统的初步实验结果, 实现了优于20 kbit/s的基于语音信号调制的X射线通信. 实验分析了在不同X射线强度、信号整形时间和阈值设置下通信性能影响, 得出了X射线发射功率限制X射线通信速率的结论, 提出了下一步提高X射线通信性能的改进方案. 关键词： X射线通信 X射线源探测器相似文献

20.

基于双向循环神经网络的汉语语音识别*

下载免费PDF全文

李鹏杨元维杜李慧高贤君周意蒋梦月张净波《应用声学》2020,39(3):464-471

当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。相似文献