首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
汉语单音语音的频谱分析实验   总被引:1,自引:0,他引:1  
介绍了一个用频谱分析的方法对汉语单音语音进行分析的实验。通过对不同发声人对同一汉字的发音进行频谱分析 ,得出其相应的频谱特性或变化规律。  相似文献   

2.
齐士钤 《应用声学》1988,7(4):45-45
由中国计算机技术服务公司与中国科学院声学研究所共同研制的。KX+1型共振峰语音合成器于1988年6月30日在北京通过机械电子工业部部级鉴定. 该合成器为长城0520微机系列及其兼容机配备了语音输出功能.合成器可连机(插入微机扩展槽内)或脱机使用.音库包括405个无调音节、26个英文字母和39个键盘符号的语音参数,有6种声调模式,可合成汉字1、2级字库全部音节.建立了变调与轻声等规则9条,除可以键字发音外,还可以对汉字文稿阅读.可适用于各种汉字操作系统的任意汉字输入方  相似文献   

3.
曹剑芬 《应用声学》1994,12(2):21-27
本文以语言所普通话语音数据库中十五个人的零声母音节声学参数为基础,对/ao/与/ou/这样一对极易相混的二合元音韵母内部频率域和时间域特性的协同变化进行微观分析.重点解析它们的频率特性随时间而协同变化的行为及其相关结构方面的异同,并给出相应的统计参数和相关的时频协变模式.  相似文献   

4.
本文提出一种以声韵分割为基础的汉语无调单音节识别方法。这种方法由于引入声韵分割信息和声韵分段判别,显著改善了单音节的正识率。用三男一女的发音对全部403个汉语无调音节考核结果表明,第一位平均正识率为83.9%,前三位平均正识率为96.0%。  相似文献   

5.
本文给出一种以时域检测获取基音候选,以动态规划提取全局优化的基音轮廓,以多级逼近截取有效调型段的基音检测器,并利用基音特征参数进行声调识别的方法。 本系统可以在不作话者训练条件下,简单、快速、准确地进行基音检测和声调识别。系统对男、女话者各1252个不同单音节的实验结果表明,声调正识率分别为98.9%和99.4%。  相似文献   

6.
汉语语音视位的研究   总被引:7,自引:0,他引:7       下载免费PDF全文
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图象,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量,最后,我们给出一个视位研究应用的实例。  相似文献   

7.
探讨了连续隐马尔可夫模型的基本原理及其在汉语数码语音识别中的应用,实现了一个汉语数码语音识别系统,其正确识别率达到99%以上。  相似文献   

8.
目的:探索随机振动和正弦振动因素下生成语音在听觉效果上的变化规律。方法:随机振动采用频率范围2-20Hz,加速度为0.3G、0.5G、0.7G(有效值,下同),正弦振动采用频率4、6、8、10、12Hz,加速度为0.3G、0.5G;在安静及信噪比分别为0dB和-6dB三种状态下对随机振动组、正弦振组及对照组3个组的语音材料进行清晰度测试。结果:和对照组相比,随机振动组,清晰度几科没有变化,正弦振动组,0.3G时4Hz、0.5G时6Hz和8Hz作用下语音清晰度有明显降低,检验结果非常显著。研究还发现,清晰度的降低随听音环境的信噪比的降低而变得严重;结论:正弦振动对发音人发音的影响,会使通话效果变差,并且在听音环境恶劣时尤为突出。  相似文献   

9.
汉语语音合成系统评价方法   总被引:1,自引:0,他引:1  
从1994年开始,对汉语语音合成系统的工作性能定期举行全国评测.采用语言清晰度测试方法,1994年对五个不同的合成系统进行了评测和诊断.听音人为16名大学生(男8,女8),对合成言语没有经验.听音人响应是开放的听音记录.同时,还采用十点主观评价(MOS)测定言语自然度.为给出各合成系统音段层的诊断信息,对合成语音的辅音知觉混淆矩阵进行了分析.借助于对比自然言语和合成言语在不同语言层次上清晰度试验得分间的统计关系,来考察合成系统韵律特征处理的缺陷.结果表明,采用上述方法可得到评测合成系统工作性能的稳定合理的指标.有关韵律特征的评价方法有待于进一步发展.  相似文献   

10.
徐歆  胡水清  陶超  杜功焕 《应用声学》2003,22(5):36-40,44
本文应用Short[8-10]改进了的短时非线性预测方法对正常语速的汉语音节和短语进行了分析!究,揭示了汉语语音中浊音和清音的短时非线性预测能力的差异,并且发现这种差异即使在强背景噪声下仍能用短时非线性预测方法加以辨别。这些为浊音和清音的切分提供了一种可能性手段。  相似文献   

11.
12.
李昌立 《物理》2005,34(04):300-306
文章简要介绍了“语音信号处理”这一分支学科形成和发展的历史过程.指出了它在现代信息科学技术中的地位和作用.介绍了语音信号处理在应用领域的一些重要课题,如语音的低速率编码,语音的规则合成和文-语转换系统,语音识别和人-机语音对话等,这些仍然是当前研究的热点.文章最后展望了语音信号处理的发展前景,指出在这个领域还有很多难题等待人们去研究探索.  相似文献   

13.
汉语耳语音孤立字识别研究   总被引:6,自引:0,他引:6       下载免费PDF全文
杨莉莉  林玮  徐柏龄 《应用声学》2006,25(3):187-192
耳语音识别有着广泛的应用前景,是一个全新的课题.但是由于耳语音本身的特点,如声级低、没有基频等,给耳语音识别研究带来了困难.本文根据耳语音信号发音模型,结合耳语音的声学特性,建立了一个汉语耳语音孤立字识别系统.由于耳语音信噪比低,必须对其进行语音增强处理,同时在识别系统中应用声调信息提高了识别性能.实验结果说明了MFCC结合幅值包络可作为汉语耳语音自动识别的特征参数,在小字库内用HMM模型识别得出的识别率为90.4%.  相似文献   

14.
罗博文  董建绩  王晓  黄德修  张新亮 《物理学报》2012,61(9):94213-094213
多功能微分器可以满足光计算和光信号处理中的多种需求, 增强灵活性. 本文从理论上推导了一种基于相位调制和线性滤波的多功能光学微分器. 并在实验中, 将传输谱线近似为线性的光纤延时干涉仪(DI)和相位调制器级联, 得到了输入信号的两种微分结果. 通过调节DI的驱动电压调节其传输谱的漂移, 当光载波位于DI的传输谱线的谷值, 则获得信号的光场微分, 当光载波位于DI传输谱的线性斜率处, 则得到输入信号的光强微分. 通过分析各种微分的平均误差, 发现DI的线性度越高, 平均误差越小. 同时基于DI传输谱线的梳状特性,证实了多信道信号的同时微分.  相似文献   

15.
从语音信号产生的数字模型出发,对1~10这10个汉语数字的语音信号进行预处理,提取了Mel频率倒谱系数,并将特征参数序列进行非线性时间规整为固定的帧数,使用BP神经网络的训练和识别,研究该方法的可行性和有效性。结果表明,在噪声环境下1,7,9的识别率为80%,而2,3,4,5,6,8,10的识别率都是100%,识别率主要受噪声、不同人的发音不同等因素的影响。该方法具有可行性强、识别率高的特点,可应用于语音识别系统。  相似文献   

16.
Microphone array-based speech enhancement has great importance for speech communications and speech recognition. To reduce the aperture of the microphone array and to increase the effect of the speech enhancement will greatly broaden the application areas of the microphone array. An array crosstalk resistant adaptive noise cancellation method is therefore presented. And then an improved spectral subtraction algorithm is further cascaded to obtain better enhancement results. Theoretic analysis and experiments indicate that the proposed scheme needs only a very small microphone array while it simultaneously achieves a higher SNR improvement. Besides, the proposed scheme can be used in many noisy environments and is easy for real-time implementation.  相似文献   

17.
Auditory model has been applied to several aspects of speech signal processing field, and appears to be effective in performance. This paper presents the inverse transform of each stage of one widely used auditory model. First of all it is necessary to invert correlogram and reconstruct phase information by repetitious iterations in order to get auditory-nerve firing rate. The next step is to obtain the negative parts of the signal via the reverse process of the HWR (Half Wave Rectification). Finally the functions of inner hair cell/synapse model and Gammatone filters have to be inverted. Thus the whole auditory model inversion has been achieved. An application of noisy speech enhancement based on auditory model inversion algorithm is proposed. Many experiments show that this method is effective in reducing noise. Especially when SNR of noisy speech is low it is more effective than other methods. Thus this auditory model inversion method given in this paper is applicable to speech enhancement field.  相似文献   

18.
本讨论了引入人耳听觉特性的迭代维纳滤波在语音分离中的应用,即用矢量量化形成的码本反映目标话的语音特征,通过计算滤波结果与这一特征的匹配度来模拟人耳在“鸡尾酒会效应”中的注意力机制。实验结果表明这一方法有很好的效果。  相似文献   

19.
陈阿林  张素 《应用声学》1989,8(1):41-46
本文介绍了世界各国目前声音理解研究动向。主要介绍了美国DARPA第二次声音理解研究计划和日本国际电气通信基础技术研究所(ATR)的自动翻译电话系统计划。包括各项基础研究,实验系统结构,各处理部分所用方式、功能、以及计划达到目标等。并对我国声音识别,特别是汉语声音识别, 研究提出相应的建议。  相似文献   

20.
提出了一种基于一致性自监督学习的鲁棒自动语音识别方法。该方法通过使用语音信号仿真技术,模拟一条语音在不同声学场景下的副本;在通过自监督学习方式学习语音表征的同时,极大化一条语音在不同声学环境下对应语音表征的相似性,从而获取到与环境干扰无关的语音表征方式,提高下游语音识别模型的性能。在远讲数据集CHiME-4和会议数据集AMI上的实验表明,所提的一致性自监督学习算法能够取得相比已有的wav2vec2.0自监督学习基线算法30%以上的识别词错误率下降。这表明,所提方法是一种获取噪声无关语音表征、提升鲁棒语音识别性能的有效方法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号