期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

实时识别中语音的时域─频域─能量表示

下载免费PDF全文

罗万伯张露李志蜀罗霄峰罗霄岚 Duanpei Wu 《应用声学》2001,20(3):31-33,10

本文提出了语音信号的一种时域－频域－能量表示,并给出了算法,可用于孤立词语音识别,这种时域－频域－能量表示有两个特点,基于短时能量梯度的非线性时间规正,可保留语音信号频域的过滤特性,丢掉其稳态特性,计算量小,适于实时应用。相似文献

2.

适用于自动语音识别的声道参数

俞铁成《物理》1998,27(2):125-125

适用于自动语音识别的声道参数￥中国科学院声学研究所＠俞铁城适用于自动语音识别的声道参数我们听到的语音是由舌、唇、喉等发音器官连续移动而产生的．这些发音器官调制嘴腔道中的气流形成语音而后到达我们的耳朵．可以自问一下，在我们感知语音时是否把这些发音器官的移动亦... 相似文献

3.

BP神经网络在汉语数字语音识别中的应用

罗梅江丽莎罗涟玲《广西物理》2012,(3):26-28

从语音信号产生的数字模型出发,对1～10这10个汉语数字的语音信号进行预处理,提取了Mel频率倒谱系数,并将特征参数序列进行非线性时间规整为固定的帧数,使用BP神经网络的训练和识别,研究该方法的可行性和有效性。结果表明,在噪声环境下1,7,9的识别率为80%,而2,3,4,5,6,8,10的识别率都是100%,识别率主要受噪声、不同人的发音不同等因素的影响。该方法具有可行性强、识别率高的特点,可应用于语音识别系统。相似文献

4.

声源追踪训练对语音型噪声中语音识别的影响

下载免费PDF全文

杜衣杭方卫宁《声学学报》2019,44(5):945-950

听觉训练可以提升人在噪声环境中语音识别的绩效.首先设计了一种以稳定声源为刺激的听觉追踪任务,在20个训练单元后,采用由干扰语音类型和信噪比两个因素构成3×5语音型噪声掩蔽下的语音识别测试验证了该训练方法的有效性.结果发现,训练组的语音识别率显著高于对照组,证明听觉注意力可以通过声源追踪任务的训练得到提高。实验结果表明,声源追踪训练可以使人在语音型噪声掩蔽下的听觉注意力水平趋于稳定。相似文献

5.

汉语耳语音孤立字识别研究 总被引：6，自引：0，他引：6

下载免费PDF全文

杨莉莉林玮徐柏龄《应用声学》2006,25(3):187-192

耳语音识别有着广泛的应用前景,是一个全新的课题.但是由于耳语音本身的特点,如声级低、没有基频等,给耳语音识别研究带来了困难.本文根据耳语音信号发音模型,结合耳语音的声学特性,建立了一个汉语耳语音孤立字识别系统.由于耳语音信噪比低,必须对其进行语音增强处理,同时在识别系统中应用声调信息提高了识别性能.实验结果说明了MFCC结合幅值包络可作为汉语耳语音自动识别的特征参数,在小字库内用HMM模型识别得出的识别率为90.4%. 相似文献

6.

自动语音识别研究的人工神经网络方法 总被引：1，自引：0，他引：1

杜利民侯自强《物理学进展》1996,16(3):585-599

相似文献

7.

面向鲁棒自动语音识别的一致性自监督学习方法

高长丰程高峰张鹏远《声学学报》2023,(3):578-587

提出了一种基于一致性自监督学习的鲁棒自动语音识别方法。该方法通过使用语音信号仿真技术,模拟一条语音在不同声学场景下的副本;在通过自监督学习方式学习语音表征的同时,极大化一条语音在不同声学环境下对应语音表征的相似性,从而获取到与环境干扰无关的语音表征方式,提高下游语音识别模型的性能。在远讲数据集CHiME-4和会议数据集AMI上的实验表明,所提的一致性自监督学习算法能够取得相比已有的wav2vec2.0自监督学习基线算法30%以上的识别词错误率下降。这表明,所提方法是一种获取噪声无关语音表征、提升鲁棒语音识别性能的有效方法。相似文献

8.

仿选择性注意机制的语音情感识别算法

梁瑞宇赵力陶华伟王青云邹采荣《声学学报》2016,41(4):537-544

有效特征的选取一直都是语音情感识别算法的关键。为此,针对语音情感特征选择与构建的问题,一种仿选择性注意机制的语音情感识别算法被提出。考虑到语音信号的时频特性,算法首先计算语音信号的语谱图;其次,模仿选择性注意机制,计算语谱图的颜色、方向和亮度特征图,归一化后形成特征矩阵;然后,将特征矩阵重排列并进行PCA降维,形成情感识别特征向量;最后,利用改进的支持向量机分类方法进行语音情感识别。对愤怒、恐惧、高兴、悲伤和惊奇5种情感的识别实验显示,基于选择性注意的方法能够获得较好的识别效果,平均识别率为85.44%。相比于韵律特征和音质特征,语音情感识别率至少提高10%;相比于其它语谱特征,识别率提高7%左右。相似文献

9.

数字示波器语音识别

房若宇李钰杰施相宇姚星星《大学物理实验》2023,(5):116-119

示波器广泛应用于大学物理实验教学中,相较于传统的模拟示波器,数字示波器将输入模拟信号转换为数字信号进行显示。设计了一个新的使用数字示波器进行人声音识别的综合性实验。实验中把压电陶瓷片贴于测试者的喉部靠近声带处,声带的振动转换为电信号后,使用数字示波器解析测试者的声音特征。在此基础上建立了含多个测试者的语音样本数据库,通过对于测试者声音频率的比对实现了对特定测试者的语音识别。该实验拓宽了示波器的实验教学内容,取得了良好的教学效果。相似文献

10.

语音识别的二值化时频图型模糊匹配法

下载免费PDF全文

戎月莉《应用声学》1994,12(5):37-41

将模糊逻辑应用于语音识别系统，具有减少数据量和计算量，提高语音识别率的优点．本文阐述了二值化时频图型模糊匹配法（BTSP）的原理，并对它目前的一些应用产品作了简单介绍．相似文献

11.

语音情感识别中的特征选择方法

下载免费PDF全文

褚钰李田港叶硕叶光明《应用声学》2020,39(2):223-230

为了解决传统卷积神经网络在识别中文语音时预测错误率较高、泛化性能弱的问题,首先以深度卷积神经网络(DCNN)-连接时序分类(CTC)为研究对象,深入分析了不同卷积层、池化层以及全连接层的组合对其性能的影响;其次,在上述模型的基础上,提出了多路卷积神经网络(MCNN)-连接时序分类(CTC),并联合SENet提出了深度SE-MCNN-CTC声学模型,该模型融合了MCNN与SENet的优势,既能加强卷积神经网络的深层信息的传递、避免梯度问题,又可以对提取的特征图进行自适应重标定。最终实验结果表明:SE-MCNN-CTC相较于DCNN-CTC错误率相对降低13.51%,模型最终的错误率达22.21%;算法改进后的声学模型可以有效地提升泛化性能。相似文献

12.

基于双向循环神经网络的汉语语音识别*

下载免费PDF全文

李鹏杨元维杜李慧高贤君周意蒋梦月张净波《应用声学》2020,39(3):464-471

当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。相似文献

13.

一种机器人智能语音识别算法研究

周璐璐邓江洪《应用声学》2014,22(10):3267-32693273

针对智能机器人在非特定人语音识别中识别率偏低的问题,提出了一种双门限的端点检测算法,精确地检测出了语音端点,对分形维数和Mel频率倒谱系数(MFCC)进行结合,同时基于隐马尔可夫(HMM)模型,提出了智能机器人命令识别系统;在实验室环境下,利用Cool Edit软件录制了5男5女的语音,采样率为8 kHz,精度为16位,内容为5个命令词,每个词均被采集6次,将每人的前3次发音作为模板语音,后3次发音作为测试语音,实验结果表明,系统识别率可以达到85%以上,MFCC与分形维数混合的语音特征参数的算法提高了系统识别率,优化了系统性能;该方法用于非特定人语音智能识别是可行的、有效的。 相似文献

14.

语音识别预处理中的ICA噪声适应性分析

韩仲志周梅芳叶洪涛覃溪黄汉明《广西物理》2006,27(1):26-28,31

针对高噪环境下语音识别的困难,提出一种基于独立分量分析的盲分离(ICA/BSS)与小波联合的语音降噪预处理方法,针对不同种类和不同输入信噪比的噪声设计了试验,结果表明基于ICA的语音识别预处理方法对低输入信噪比情况下多种噪声具有很强的鲁棒性和优越性,此结论对现实世界高噪环境下的信号分析和语音识别具有重要意义。相似文献

15.

语音识别技术在电子货架标签系统中的应用

丁磊蒋东国王志韬《应用声学》2016,24(10)

目前卖场中电子货架标签的管理系统主要部署在计算机上,计算机位置相对固定,使用键盘、鼠标交互灵活性不高、操作效率有限,针对以上管理局限,提出了一个基于Android平台和语音识别技术的管理系统设计方案,以提高操作的便携性和工作效率。实验结果表明,该语音管理系统能够以较高的识别性能和操作效率实现对ESL的可移动声控管理,有利于电子货架标签的推广和应用,同时也为基于Android平台的语音识别系统在其他控制领域的应用提供了可供参考的案例和思路。相似文献

16.

基于改进卷积神经网络算法的语音识别

下载免费PDF全文

杨洋汪毓铎《应用声学》2018,37(6):940-946

为了解决传统卷积神经网络识别连续语音数据时识别性能较差的问题,提出一种改进的卷积神经网络算法。该方法引入Fisher准则以及L2正则化约束,在反向传播调整参数阶段,既保证参数误差的最小化,又确保分类以后的样本类间分布较分散,类内分布较集中,同时保证网络权值具有合适的数量级以有效缓解过拟合问题;采用一种更符合生物神经元激活特性的新型log激活函数进行卷积神经网络的优化,进一步提高语音识别的正确率。在语音识别库TIMIT以及THCHS30上的实验结果表明,相较于传统卷积神经网络算法,本文提出的改进算法能较好的提高语音识别率,且泛化能力更强。相似文献

17.

第四讲语音信号处理的现状和展望

李昌立《物理》2005,34(04):300-306

文章简要介绍了“语音信号处理”这一分支学科形成和发展的历史过程.指出了它在现代信息科学技术中的地位和作用.介绍了语音信号处理在应用领域的一些重要课题,如语音的低速率编码,语音的规则合成和文－语转换系统,语音识别和人－机语音对话等,这些仍然是当前研究的热点.文章最后展望了语音信号处理的发展前景,指出在这个领域还有很多难题等待人们去研究探索. 相似文献

18.

基于听觉感知的语音稀疏表示及压缩感知_*

下载免费PDF全文

陈砚圃张长青谭薇杨森斌《应用声学》2014,33(1):53-59

本文针对语音信号稀疏表示及压缩感知问题,将听觉感知引入稀疏系数筛选过程,用掩蔽阈值筛选重要系数,以得到更符合听觉感受的语音稀疏表示。通过对一帧浊音信号分别采用掩蔽阈值和能量阈值方法进行系数筛选对比实验,结果表明掩蔽阈值法具有更好的稀疏表示效果。为验证听觉感知对语音压缩感知性能的影响,与能量阈值法对照对测试语音进行压缩感知观测和重构,通过压缩比、信噪比、主观平均意见分等主客观指标评价其性能,结果表明,掩蔽阈值法可有效地提高压缩比且保证重构语音具有较高的主观听觉质量。相似文献

19.

多声学场景下端到端语音识别声学编码器的自适应

下载免费PDF全文

刘育坤郑霖黎塔张鹏远《声学学报》2023,(6):1260-1268

提出了一种面向多样化声学场景自适应设计声学编码器的方法 (SAE)。该方法通过学习不同声学场景下语音中包含的声学特征的差异,适应性地为端到端语音识别任务设计出合适的声学编码器。通过引入神经网络结构搜索技术,提高了编码器设计的有效性,从而改善了下游识别任务的性能。在Aishell-1、HKUST和SWBD三个常用的中英文数据集上的实验表明,通过所提场景自适应设计方法得到的声学编码器相比已有的声学编码器可以获得平均5%以上的错误率改善。所提方法是一种深入分析特定场景下语音特征、针对性设计高性能声学编码器的有效方法。相似文献

20.

基于SOPC软核的孤立词语音识别系统设计与实现

王志高秦子雄《广西物理》2013,(1):46-49

详细分析了目前语音识别系统中普遍采用的Mel频率倒谱系数(MFCC)特征参数的提取过程和动态时间规整(DTW)识别算法流程,提出了一种在NiosII SOPC软核平台上通过提取和分析语音信号的MFCC特征参数实现语音识别解决方案。相似文献