共查询到17条相似文献,搜索用时 31 毫秒
1.
针对复杂环境下动态手势识别准确率低的问题,提出了一种基于长短期记忆网络和卷积神经网络的动态手势识别算法。采用长短期记忆网络学习每个滤波器的权重,预测人体外形相关的滤波器组;采用卷积神经网络提取目标手势的轨迹图,创建彩色的轨迹图像;将轨迹图像送入注意力卷积神经网络训练,利用神经网络识别出复杂环境下的手势。实验结果表明,该算法能够准确地检测与跟踪手势的动态变化,并且实现了较好的手势识别准确性。 相似文献
2.
基于可见光谱的农作物病害自动化识别和诊断是一个具有挑战性的研究领域,但现有基于卷积神经网络进行病害识别的研究往往利用深层网络牺牲模型参数量来提高对单一农作物病害识别的准确率,从而造成硬件资源的浪费.为提高农作物病害识别的准确率且避免深层网络的使用,该研究将注意力机制引入农作物病害识别领域,提出了一种基于可见光谱和改进注... 相似文献
3.
基于3维空间Viterbi算法的音素模型和声调模型识别概率统合方法的研究 总被引:2,自引:1,他引:1
提出了一种在汉语连续语音识别中基于 3维空间 Viterbi算法的音素模型和声调模型识别概率的统合方法。该方法采用60个音素单位的HMM和8个声调单位的HMM作为识别用基元模型。音素和声调基元模型识别结果的统合,采用音素的HMM状态、声调的HMM状态和时间的3 维空间帧同步Viterbi 算法来实现。本文还探讨了在该方法的基础上,给予不同路径限制时的匹配统合效果,并且通过和传统的匹配统合方式的比较,证明了提出的方法的有效性。 相似文献
4.
基于非负矩阵分解和广义判别分析的掌纹识别 总被引:3,自引:0,他引:3
非负矩阵分解(NMF)具有非负性和局部性的特点,是一种新型的特征提取方法.由于NMF是非监督学习算法,运用NMF提取掌纹特征时没有考虑训练样本的类别信息,因而分类效果不够理想.为了在提取掌纹特征的同时融人类别信息,提出运用非负矩阵分解和广义判别分析(GDA)相结合的方法进行掌纹识别.为了降低计算的复杂性,在特征提取之前,应用小波变换对掌纹图像进行三级分解,提取低频子图像.在低频子图像上应用NMF+GDA提取掌纹特征,计算特征向量间的余弦距离进行掌纹匹配.运用PolyU掌纹图像库进行测试.结果表明,与主元分析(PCA)、独立元分析(ICA)和NMF相比,算法的等误率(EER)最低为0.16%,特征提取和匹配总时间为0.812 s,满足实时系统的要求. 相似文献
5.
6.
杜兴氏肌营养不良(DMD)是一种严重的儿童腿部神经肌肉罕见病。传统的诊断和检测方案一般为有创手段,会带给患儿极大的痛苦。基于受试者的磁共振图像(MRI),采用计算机辅助检测手段探索了有效的无创检测方法。实验分别选用sym4和db4两种小波基函数,对患儿组和健康对照组的MRI进行三种尺度的小波分解,从所得的分解图像中提取12个纹理特征参数,并利用人工神经网络(ANN)算法对图像参数进行分类识别。结果显示:在受试者的两类MRI加权图像(T1和T2)中,T1图像能更好地区分患儿与健康儿童;利用db4函数对图像进行小波分解,其效果略优于sym4函数,且在三种小波分解尺度中,以二层分解最优;利用ANN算法对图像进行分类识别,其灵敏度、特异度和准确率分别高达98.5%、97.3%和97.9%。该处理方法有望为临床提供客观有效的辅助诊断手段,可作为DMD疾病无创检测的尝试探索。 相似文献
7.
8.
I.TntroductionStatisticalandneuralnetworkmcthodsforpatternclassiflcationusesignificantlydifTerentapproachesintrainingaclassificr.Inthestatistica1approach,thcformationofaclassifier1arge1ydependsonthestatisticsofthetrainingpatternsand,insomecases,theassumptionsaboutthedistributionofthepopulation.Theneuralnetworkmethodisnon-parametricandcanbeadaptivcinthetrainingprocessl'l.Becauseofitssimplicityandflexibility,theneuralnetworkhasbecnincreasing1yusedforpatternclassiflcation.Itisnowwe11knownthatan… 相似文献
9.
10.
11.
本文以介绍第五届欧洲言语通讯和技会议-Eurospeech’97及其卫星会议为主,概述言语科学与技术研究领域的国际学术会议情况以及本领域的最新发展。 相似文献
12.
当前基于深度神经网络模型中,虽然其隐含层可设置多层,对复杂问题适应能力强,但每层之间的节点连接是相互独立的,这种结构特性导致了在语音序列中无法利用上下文相关信息来提高识别效果,而传统的循环神经网络虽然做出了改进,但是只能对上文信息进行利用。针对以上问题,该文采用可以同时利用语音序列中上下文相关信息的双向循环神经网络模型与深度神经网络模型相结合,并应用于语音识别。构建具有5层隐含层的模型,其中第3层为双向循环神经网络结构,其他层采用深度神经网络结构。实验结果表明:加入了双向循环神经网络结构的模型与其他模型相比,较好地提高了识别正确率;噪声对双向循环神经网络汉语识别有重要影响,尤其是训练集和测试集附加噪声类型不同时,单一的含噪声语音的训练模型无法适应不同噪声类型的语音识别;调整神经网络模型中隐含层神经元数量后,识别正确率并不是一直随着隐含层中神经元数量的增加而增加,神经元数量数目增加到一定程度后正确率出现了降低的趋势。 相似文献
13.
基于神经网络的光谱识别系统的设计与分析 总被引:6,自引:4,他引:2
光谱识别技术是光谱定性分析的基础。随着模式识别技术的发展,光谱识别技术已成为医药、环保、石化等行业进行快速检测的重要的手段。神经网络具有非线性映射、自适应学习、鲁棒性和容错性等特点,在信号处理、知识工程、模式识别等领域有着广泛的应用。文章以符合朗伯-比尔定律的光谱信号为研究对象,概述了运用神经网络进行模式识别的基本原理,随后根据光谱识别的具体要求,提出了基于多特征和神经网络的光谱识别方案,并进行了系统设计,建立了基本的模型框架。最后运用实例对该方法进行了说明。 相似文献
14.
15.
16.
一种改进的DNN-HMM的语音识别方法* 总被引:1,自引:1,他引:1
针对深度神经网络与隐马尔可夫模型(DNN-HMM)结合的声学模型在语音识别过程中建模能力有限等问题,提出了一种改进的DNN-HMM模型语音识别算法。首先根据深度置信网络(DBN)结合深度玻尔兹曼机(DBM),建立深度神经网络声学模型,然后提取梅尔频率倒谱系数(MFCC)和对数域的Mel滤波器组系数(Fbank)作为声学特征参数,通过TIMIT语音数据集进行实验。实验结果表明:结合了DBM的DNN-HMM模型相比DNN-HMM模型更具优势,其中,使用MFCC声学特征在词错误率与句错误率方面分别下降了1.26%和0.20%。此外,使用默认滤波器组的Fbank特征在词错误率与句错误率方面分别下降了0.48%和0.82%,并且适量增加滤波器组可以降低错误率。总之,研究取得句错误率与词错误率分别降低到21.06%和3.12%的好成绩。 相似文献
17.
I.IntroductionRecentlytherearemanykindsofsystemsandproductsforspeechrecognition,butalmostallofthemareworkinginquietenvironment,theperformancearedegradedorevencan'tworkwhenitisoperatedinhighnoisyenvironmentssuchasincockpits,vehicle,workshopsetc.SonoiserobustnesshasbecomeoneofthemainobstaclesfortherealaPplicationsoftheautomaticspeechrecognizersanditattractstheattentionofresearchersinspeechtechnologyareas.Since1978,substantialeffortshavebeendevotedtotestandevaluatethespeechrecognizersusedinfight… 相似文献