首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
针对佤语语谱图的识别无需考虑清、浊音的影响这一特征.利用傅里叶变换将佤语转换为对应的语谱图信息,将深度卷积神经网络的AlexNet模型用于佤语语谱图识别.实验表明,语谱图识别可以有效解决语音识别过程中清、浊音对实验识别结果的干扰,实验准确率达到96%.  相似文献   

2.
3.
动物种类的识别一直是图像识别领域的重点,为了更好地对图像中动物进行识别、帮助社会对家庭宠物的管理,本论述提出一种基于ACNet模块和CBAM注意力机制模块而改进的ACResNet18模型用来识别猫狗种类,通过非对称卷积快增强网络模型的核骨架,实现更有效的特征提取,引入CBAM注意力机制加强网络识别精度,能够更精确地对图像中猫狗进行识别和分类。本次实验使用Kaggle竞赛中的猫狗数据集进行图像识别,并通过对比实验,验证了相比于原模型,改进后的模型准确率有明显提升,最终提高了模型在图像分类上的精确度和鲁棒性,证实了该模型的可靠性。  相似文献   

4.
研究一种基于神经网络的端到端中文语音识别算法.算法将语音信息处理为频谱图,基于频谱图,设计和实现一种基于卷积神经网络和循环神经网络的深度学习模型结构用于中文语音识别.模型以汉字作为标签样本,运用训练算法和序列损失函数进行模型迭代训练最终模型;采用开源数据集,通过实验验证网络结构对识别效果的影响,同时对比传统的语音识别算...  相似文献   

5.
6.
为了解决语音识别中由网络加深导致的低层特征消失、参数量大及网络训练困难的问题,基于Inception V3网络的非对称卷积思想,提出了一种改进的密集连接卷积神经网络(densely connected convolutional neural networks, DenseNet)模型。根据语音识别的长时相关性,通过密集连接块建立起不同层之间的连接关系,从而保存低层特征、加强特征传播;为了得到尺度更丰富的声学特征,将卷积核的范围进行扩大;利用非对称卷积思想分解卷积核,以减少参数量。实验结果表明,相较经典深度残差卷积神经网络模型和原始DenseNet模型,提出的模型在THCHS30数据集上的语音识别性能更好,在保证识别率的情况下,还减少了网络参数量,提高了模型训练效率。  相似文献   

7.
车速和车型作为重要的车辆信息,在道路监控系统中发挥着很大的作用.传统的基于视觉的车辆信息识别方式由于计算参数过大且提取的特征不足,难以满足智能交通实时性和普适性的需求.对此,提出了一种新的车辆信息识别方法,采用运动目标检测技术实现视频中车辆的提取,然后利用虚拟线圈法进行车速识别,再通过改进的残差网络对提取的车辆进行车型识别,有效地减少了计算参数,实现了对视频的快速处理,同时利用了残差网络极强的特征表达能力,提高了识别的准确率.此外,加入了重载车型的研究,有良好的应用前景.实验结果显示,系统车速识别平均绝对误差不超过6km/h,车型识别平均准确率达到92.1%,针对小客车和小轿车的识别准确率高达98.7%,优于传统的识别方法.  相似文献   

8.
图像分类算法常被搭载在无人机系统中,以剔除无人机巡线过程中采集到的大量无用数据.针对这一问题,本文在分析了无用图像及有用图像特征的基础上,提出了一种基于卷积神经网络的输电线路智能图像筛选方法.收集无人机巡检捕捉到的航拍图像,并以此为基础建立了一个输电线路航拍数据集,基于ResNet优化并利用航拍图像数据集训练该网络,经...  相似文献   

9.
为解决使用语音信号准确识别动物以保护和研究野生动物的问题,提出一种全连接算法与稀疏连接算法相结合的全卷积神经网络(FCNN: Fully Convolutional Neural Network),用于语音的自动识别.利用全连接算法提取更多的组合特征,稀疏连接算法筛选重要特征可加快收敛速度.同时给出了具体的模型结构及算...  相似文献   

10.
根据语音信号的“可视”特点,提出了一种基于简化脉冲耦合神经网络(PCNN)实现孤立词语音识别的方法。将语谱图输入到PCNN中得到相应的时间序列标识,作为语音信号的特征参数,然后通过模板匹配法和概率神经网络(PNN)相结合的方法实现语音分类识别。仿真结果表明,该方法能够达到较高的语音识别率。  相似文献   

11.
12.
针对目前手绘草图识别难度大,识别准确率低且主要以手工提取特征为主,提出一种新的卷积神经网络结构DCSN( Deeper-CNN-Sketch-Net) 进行手绘图像识别。DCSN 模型是根据手绘草图的特点进行设计,如在首层采用了更大的卷积核获取草图的结构信息和更小的步长尽可能多保留特征信息,通过增加网络层数加深网络深度等。为进一步提高识别准确率,针对手绘草图的特点提出了两种新的数据增强方法,小图形缩减策略和尾部移除策略增加数据集的多样性,并利用扩充的数据集训练DCSN 网络。经实验验证,所提出的模型在目前最大的手绘图像数据集上可以取得70. 5% 的识别准确率,超过了目前存在的几种主流的手绘草图识别方法。  相似文献   

13.
通过对YOLOX-S模型引入可变形卷积神经网络和焦点损失函数(Focal loss),解决原YOLOX-S模型车窗识别准确率较低的问题.首先,通过在YOLOX-S模型的主干特征提取网络中引入可变形卷积神经网络,对卷积核中的各采样点引入偏移量,以便在原始图像中提取到更具有表征的信息,从而提高车窗识别的精准度;其次,使用Focal loss替代原模型中的二元交叉熵损失函数,Focal loss能缓解正负样本不平衡对训练的影响,其在训练过程中更关注难样本,从而提高了模型对车窗目标的识别性能;最后,为验证改进算法的性能,实验收集并标注15 627张图片进行训练和验证.实验结果表明,改进后的车窗识别算法的平均目标精度提高了3.88%.  相似文献   

14.
针对目前人脸表情识别存在准确率不高、模型复杂和计算量大的问题,文章提出了一种基于八度卷积改进的人脸表情识别模型(OCNN):使用改进的八度卷积进行特征提取,提高对细节特征的提取效果,降低特征图的冗余,在不增加参数的同时减少运算量,以提高特征提取性能;利用DyReLU激活函数来增强模型的学习和表达能力;使用自适应平均池化下采样层代替全连接层,以减少参数;将模型在大规模数据集上进行预训练,并在FER2013、FERPlus、RAF-DB数据集上进行模型性能验证实验。实验结果表明:训练后的模型权重为10.4 MB,在人脸表情识别数据集FER2013、FERPlus和RAF-DB上的准确率分别达到73.53%、89.58%和88.50%;与目前诸模型相比,OCNN模型的准确性高且计算资源消耗低,充分证明了该模型的有效性。  相似文献   

15.
局部放电(partial discharge, PD)信号的检测能够为电力系统提供绝缘缺陷诊断和运行状态评估。现有的局部放电类型识别算法难以有效识别相似度较高的绝缘缺陷,限制了其应用范围。为此,提出一种基于PRPD(phase resolved partial discharge)图谱多特征融合的局部放电类型识别算法。该算法利用卷积神经网络(convolutional neural network, CNN)提取局部放电PRPD图谱图像特征,将图像特征与PD信号统计特征进行有效融合,利用融合特征识别局部放电类型。在实验室环境下建立了4种局部放电模型,并进行了模拟对比实验。实验结果表明,相比传统的支持向量机(support vector machine, SVM)和反向传播神经网络(back propagation neural network, BPNN)算法,所提出方法的正确识别率分别提高了12.82%和19.70%,对相似度较高的缺陷类型也能进行有效识别,算法具有较好的鲁棒性。  相似文献   

16.
甘宏 《江西科学》2022,40(4):758-761
随着语音识别和自然语言处理技术的成熟,智能语音技术逐步落地到各行各业,但目前智能语音产品缺乏情感的交互,未实现真正的智能。为了提升智能语音产品的拟人性,学术界对语音情感识别的研究热度越来越高,但是多局限在使用传统特征工程以及通用深度学习模型上。在应用深度学习模型的基础上引入注意力机制对语音情感识别展开研究,选用语谱图作为输入特征,并对CNN输出的特征进行通道维度的注意力关注,分析注意力计算过程中不同池化方式对识别结果的影响,并引入残差,提升模型表现力,最终UA实现了2.83%的提升。  相似文献   

17.
基于卷积神经网络的网络流量识别技术研究   总被引:2,自引:0,他引:2  
近年来,深度包检测技术和基于统计特征的网络流量识别技术迅速发展,但它们分别存在不能识别加密流量和依赖人对特征主观选择的缺陷.文章提出了基于卷积神经网络的流量识别方法,将网络数据按照一定的规则转换为灰度图像进行识别,并根据TCP数据包的有序性和UDP数据包的无序性,对原始的网络数据进行了扩展,以进一步提高识别率.实验数据表明,该方法对应用程序和应用层协议两个层次的网络流量具有较高的检测率.  相似文献   

18.
针对语音情感识别过程中特征不充分的问题,提出了约束式双通道模型,从全局和局部两方面充分挖掘特征所包含的情感信息,从而提高情感识别率.通道1是针对语音特征的全局信息,通过改进门控循环单元,构建了BAGRU(bidirectional attention gate recurrent unit)模型,提高了语音特征之间的相关性;通道2是针对语音特征的局部信息,卷积神经网络与对抗训练结合,避免了局部信息相互干扰.通过双通道融合模型,根据通道特征重要程度生成不同权重,同时引入正交约束,解决了融合时产生特征冗余的问题.研究结果表明,在IEMOCAP和EMO-DB情感语料库上分别达到了62.83%和82.19%的识别精度,表现出了良好性能.  相似文献   

19.
目的 随着公众舆论数据的快速增长,社交网络文本情感识别在网络舆情监控中发挥着越来越重要的作用。由于文本数据的稀疏性、高维性和自然语言的复杂语义,情感分析任务面临巨大的挑战。方法 为提高网络舆情情感识别的效果,设计一种融合双向门控循环单元(BiGRU)和卷积神经网络(CNN)的情感识别模型。首先将社交网络文本转换成特征向量,然后通过BiGRU提取文本的上下文情感特征,最后通过CNN提取文本的局部情感特征,构建中文社交网络文本情感识别模型。结果 以新冠疫情期间网民的微博评论为数据集验证模型的可行性和优越性,模型的精确率、召回率和F1值分别达到86.6%、87.06%和86.85%。结论 实验结果表明,融合BiGRU-CNN的特征向量包含更加丰富文本的情感信息,能够有效提升网络舆情情感识别的性能。  相似文献   

20.
相较于传统烟火、烟雾传感器检测方法,基于卷积神经网络算法的烟火检测具有更高的检测精度和效率,并能提供火灾现场全局/局部详细信息。本文提出基于改进YOLOv3算法的烟火识别,应用高斯参数设计损失函数从而建立YOLOv3边界框模型,可预测边界框定位不确定性,减少负样本;为充分利用图像局部特征信息对网络结构进行改进,以实际烟火现场图片为研究对象,完成烟火识别过程计算。利用不同拍摄角度、光照条件自制火焰和烟雾数据集进行测试,结果表明,与传统YOLOv3对比,本文提出的改进YOLOv3算法平均精度提高了4.2%。研究方法将有助于提升智能烟火预警、人员救助和险情跟踪作业水平,最终提升事故灾害的应急能力。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号