首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 0 毫秒
1.
在语音识别研究中,为了消除特征之间的相关性,将稀疏表示引入到模式识别中;针对深度神经网络忽略了输入数据空间位置信息的缺点,将卷积神经网络引入到模式识别中,构建了基于稀疏表示的卷积神经网络。由于经过稀疏编码后的特征互不相关,可以更有效地表示样本数据,而卷积神经网络能有效利用空间信息。因此,基于稀疏表示的卷积神经网络能大幅提升系统识别性能。该研究通过对稀疏编码和卷积神经网络现状的研究,对两种方法进行了总结。  相似文献   

2.
近年来,深度学习技术不仅在人工智能领域取得了巨大成功,也为视频编码领域带来了新的发展机遇。文章从两个方面介绍了深度学习技术在视频编码领域的发展现状,即传统编码框架下深度学习视频编码工具和以深度学习模型为基础的视频编码新框架,并对相关代表性工作进行了详细介绍和性能分析。最后,对深度学习视频编码技术面临的挑战和未来发展方向做了分析和展望。  相似文献   

3.
针对当前网络系统对3D视频系统的需求,提出了一种基于深度学习的3D视频编码系统。首先,针对当前网络系统终端多样化问题,深入研究基于深度学习的鲁棒性 3D 视频编码;其次,针对当前网络系统中的设备不能处理高复杂度的问题,进一步研究基于深度学习的低复杂度3D视频编码;然后,针对当前网络系统中视频信息庞大问题,深入研究基于深度学习的高效3D视频编码;最后,针对人类是视频信息的最终接收体,深入研究基于深度学习的满足人类视觉特性的3D视频编码。实验结果表明,所提方法实现了基于深度学习的鲁棒、低复杂度、高效、符合人类视觉特性的3D视频编码。  相似文献   

4.
杨亚虎  王瑜  陈天华 《电讯技术》2021,61(2):203-210
针对复杂场景下远程视频监控图像异常检测困难、传统算法功能单一(仅针对某种特定场景或某种异常图像进行检测)等问题,提出一种基于深度学习的全自动远程视频异常图像检测方法。首先采用Xavier方法对自行设计的卷积神经网络(Convolutional Neural Network,CNN)的参数进行初始化,然后将标准化后的视频差分图送入CNN的输入层,通过特征提取及下采样,最后在CNN的输出层获得远程视频异常图像检测结果。实验结果表明,该方法可以对远程视频监控中突然出现遮挡、模糊和场景切换等多种异常同时进行实时在线检测,准确率可达88.75%。  相似文献   

5.
张秀  周巍  段哲民  魏恒璐 《红外与激光工程》2019,48(1):126005-0126005(7)
针对卷积稀疏编码算法中特征映射的准确性的问题,为了进一步提高图像超分辨率重建的的质量,文中提出一种基于卷积稀疏自编码的图像超分辨率重建算法。该算法首先在预训练阶段利用稀疏自编码器对输入高低分辨率图像分别进行训练,得到对应的图像稀疏特征表示;然后再由卷积神经网络根据得到的稀疏系数共同训练相应的滤波器及特征映射函数并更新到最优解;最后由高分辨率滤波器和对应的稀疏表示系数卷积求和,得到高分辨率重建图像估计。实验结果显示,改进算法的峰值信噪比(PSNR)结果较卷积稀疏编码算法提高了近0.1 dB,有效提高了重建图像的质量。  相似文献   

6.
7.
图像分类是通过图片所给的特征信息将不同的事物进行识别的一种图像处理技术。随着科学技术的快速发展以及人们对生活质量越来越高的需求,图像的自动分类技术已经运用到各个发展领域当中。当我们在图像上进行分类操作时,传统的图像分类方法由于不能准确掌握识别对象之间的内在联系,同时传统方法也因数据的特征性维度太高而导致识别对象的特征表达受到限制,所以取得的实验结果并不理想。针对以上内容文章提出了一种基于卷积神经网络的图像检测方法,该实验的算法主要借鉴了深度学习及卷积神经网络。与以往的传统图像分类方法不同,深度卷积神经网络模型可以同时进行特征学习和图像分类。通过对实验的各个部分结构进行改进和对卷积神经网络模型进行优化,从而防止过拟合现象,继而提高图像检测的准确度,在CIFAR-10数据库上进行的实验表明,该方法改进后的深度学习模型在图像检测方面取得了有效的结果。  相似文献   

8.
罗铖  缪辰启 《电视技术》2021,45(12):10-13
在当今这个数据爆炸增长的时代,深度学习强大的非线性建模能力进一步提高了多视点视频编码的率失真性能.对此,介绍多视点视频的特点及应用,重点对深度学习背景下现有的多视点视频编码方法进行介绍和总结,并展望多视点视频编码未来的发展趋势,旨在进一步发挥深度学习的能力,为用户提供更佳的观看体验.  相似文献   

9.
VC-1是新一代的视频压缩标准之一,具有比以往标准更高的压缩效率,适合不同领域的视频应用。本文对VC-1的特点、关键算法、性能以及发展前景进行了全面论述。  相似文献   

10.
当前的目标检测在更换检测目标时就必须重新训练卷积神经网络模型,这使得更换检测目标花费时间变多,训练成本增加,且人员对模型的了解程度要求也提高.针对此问题提出了运用卷积神经网络图像分类的方法,首先对检测目标的各个检测状态进行分类,然后运用卷积神经网络图像分类模型对输入图像实时进行图像分类,最后通过分类出来的图像类别来判断...  相似文献   

11.
2013年贾扬清博士在Github上发布了一款深度学习框架Caffe,为众多研究人员和工程师们提供了一套简单易用且性能强大的深度学习开源框架。本文首先对Caffe框架简单介绍,其次阐述深度学习中应用的卷积神经网络原理,最后介绍如何利用Caffe框架进行图像分类。  相似文献   

12.
3维卷积神经网络(3D CNN)是近几年来深度学习研究中的热点,在计算机视觉领域取得了诸多成就。虽然研究多年且成果丰富,但目前仍缺少关于此内容全面、细致的综述。基于此,该文从以下几个方面对其进行综述:首先阐述3维卷积神经网络的基本原理和模型结构,接着从网络结构、网络内部和优化方法总结3维卷积神经网络的相关改进工作,然后对3维卷积神经网络在视频理解领域中的应用进行总结,最后总结全文内容并对未来发展方向进行展望。该文针对3维卷积神经网络的最新研究进展以及在视频理解领域中的应用进行了系统的综述,对3维卷积神经网络的研究发展具有一定的积极意义。  相似文献   

13.
舒甜督  刘芳  蔡茂 《电子设计工程》2022,(21):170-174+179
对医学CT图像进行高效精确地自动分类可以有效帮助医生减轻工作负担,切实提升医生对患者病情诊断的效率,应对现今医院CT图像数量迅速增长而相关医务人员严重缺乏的问题。卷积神经网络自提出以来,已被广泛应用于各种图像分类任务中。为切实提高肺部CT图像分类任务的准确率与速度,文中具体分析了VGG16网络模型的结构以及将其应用于肺结节CT图像分类任务中的优劣势。通过实验对比,验证了迁移学习的VGG16和基于VGG16改进的模型对肺部CT图像分类任务的有效性。  相似文献   

14.
MPEG-4图像压缩编码方法是基于对象和内容的现代编码方法,顺应了现代图像压缩编码的潮流,广泛用在多媒体通信及第三代移动通信系统中。本主要介绍了MPEG-4视频对象的压缩编码方法及其差错控制方法。  相似文献   

15.
本文基于神经网络算法在人脸识别中的应用进行了研究,结果表明当前神经网络算法人脸识别算法分为:卷积神经网络人脸识别、循环神经网络人脸识别。  相似文献   

16.
杨玉涟  官钰翔  沈毅  陈豪  朱霞 《电子测试》2020,(21):60-61+99
随着科技的发展人脸识别技术得到了巨大的应用,实现人脸识别的方法也越来越多,本文先简单对比了MLP、RNN、CNN这三个神经网络,然后再对CNN的基础结构进行了一个较为详细的介绍,主要通过对LeNet-5卷积神经网络模型结构的分析来了解卷积神经网络,然后设计了一款针对Olivetti Faces人脸数据库的卷积神经网络模型,通过更改卷积层中卷积核个数以及学习速率来进行一系列实验,最终确定在本次实验当中,当学习速率为0.05时,第一层卷积层卷积核数目为20,第二层卷积层数目为40的时候,能够得到一个针对Olivetti Faces人脸数据库有着较高识别率的一个新的卷积神经网络模型。  相似文献   

17.
红外图像中的行人检测一直是计算机视觉领域的研究热点与难点。针对传统的红外行人检测方法需要人工设计目标表达特征的弊端,本文从深度学习的角度出发,提出一种可以自动构建目标表达特征的红外行人检测卷积神经网络。在对卷积神经网络的实现原理进行分析的基础上,设计了红外行人检测卷积神经网络的初始结构,然后通过实验对初始结构进行调整,得到最终的检测神经网络。对实拍红外人体数据库进行行人检测的实验结果表明,该方法在保持低虚警率的同时可以对红外图像中的行人进行稳健检测,优于传统方法。  相似文献   

18.
《信息技术》2017,(11):83-86
为了提高卫星遥感图像的识别与分类效果,提出一种基于卷积神经网络的卫星遥感图像识别与分类方法。该方法通过导向滤波去雾和旋转图像数据提高了模型的泛化能力,同时采用了双全连接层网络结构增强了模型数据表达能力。实验证明,该方法在卫星遥感图像的识别与分类上优于传统图像识别方法和一般卷积神经网络模型。  相似文献   

19.
近年来,卷积网络深度学习已在图像处理、目标检测等领域取得巨大成功。受其启发,将卷积神经网络(CNN)应用于传统视频压缩标准已成为一个新的研究热点。本文提出一种集成卷积神经网络的高效视频编码(HEVC)压缩改进算法,将下采样过程、HEVC的编解码过程、上采样及质量增强过程集成为一体。为高效提取视频帧的结构特征,在所提压缩算法中集成了两个卷积神经网络。提出了一种下采CNN(DwSCNN)代替双三次下采,在有效降低分辨率的同时保留细节信息,得到更为紧凑的低分辨率视频序列,将此低分辨率视频序列通过HEVC帧内编码进行进一步的数据量压缩,通过提出一个质量增强CNN(PPCNN)来改善解码后恢复到原始分辨率的降质视频序列。实验结果显示,本文压缩改进算法在低码率段与标准HEVC相比,能达到更好的质量重建,并且在接近一致的PSNR值时,能节省39.46%的时间和11.04%的比特率,本文算法的视频压缩性能优于HEVC标准算法和相关文献方法。  相似文献   

20.
提出了一种基于图神经网络的视频推荐模型,将用户的视频观看序列型行为建模为图结构,用结点代表用户与视频,用边代表行为,引入两种类型的向量传播方法分别对用户的长期兴趣与短时兴趣进行建模。其中,通过用户结点与视频结点的双向传播刻画长期兴趣,借助视频结点切换关系的单向传播刻画短时兴趣,并通过多层向量传播实现对图上高阶邻接信息的捕捉。在一个真实世界的视频网站观看数据集上的实验表明,提出的方法与现有最佳方法相比,其推荐精准度得到了有效提升。进一步的实验表明,该方法能够有效缓解数据稀疏性的问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号