共查询到20条相似文献,搜索用时 0 毫秒
1.
2.
近年来,深度学习技术不仅在人工智能领域取得了巨大成功,也为视频编码领域带来了新的发展机遇。文章从两个方面介绍了深度学习技术在视频编码领域的发展现状,即传统编码框架下深度学习视频编码工具和以深度学习模型为基础的视频编码新框架,并对相关代表性工作进行了详细介绍和性能分析。最后,对深度学习视频编码技术面临的挑战和未来发展方向做了分析和展望。 相似文献
3.
宗京秀 《信息技术与信息化》2022,(9):189-192
针对当前网络系统对3D视频系统的需求,提出了一种基于深度学习的3D视频编码系统。首先,针对当前网络系统终端多样化问题,深入研究基于深度学习的鲁棒性 3D 视频编码;其次,针对当前网络系统中的设备不能处理高复杂度的问题,进一步研究基于深度学习的低复杂度3D视频编码;然后,针对当前网络系统中视频信息庞大问题,深入研究基于深度学习的高效3D视频编码;最后,针对人类是视频信息的最终接收体,深入研究基于深度学习的满足人类视觉特性的3D视频编码。实验结果表明,所提方法实现了基于深度学习的鲁棒、低复杂度、高效、符合人类视觉特性的3D视频编码。 相似文献
4.
针对复杂场景下远程视频监控图像异常检测困难、传统算法功能单一(仅针对某种特定场景或某种异常图像进行检测)等问题,提出一种基于深度学习的全自动远程视频异常图像检测方法。首先采用Xavier方法对自行设计的卷积神经网络(Convolutional Neural Network,CNN)的参数进行初始化,然后将标准化后的视频差分图送入CNN的输入层,通过特征提取及下采样,最后在CNN的输出层获得远程视频异常图像检测结果。实验结果表明,该方法可以对远程视频监控中突然出现遮挡、模糊和场景切换等多种异常同时进行实时在线检测,准确率可达88.75%。 相似文献
5.
针对卷积稀疏编码算法中特征映射的准确性的问题,为了进一步提高图像超分辨率重建的的质量,文中提出一种基于卷积稀疏自编码的图像超分辨率重建算法。该算法首先在预训练阶段利用稀疏自编码器对输入高低分辨率图像分别进行训练,得到对应的图像稀疏特征表示;然后再由卷积神经网络根据得到的稀疏系数共同训练相应的滤波器及特征映射函数并更新到最优解;最后由高分辨率滤波器和对应的稀疏表示系数卷积求和,得到高分辨率重建图像估计。实验结果显示,改进算法的峰值信噪比(PSNR)结果较卷积稀疏编码算法提高了近0.1 dB,有效提高了重建图像的质量。 相似文献
6.
7.
《信息通信》2019,(12)
图像分类是通过图片所给的特征信息将不同的事物进行识别的一种图像处理技术。随着科学技术的快速发展以及人们对生活质量越来越高的需求,图像的自动分类技术已经运用到各个发展领域当中。当我们在图像上进行分类操作时,传统的图像分类方法由于不能准确掌握识别对象之间的内在联系,同时传统方法也因数据的特征性维度太高而导致识别对象的特征表达受到限制,所以取得的实验结果并不理想。针对以上内容文章提出了一种基于卷积神经网络的图像检测方法,该实验的算法主要借鉴了深度学习及卷积神经网络。与以往的传统图像分类方法不同,深度卷积神经网络模型可以同时进行特征学习和图像分类。通过对实验的各个部分结构进行改进和对卷积神经网络模型进行优化,从而防止过拟合现象,继而提高图像检测的准确度,在CIFAR-10数据库上进行的实验表明,该方法改进后的深度学习模型在图像检测方面取得了有效的结果。 相似文献
8.
在当今这个数据爆炸增长的时代,深度学习强大的非线性建模能力进一步提高了多视点视频编码的率失真性能.对此,介绍多视点视频的特点及应用,重点对深度学习背景下现有的多视点视频编码方法进行介绍和总结,并展望多视点视频编码未来的发展趋势,旨在进一步发挥深度学习的能力,为用户提供更佳的观看体验. 相似文献
9.
10.
11.
《电子技术与软件工程》2017,(24)
2013年贾扬清博士在Github上发布了一款深度学习框架Caffe,为众多研究人员和工程师们提供了一套简单易用且性能强大的深度学习开源框架。本文首先对Caffe框架简单介绍,其次阐述深度学习中应用的卷积神经网络原理,最后介绍如何利用Caffe框架进行图像分类。 相似文献
12.
3维卷积神经网络(3D CNN)是近几年来深度学习研究中的热点,在计算机视觉领域取得了诸多成就。虽然研究多年且成果丰富,但目前仍缺少关于此内容全面、细致的综述。基于此,该文从以下几个方面对其进行综述:首先阐述3维卷积神经网络的基本原理和模型结构,接着从网络结构、网络内部和优化方法总结3维卷积神经网络的相关改进工作,然后对3维卷积神经网络在视频理解领域中的应用进行总结,最后总结全文内容并对未来发展方向进行展望。该文针对3维卷积神经网络的最新研究进展以及在视频理解领域中的应用进行了系统的综述,对3维卷积神经网络的研究发展具有一定的积极意义。 相似文献
13.
14.
MPEG-4图像压缩编码方法是基于对象和内容的现代编码方法,顺应了现代图像压缩编码的潮流,广泛用在多媒体通信及第三代移动通信系统中。本主要介绍了MPEG-4视频对象的压缩编码方法及其差错控制方法。 相似文献
15.
16.
随着科技的发展人脸识别技术得到了巨大的应用,实现人脸识别的方法也越来越多,本文先简单对比了MLP、RNN、CNN这三个神经网络,然后再对CNN的基础结构进行了一个较为详细的介绍,主要通过对LeNet-5卷积神经网络模型结构的分析来了解卷积神经网络,然后设计了一款针对Olivetti Faces人脸数据库的卷积神经网络模型,通过更改卷积层中卷积核个数以及学习速率来进行一系列实验,最终确定在本次实验当中,当学习速率为0.05时,第一层卷积层卷积核数目为20,第二层卷积层数目为40的时候,能够得到一个针对Olivetti Faces人脸数据库有着较高识别率的一个新的卷积神经网络模型。 相似文献
17.
红外图像中的行人检测一直是计算机视觉领域的研究热点与难点。针对传统的红外行人检测方法需要人工设计目标表达特征的弊端,本文从深度学习的角度出发,提出一种可以自动构建目标表达特征的红外行人检测卷积神经网络。在对卷积神经网络的实现原理进行分析的基础上,设计了红外行人检测卷积神经网络的初始结构,然后通过实验对初始结构进行调整,得到最终的检测神经网络。对实拍红外人体数据库进行行人检测的实验结果表明,该方法在保持低虚警率的同时可以对红外图像中的行人进行稳健检测,优于传统方法。 相似文献
18.
19.
近年来,卷积网络深度学习已在图像处理、目标检测等领域取得巨大成功。受其启发,将卷积神经网络(CNN)应用于传统视频压缩标准已成为一个新的研究热点。本文提出一种集成卷积神经网络的高效视频编码(HEVC)压缩改进算法,将下采样过程、HEVC的编解码过程、上采样及质量增强过程集成为一体。为高效提取视频帧的结构特征,在所提压缩算法中集成了两个卷积神经网络。提出了一种下采CNN(DwSCNN)代替双三次下采,在有效降低分辨率的同时保留细节信息,得到更为紧凑的低分辨率视频序列,将此低分辨率视频序列通过HEVC帧内编码进行进一步的数据量压缩,通过提出一个质量增强CNN(PPCNN)来改善解码后恢复到原始分辨率的降质视频序列。实验结果显示,本文压缩改进算法在低码率段与标准HEVC相比,能达到更好的质量重建,并且在接近一致的PSNR值时,能节省39.46%的时间和11.04%的比特率,本文算法的视频压缩性能优于HEVC标准算法和相关文献方法。 相似文献
20.