共查询到20条相似文献,搜索用时 15 毫秒
1.
2.
3.
4.
5.
近年来人体姿态估计已成为计算机视觉领域的热门研究方向,堆叠沙漏网络是人体姿态估计领域中最具代表性的研究成果之一,但该网络对于图像细节特征的提取能力较差。为增强网络对细节特征的处理能力,本文提出了基于改进沙漏网络的人体姿态估计模型。该模型使用ResNet50提取高质量的图像底层特征,用步长为2的3×3卷积核代替maxpooling进行下采样,最大程度保留原有图像信息;考虑到不同分辨率下的特征丰富度具有一定差异性,使用不同的残差模块对不同分辨率的feature map进行处理,增强网络对特征的学习能力;最后使用反卷积最大化还原原始图像的局部特征。实验结果显示,本文模型在COCO测试集上的平均精度达到74.1%,比堆叠沙漏网络高出4.7%,检测精度有较大提升。 相似文献
6.
传统雷达目标检测方法一般将单个距离单元的目标当成单目标进行检测,而不会估计距离单元内目标的数量。针对该研究空缺,提出一种基于深度残差网络的雷达目标数量估计方法。该方法将雷达信号转换成时频图并输入至训练好的深度残差网络。残差网络根据单个目标与多个目标对应时频图的差异即可准确得到雷达目标数量的估计值。仿真表明该方法能有效地估计出雷达目标数量。 相似文献
7.
8.
9.
针对基于卷积神经网络提取的图像特征不仅包含目标信息,还包括杂乱的背景信息这一问题,提出了一种基于残差注意力网络与深度哈希的算法,该算法通过残差注意力网络提取图像特征,输入到哈希层得到图像的二进制编码,通过对比待查询图像的哈希码与训练集中每一张图像的哈希码之间的汉明距离来检索图像,可实现端到端的训练和检索.在Flickr... 相似文献
10.
为了提高模型在道口环境下的车辆图像的特征提取和识别能力,提出了一种基于改进残差网络的车辆分类方法。首先以残差网络为基础模型,改进了残差块中激活函数的位置,并将残差块中的一般卷积用分组卷积代替,引入注意力机制,用焦点损失函数替换交叉熵损失函数。实验部分先用公开数据集StanfordCars进行预训练,再用自建的道口车辆数据集进行迁移学习。结果表明,改进模型在两个数据集中的准确率均优于几种经典的深度学习模型。 相似文献
11.
本文针对单目深度估计模型深度序数回归算法中全图像编码器易丢失较大像素值像素特征信息和位置信息的缺点,提出一种基于CBAM的深度序数回归方法.首先,将CBAM嵌入到深度序数回归算法中作为全图像编码器,依次采用通道注意力机制和空间注意力机制来捕获图像完整的特征信息和位置信息,通过获得的注意力图重新调整原始特征;其次,对像素... 相似文献
12.
结合态势估计的特点,介绍了黑板结构和贝叶斯网络2种用于态势估计的方法,分析了各自的优缺点,并选取贝叶斯网络来进行态势估计。详细讨论了战场态势在贝叶斯网络中的知识表示和信息传播。针对静态贝叶斯网络难以捕捉动态战场信息的缺点,采用了动态搜索最佳网络的方法进行推理,为战场态势估计提供了新的思路。 相似文献
13.
针对非受限条件下人脸遮挡、光照不均、表情复杂、姿态各异等影响年龄估计精确率低的问题,提出一种非受限条件下双流增强浅层网络的人脸年龄估计(E2-doubleNet)算法.首先,在E2-doubleNet设计中采用了两个异构的单流浅层卷积神经网络模型以提高网络的学习能力;然后,在两个模型中采用不同的激活函数和池化层,增强网... 相似文献
14.
在图像采集过程中,由于拍摄对象运动或相机自身运动造成的图像模糊对于后续的高级视觉任务会产生很不利的影响。针对当前深度学习图像去模糊方法不能兼顾去模糊效果和效率的问题,提出了一种多尺度循环注意力网络,使用深度可分离卷积降低参数量,改进注意力模块合理分配计算资源,对卷积层进行密集型连接提高参数利用效率,引入边缘损失提升生成图像边缘细节信息。经过实验验证,所提方法具有良好的泛化性能和鲁棒性,在Lai数据集和K?hler数据集上的SSIM和PSNR较近年典型方法的最佳效果分别提升了约1.15%、0.86%和0.91%、1.04%,在GoPro数据集上的平均单帧运行速度较同类方法提升约2.5倍。 相似文献
15.
视频修复旨在填补视频中的缺失区域,由于很难精确保持修复内容的时空一致性,故视频修复仍具有挑战性。针对现有视频修复中存在的修复结果语义信息不连续,出现视频模糊和时间伪影,以及网络设计越来越复杂,网络整体速度变慢的问题,本文提出了一种基于残差网络的卷积注意力网络(RCAN)用以视频修复。通过将自注意力机制和全局注意力机制引入进残差网络,增强网络对所有输入帧的时空特征的学习能力,并采用时空对抗损失函数进行优化,提高视频修复的质量。同时网络还能够高度自由地定义层数和参数量,提高网络的实际应用能力。实验结果表明,该网络在DAVIS和YouTube-VOS数据集上取得了PSNR为30.68 dB,SSIM为0.961,FID为0.113的平均修复结果,基本符合实际场景对模型的修复质量要求,为视频修复提供了一种新思路。 相似文献
16.
针对弹载武器可见光图像与红外融合高层特征融合不足,目标细节表现不突出导致打击目标检测失败的问题,提出了一种基于注意力机制的残差密集网络的红外与可见光图像融合模型。受残差网络和密集网络的启发,设计了一种基于残差密集网络的图像融合算法解决融合图像细节纹理信息不足的问题。采用注意力机制有效提取目标特征区域的关键信息,通过局部残差融合和全局残差融合算法保留目标的纹理细节。此外,为了更好地保留可见光图像中的细节纹理,对目标细节特征发现时增强特征抑制。实验证明,该算法能够增强目标细节特征,同时有效保存了其轮廓信息,与不采用注意机制提高相比,融合精度提高了5%,运算量下降2%左右。 相似文献
17.
高精度眼动记录技术现已非常成熟,但昂贵的价 格限制了当前商用眼动仪的应用 范围,发展灵 活、低成本的眼动记录系统将是眼动跟踪技术的重要研究方向。本文设计了一种 低成本、低侵 入性的耳麦式眼动记录系统。系统由两个普通CMOS摄像机及耳麦式支架构成,两个摄像机 分别记录注 视场景图像及人眼图像,成本仅为当前商用眼动仪的几百分之一。针对系统 采集的数据,提出一种分段 加权环形Hough变换算法提取虹膜轮廓及中心作为特征,采用支持向量回归(SVR)算法 估计注视点与特征点位置 的映射关系。设计了一种简便的标记注视点坐标的方法,实现注视估计。实验结果表明, 对场景图像中随机位置的注视方向估计平均误差为1.57°,表明低成本眼动仪可以满足日常 交互需求。 相似文献
18.
为实现肺癌病理图像的准确分类,提出一种基于双重注意力和动态ReLU的残差网络DrANeT,在网络模型中嵌入CBAM双重注意力机制,提高网络提取有用特种图的能力;使用动态ReLU替换网络中所使用的普通ReLU,可以根据不同特征图自动调整参数,提高模型性能。实验结果表明,该网络模型在肺良性图像、肺腺癌图像和肺鳞状细胞癌图像准确率分别达到100.00%、99.96%、99.96%,整个数据集准确率达到99.96%。因此,表明本实验所改进的网络模型可以有效地提高肺癌病理图像分类的准确率。 相似文献
19.
堆栈沙漏网络(SHN)是人体姿态估计中的代表性研究成果,但该网络忽略了关节局部信息.因此,提出了一种基于改进沙漏网络的人体姿态估计模型.首先,利用多个残差模块及步长为2的卷积层获取低层次到高层次的特征,同时随着网络层数的加深,相应调整残差模块的数目和通道数,以突出局部细节特征信息.然后,为了提取遮挡部位的纹理和形状等局... 相似文献
20.
针对惯性测量元件不能满足低成本制导弹药作战需求问题,提出一种基于理想弹道的全捷联激光半主动末制导弹药视线角估计方法。该方法根据弹目相对运动模型及导引头量测模型建立非线性滤波系统;针对弹体运动参数在末制导段变化范围较小的特点,通过分析弹体运动参数对系统不确定性的影响,将理想弹道弹体运动参数标准值作为滤波系统参数;利用激光半主动导引头量测信息,结合容积卡尔曼滤波对弹目视线角进行估计。数字仿真实验结果表明:在小扰动条件下,弹目视线倾角与偏角末制导段的均方根误差分别为0.182与1.668,其最大估计误差分别为0.259与2.913,具有较好的估计精度与鲁棒性能。 相似文献