首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
刘景赫  林宝军 《液晶与显示》2023,(12):1736-1744
传统的单目姿态估计算法采用卷积网络在图像中定位若干关键点,再基于2D-3D匹配技术估计目标的姿态,但卫星上的关键点分布较分散,卷积网络由于其受限的感受野导致关键点的定位精度低,影响后续姿态估计的精度。此外传统流程需要人工标注关键点位置和目标的掩膜,标注成本高。为了解决传统方法感受野受限问题,在卷积网络中引入自注意力机制,赋予其全局建模能力,提高了关键点的定位精度。为了改善传统方法需要大量人工标注的问题,通过空间雕刻,重构了目标的点云,再将点云重投影回像素平面,自动化获取所需标签,省略了人工标注过程,提高了算法实用性。实验结果表明:所提算法在SPEED数据集上进行验证,关键点定位精度为92%,姿态平移误差为0.236%,姿态旋转误差为9.86×10-3弧度,在简化算法复杂度的同时提升了精度。可以有效应用于航天器之间的相对姿态估计。  相似文献   

2.
近年来,随着深度学习技术的发展,基于深度学习的2D人体姿态估计展现出了极其优异的效果。文章主要对2014年以来基于深度学习的2D人体姿态估计相关内容进行了分析和评述,包括对主流方法的介绍和对数据集评价指标的总结对比,最后还讨论了2D人体姿态估计的未来研究方向。  相似文献   

3.
高分辨率网络(High-Resolution Network, HRNet)因并行连接高分辨率卷积且在并行卷积中重复进行多尺度融合来维持高分辨率表示,弥补了重复上采样和下采样过程造成的信息损耗等问题而受到广泛研究。但该网络只选取最高分辨率特征表示作为输出,忽略了其他分辨率分支的特征,且对遮挡等原因产生的困难点的检测精度较低。为了提升网络对关节点定位的精度,提出了一种改进HRNet的网络模型H-HRNet(High Precision-HRNet)。提出了一种结合注意力机制的特征融合方法,对各通道提取到的信息进行融合,提高了网络对关键点的提取精度;为了解决困难点检测精度不高等问题,在特征提取网络后添加调优模块并设计多级监督机制进行监督;为了减少坐标编解码过程中的误差损失,使用一种新的解码策略。实验结果表明,模型在COCO和MPII两个数据集上的精度分别达到了76.1%和90.6%,比基线网络HRNet分别提高了1.7%和0.4%,验证了H-HRNet模型的有效性。  相似文献   

4.
为提升人体姿态估计的准确率,提出了将SKNet(Selective Kernel Networks)视觉注意力机制与高分辨率网络HRNet(High-Resolution Network)相结合的方法。在高分辨率网络的第一阶段,使用SKNet中的选择性卷积核替代瓶颈残差模块中的3×3卷积核,使神经元根据输入信息的不同尺度自适应调整感受野的大小。在MPII数据集上的实验表明,相较于HRNet-W32和HRNet-W48,引入注意力机制的高分辨率人体姿态估计网络在不增加参数量和计算量的情况下,在通道数C=32和通道数C=48时的平均准确率分别提高了0.7%和0.5%,同时在人的手腕、髋部、膝盖和脚踝处的准确率有较大提升。  相似文献   

5.
针对单个RGB图像,人体姿态估计通过对人体关键点定位来估计人体的位置和关节点位置。球类比赛是一种快速的运动,用主观观察对运动员的技术合法性进行判决无法避免错误。因此,文中利用基于人体姿态估计的运动员姿态分析技术进行辅助训练和辅助判罚,有效避免了传统系统中由于人的主观判断对运动员姿态的错误定位。目前,针对人体姿态估计的研究被分为基于传统算法和基于深度学习算法两种主要方式。在基于深度学习算法的基础上又分为单人人体姿态检测和多人人体姿态检测。基于深度学习算法的人体姿态估计通过构建神经网络,运用机器学习的方法提取图片特征读取图片信息,并在用于人体姿态估计的主流数据集上进行性能对比和分析。将人体姿态估计应用到球类运动中,为运动员的日常训练提供了一定的科学参考,同时也最大程度上保证了运动员比赛中的公平与公正。  相似文献   

6.
7.
本文提出一种基于姿态估计模型与非局部注意力机制的遮挡行人重识别方法,利用姿态估计器获得图像中的非遮挡局部人体,并引入非局部注意力机制解决特征的长距离依赖问题,使得网络的关注度集中在非遮挡部分,实现遮挡场景下的精确行人重识别任务。通过实验验证了本文所提出方法在遮挡数据集上取得了先进的表现。  相似文献   

8.
地铁场景行人目标存在大小不一、不同程度遮挡以及环境过暗导致目标模糊等问题,很大程度影响了行人目标检测的准确性。针对上述问题,本研究提出了一种改进YOLOv5s目标检测算法以增强地铁场景行人目标检测的效果。构建地铁场景行人数据集,标注对应标签,进行数据预处理操作。本研究在特征提取模块中加入深度残差收缩网络,将残差网络、注意力机制和软阈值化函数相结合以增强有用特征信道,削弱冗余特征信道;利用改进空洞空间金字塔池化模块,在不丢失图像信息的前提下获得多尺度、多感受野的融合特征,有效捕获图像全局上下文信息;设计了一种改进非极大值抑制算法,对目标预测框进行后处理,保留检测目标最优预测框。实验结果表明:提出的改进YOLOv5s算法能有效提高地铁场景行人目标检测的精度,尤其对小行人目标和密集行人目标的检测,效果提升更为显著。  相似文献   

9.
本文针对基于深度学习的二维人体姿态估计方法进行了全面综述.首先对这些深度学习技术进行了分类、分析和比较,并介绍了二维人体姿态估计中常用的数据集和指标,最后还讨论了有待解决的问题和未来研究的挑战.  相似文献   

10.
李杰  亓波  张建林 《半导体光电》2022,43(5):968-973
针对现有单人姿态估计网络结果缺乏可靠性评估和鲁棒性保障等问题,提出了一种基于偶然不确定性的测试时增强方法。该方法首先利用随机并行的数据增强和模型推理得到多样化输出,随后通过计算该输出的偶然不确定性得到其可靠性评估,最后根据可靠性将该输出及其不确定性进行加权融合以得到更准确鲁棒的结果及其评估。在MPII数据集上的实验表明,该算法可即插即用地应用于任意现有单人姿态估计网络,从而得到更精确鲁棒的结果及其不确定性评估。  相似文献   

11.
堆栈沙漏网络(SHN)是人体姿态估计中的代表性研究成果,但该网络忽略了关节局部信息.因此,提出了一种基于改进沙漏网络的人体姿态估计模型.首先,利用多个残差模块及步长为2的卷积层获取低层次到高层次的特征,同时随着网络层数的加深,相应调整残差模块的数目和通道数,以突出局部细节特征信息.然后,为了提取遮挡部位的纹理和形状等局部特征,融合了在线困难关键点挖掘模块.最后,采用反卷积最大化恢复原始的局部特征.实验结果表明,本模型在COCO数据集上的平均精度达到了74.6%,总参数量为1.5×107,比叠加8个SHN(8-SNH)的平均精度高5.1个百分点,且其总参数量仅为8-SNH的1/3.  相似文献   

12.
图像和视频中基于部件检测器的人体姿态估计   总被引:2,自引:0,他引:2  
人体姿态估计是计算机视觉领域中的一个关键问题,可以应用于人体活动分析,人机交互以及视频监视等方面。该文针对单目图像和视频中的人体姿态估计问题,基于部件及图推理的方法,对观测模型和推理方法提出改进。该文设计实现了一种旋转不变的边缘力场特征,采用基于边缘力场特征的Boosting分类器作为观测模型,并利用一种基于粒子采样和置信度传播的优化算法进行姿态估计。算法的性能和速度在几个数据集上得到了验证。  相似文献   

13.
针对输电线路绝缘子缺陷检测准确率低和检测速度慢的问题,提出了一种基于多尺度特征编码和双重注意力融合的输电线路绝缘子缺陷检测方法。首先,为了使检测模型适应缺陷绝缘子特征尺度的多样性,编码网络采用Res2Net50提取更细粒度的特征,并在之后嵌入空洞空间金字塔池化模块实现多个尺度捕捉绝缘子及其缺陷的特征;其次,为了减少解码网络中特征信息的缺失,将主干网络的不同层特征与efficient channel attention注意力模块串联,并分别与经过squeeze and excitation注意力模块的各反卷积特征相加形成双重注意力融合。实验结果表明,所提方法的均值平均精度值约为95.35%,每秒传输帧数约为65.95,与其他方法相比,该方法对无人机绝缘子缺陷的准确检测具有一定的参考价值。  相似文献   

14.
15.
提高电气设备紫外图像分割精确度对设备放电程度的准确评估具有重要意义。由于存在噪声干扰与紫外光斑形状、大小不规则等问题,目标分割区域存在过分割和欠分割现象,因此提出一种基于多模块的VSA-UNet(VGG16Net, Improved SENet, and ASPP based U-Net)分割网络。为强化网络特征提取能力,减少过分割现象,使用VGG16Net的卷积层代替U-Net网络的编码部分;将编码部分末端卷积层替换成空洞空间金字塔池化(Atrous Spatial Pyramid Pooling, ASPP)模块,获取紫外图像的多尺度信息,解决大区域的欠分割问题;在跳跃连接部分加入改进SENet模块,加强有用信息的提取,补充细节损失,提升整体网络性能。基于自建紫外图像数据集的实验表明,改进网络在分割紫外图像时平均交并比(Mean Intersection over Union, MIoU)达到81.78%,平均精确率为95.97%。与U-Net网络相比,提出的VSA-UNet模型明显提升了紫外图像分割的准确性。  相似文献   

16.
在图像的语义分割任务中,不同对象之间像素值存在差异,导致现有的网络模型在图像语义分割过程中丢失图像局部细节信息。针对上述问题,提出一种图像语义分割方法(DECANet)。首先,引入通道注意力网络模块,通过对所有通道的依赖关系进行建模提高网络的表达能力,选择性地学习并强化通道特征,提取有用信息,抑制无用信息。其次,利用改进的空洞空间金字塔池化(ASPP)结构,对提取到的图像卷积特征进行多尺度融合,减少图像细节信息丢失,且在权重参数不改变的情况下提取语义像素位置信息,加快模型的收敛速度。最后,DECANet在PASCAL VOC2012和Cityscapes数据集上的平均交并比分别达81.08%和76%,与现有的先进网络模型相比,检测性能更优,可以有效地捕获局部细节信息,减少图像语义像素分类错误。  相似文献   

17.
空间目标姿态估计是有效实现各类航天任务的重要前提,基于空间光学观测图像的目标姿态估计关键一环在于快速准确地建立起观测图像与空间目标之间的“二维特征点-三维实体结构”映射关系。传统的方法往往将这一任务分解为特征提取和特征关联两个步骤序贯进行,然而在空间目标光学观测场景中,高动态的光照变化和目标的相对高速运动特点会显著降低图像特征提取的可靠性,影响后续特征关联匹配的正确率并最终降低对空间目标的姿态估计精度。针对这一问题,本文提出了一种基于语义关键点提取的光学图像空间目标姿态估计方法,利用Hourglass网络端到端地提取包含语义信息的关键点,直接实现了光学图像中二维特征点与目标三维实体结构的关联映射,并在此基础上利用EPnP算法求解待估计的目标姿态值。实验结果表明,本文所提的方法能较好地兼顾算法精度与效率,其在仿真数据集上的姿态估计最小误差为0.83°,且在数据降质的情况下平均误差依然优于传统方法。   相似文献   

18.
刘唐波  杨锐  王文伟  何楚 《信号处理》2019,35(12):2062-2069
为有效检查驾驶员在行驶过程中的不当行为,本文研究结合人体姿态估计信息的检测算法,通过对检测目标的约束,建立起一套具有多阶段的手部动作检测方法。该方法包含三个模块。第一,人体姿态估计模块,选取人体姿态估计网络关节的高斯热图层,通过输出的人体姿态高斯热图信息,达到对检测目标的空间信息的获取;第二,手部检测模块,基于CNN的检测网络,在网络输入层融合人体姿态高斯热图后,达到对手部的检测率提高的效果;第三,手部动作分类模块,通过接受手部检测模块的输出,消除对检测结果产生干扰的背景,将分类网络的特征提取约束在手部局部位置,提高手部动作分类的准确率,将手部区域输入至分类网络得到驾驶员手部动作,从而判断驾驶员是否存在抽烟、接听电话等不当行为,实现驾驶员的行为检测。为了验证本文提出的多阶段的手部动作检测方法,已在自制数据集上进行了相应实验。   相似文献   

19.
20.
张越  王逊 《无线电工程》2024,(5):1217-1225
针对遥感图像数据本身存在分辨率高、背景复杂和光照不均等特性导致边界分割不连续、目标错分漏分以及存在孔洞等问题,提出了一种基于改进Swin-Unet的遥感图像分割方法。在编码器末端引入空洞空间金字塔池化(Atrous Spatial Pyramid Pooling, ASPP)模块,用于捕获多尺度特征,增强网络获取不同尺度的能力,充分提取上下文信息;将解码器端的Swin Transformer Block替换为残差Swin Transformer Block,不仅保留了原始信息,又能够缓解模型出现梯度弥散现象;在跳跃连接中引入残差注意力机制,可以让模型更加关注特征图中的重要特征信息,抑制无效信息,从而提高模型分割的准确率。在自建数据集上进行实验,结果表明,改进后的网络平均交并比(mean Intersection over Union, mIoU)达到了80.55%,提高了4.13个百分点,证明改进后的网络可以有效提高遥感图像分割的精度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号