共查询到20条相似文献,搜索用时 15 毫秒
1.
对场景中的物体进行深度估计是无人驾驶领域中的关键问题,红外图像有利于在光线不佳的情况下解决深度估计问题.针对红外图像纹理不清晰与边缘信息不丰富的特点,提出了将注意力机制与图卷积神经网络相结合来解决单目红外图像深度估计问题.首先,在深度估计问题中,图像中每个像素点的深度信息不仅与其周围像素点的深度信息相关,还需考虑更大范... 相似文献
2.
深度估计是传统的计算机视觉任务,在理解三维场景中起着至关重要的作用。基于单目图像的深度估计任务的困难在于如何提取图像特征中大范围依赖的上下文信息,提出了自适应的上下文聚合网络(adaptive context aggregation network,ACANet)用于解决该问题。该方法基于有监督的自注意力模型(supervised self-attention,SSA),能够自适应地学习任意像素之间的具有任务特性的相似性以模拟连续的上下文信息,并通过模型学习的注意力权重分布用来聚合提取的图像特征。将单目深度估计任务设计为像素级的多分类问题,经过设计的注意力损失函数减少RGB图像和深度图的语义不一致性,通过生成的像素级注意力权重对由位置索引的特征进行全局池化。最后提出一种软性有序推理算法(soft ordinal inference,SOI),充分利用网络的预测置信度,将离散的深度标签转化为平滑连续的深度图,并且提高了准确率(rmse下降了3%)。在公开的单目深度估计基准数据集NYU Depth V2上的实验结果表明:rmse指标为0.490,阈值指标为82.8%,取得了较好的结果,证明了本文提出的算法的优越性。 相似文献
3.
针对光场深度估计过程中数据量大、边缘处深度估计结果不准确问题,利用压缩感知原理重建光场,提出一种新的多信息融合的光场图像深度估计算法。利用压缩感知重建算法重建5×5视角光场数据,获取光场数据后首先移动子孔径实现重聚焦,然后利用角度像素块散焦线索和匹配线索计算出场景初始深度和置信度。计算图像边缘信息,通过融合初始深度、置信度、边缘信息获取最终深度。实现压缩光场仿真重建,并对仿真光场数据和公开光场数据进行深度估计,实验结果表明:可以仿真重建出5×5视角光场数据,且仿真重建的光场可用于深度估计。该深度估计算法在场景边缘处的深度估计结果边界清晰,层次分明,验证了重建光场深度估计的可行性与准确性。 相似文献
4.
目前大部分基于物理模型的图像去雾算法存在复原图像色彩失真和天空边界区域出现光晕效应的问题.为了解决这些问题,本文提出了一种将光场深度计算与大气散射模型相结合的图像去雾方法.该方法通过光场极平面图像计算得到场景深度,将场景深度信息计算所得的透射率与暗通道透射率融合得到最终透射率.同时利用场景深度对天空边界进行判定,单独对天空区域进行处理.在合成雾天图像和真实雾天图像上的实验结果表明,与现有的单幅图像去雾算法相比,本文提出的方法在峰值信噪比以及结构相似性上均有提升.同时对去雾之后的图像的色彩保真度以及光晕效应的抑制方面都取得了较好的结果 . 相似文献
5.
提出了一种针对室内场景的轻量化端到端单目深度估计神经网络。首先设计了新型自适应深度分布估计模块,可针对不同输入图像估计差异化的深度范围,使得网络更好地预测室内物体的相对位置关系,恢复出的深度图像能获得更接近真实值的像素分布。其次,在深度估计的过程中,通过基于平面系数的深度间接表示形式加入平面隐式约束,可以在场景的平面区域得到更平滑的深度估计结果。在NYU Depth-v2数据集上的多项实验结果表明,提出方法能满足较高分辨率下的实时性要求,同时能以更少的参数恢复出质量更高、更完整的室内深度图像,有助于实现更加准确的三维重建效果。 相似文献
6.
针对Kinect传感器在获取深度图像时存在深度值随机跳变的不准确性问题,基于最优估计的思想,提出卡尔曼滤波与多帧平均法相结合的图像修复方法。首先利用卡尔曼滤波对多幅深度图像进行修复处理,实现Kinect传感器在采集信息过程中随着时间递推,深度值的跳变逐渐趋于平稳的效果;然后基于多幅图像平均法确定最终的深度图像,解决了Kinect获取深度值存在误差导致的不精确问题。实验结果表明,该算法的均方根误差为38.102 5,平均梯度为0.471 3,信息熵为6.191 8,与单幅图像修复效果相比,得到的深度图像边缘更加清晰。 相似文献
7.
针对多曝光图像任务缺乏真值图像,以及现有多曝光图像融合算法存在的边缘特征丢失、细节模糊等问题,本文提出了一种基于注意力机制的多曝光图像融合算法.该算法建立权重独立的双通道Unet网络,对目标场景不同曝光图像分别进行特征提取,生成不同曝光图像的高维多尺度特征图;通过视觉注意力机制凸显目标场景在不同曝光下对融合有利的特征,... 相似文献
8.
9.
基于轮廓特征理解的城市道路图像深度估计 总被引:1,自引:0,他引:1
准确估计道路场景图像中的深度信息,是智能交通和机器人导航中对障碍物估计和定位的关键。基于区域特征理解的单幅静态城市道路图像深度估计算法,可以通过边缘生长图像分割算法得到一系列封闭的图像区域;然后统计每个分割区域自身的多元特征,包括区域的颜色、面积、位置,所包含的直线、垂线和平行线;基于这些特征,进一步估计道路消失点,并实现天空、垂直面和道路区域的分割和三维空间推理,最后根据典型道路的深度变化规律实现对道路图像的深度估计。实验结果表明,该算法能够有效地估计道路消失点以及道路区域内部的渐变深度信息。 相似文献
10.
提出一种基于遗传算法优化注意力机制的深度长短期记忆网络(DLSTM)方法,用于电力系统的混沌预测。通过传递共享参数,将遗传算法优化的注意力机制加入DLSTM模型中,可以挖掘时间序列中潜在特征,同时避免陷入局部优化。该方法是一种受进化计算方法启发的寻优方法,可以很好地学习注意力层中的参数。电力系统混沌预测实验表明所提模型比其他参考模型具有更高的预测精度和长期预测能力。 相似文献
11.
针对先进驾驶辅助系统对车辆前视景深信息的需求,在无监督学习框架下提出了一种基于单目视觉的场景深度估计方法。为了降低不同尺寸的前视目标对景深估计结果的影响,采用金字塔结构对输入图像进行预处理;在训练过程中,将深度估计问题转化为图像重建问题,利用双目图像设计了新的损失函数代替真实深度标签,解决了真实场景景深数据难以获取的问题;将中间多尺度的视差图与原输入图像的尺寸统一,改善了深度图中的空洞现象,提升了景深估计精度。在KITTI和Make3D数据集上的定量与定性对比结果表明,本方法可以获得准确度较高的绝对景深数据,且具有良好的泛化能力。在真实道路场景下的实验结果表明,本方法可以利用单张车载前视图像得到对应的像素级景深信息。 相似文献
12.
针对常规波束形成主瓣宽且目标分辨能力低的问题,提出一种基于深度卷积神经网络的波达方向估计方法。算法使用常规波束形成计算二维空间功率谱,将预处理后的空间功率谱图输入深度卷积神经网络。该文利用神经网络学习解卷积映射关系,输出主瓣宽度更窄的空间功率谱图,从而实现高分辨率二维波达方向估计。该算法对阵列结构没有限制,适用于立体阵。仿真结果表明该文方法在不同目标个数、快拍数及信噪比参数下均能准确估计目标方向。该文方法目标分辨能力优于常规波束形成方法。在低快拍情况下,目标方向估计误差低于自适应波束形成方法。 相似文献
13.
14.
15.
夜间有雾图像通常具有对比度低、光照不均匀、颜色偏移以及噪声较多等现象,这些退化现象使得夜间图像去雾具有极大的挑战性。针对夜间图像存在的退化问题,本文提出了一种能够在夜间图像中有效去雾并提高图像质量的方法。首先,将图像分解成光晕层和有雾层,并对有雾层进行颜色校正。其次,通过一种新提出的带有伽马变换的图像光源分割方法来分割光源,并设置分割阈值作为像素点属于光源区域的概率值。然后,将得到的概率值与最大反射先验相结合来估计光源和非光源区域的大气光值。最后,根据图像深度与亮度、饱和度以及梯度之间的关系建立线性模型,进一步估计透射率的值。实验得到的分割阈值为0.07,线性深度估计参数分别为1.026 7、-0.596 6、0.673 5、0.004 135。实验结果表明本文方法在夜间图像去雾、消除光晕、减少噪声,以及提高可视度方面取得良好的效果。 相似文献
16.
为提高混沌时间序列的预测精度,提出一种基于混合神经网络和注意力机制的预测模型(Att-CNNLSTM),首先对混沌时间序列进行相空间重构和数据归一化,然后利用卷积神经网络(CNN)对时间序列的重构相空间进行空间特征提取,再将CNN提取的特征和原时间序列组合,用长短期记忆网络(LSTM)根据空间特征提取时间特征,最后通过注意力机制捕获时间序列的关键时空特征,给出最终预测结果.将该模型对Logistic,Lorenz和太阳黑子混沌时间序列进行预测实验,并与未引入注意力机制的CNN-LSTM模型、单一的CNN和LSTM网络模型、以及传统的机器学习算法最小二乘支持向量机(LSSVM)的预测性能进行比较.实验结果显示本文提出的预测模型预测误差低于其他模型,预测精度更高. 相似文献
17.
针对当前水下单像素成像方法侧重于从整体角度重构目标图像,难以理想地恢复目标细节的问题,提出了一种基于目标搜寻和细节增强的水下单像素成像方法。目标搜寻旨在从图像中判断出目标部分和背景部分,从而增强目标信号,降低背景噪声;细节增强旨在学习采集信息的细粒度特征、增强重构图像的细节。首先用传统单像素成像方法快速重构目标图像;其次通过判断各行、各列最大像素点的差值来区别目标和背景环境;最后用基于分块模型的神经网络学习目标的细粒度特征,提高目标图像的细节部分。为了验证提出方法的可靠性,重构了空间环境和水下环境中的目标图像,实验结果表明,在两种实验环境下,该方法都可以较好地保存目标的细节信息,获得高质量的目标图像。 相似文献
18.
19.
提出一种结合卷积神经网络的编解码器模型和混响时间注意力机制的混响抑制算法,该算法通过编解码器模型实现混响抑制,并利用混响时间注意力机制克服混响环境变化对混响抑制效果的影响。该算法在编码器中使用具有不同大小的卷积核来处理混响语音幅度谱,从而获得包含多尺度上下文信息的编码特征;通过引入注意力模块,实现在不同的混响时间环境中选择性地使用不同权重的编码特征生成加权特征;最后,在解码器中使用加权特征来重建混响抑制后的语音信号幅度谱。在模拟和真实的混响环境下,该算法相对于基线系统在语音混响调制能量比上分别取得了0.36 dB和0.66 dB的提升。实验结果表明,该算法可以适应不同混响环境的变化,相对基线系统在真实混响环境下具有更高的鲁棒性。 相似文献
20.
针对当前遥感目标检测方法只能识别出遥感目标的类别及位置,无法生成与遥感图像内容相关文本描述的问题,提出了一种基于注意力和强化学习的遥感图像描述方法.首先,采用卷积神经网络构建编码器,提取遥感图像的特征.其次,利用长短期记忆网络搭建解码器,学习图像特征与文本语义特征间的映射关系.然后,引入注意力机制,增强模型对显著性特征... 相似文献