共查询到19条相似文献,搜索用时 78 毫秒
1.
现有的视觉替代方法均是在特定环境中,通过目标识别获得映射特征,缺少普遍的适用性.针对这一问题,提出了一种基于注意模型的视觉替代方法.利用人眼的视觉特性,提取图像的感兴趣区域,并根据听觉显示的基本原理,提出了将感兴趣区域的位置、尺寸和颜色映射为音符响度、音长和音调的PSC映射方法.实验结果表明:将图像中引起视觉注意的区域映射为电子音符,符合人类视觉认知过程,有利于盲人获得外部环境的重要信息,降低了盲人训练和学习的难度,并且听感良好,不会造成听觉疲劳. 相似文献
2.
3.
感兴趣区域(Region of interests,ROI)是图像中可能引起人眼视觉关注的区域。根据视觉注意机制的经典模型Itti模型来提取图像的低层特征,利用局部迭代的特征合并策略并在此基础上综合自动阈值分割和种子点的区域生长方法得到感兴趣区域的提取方法。实验结果表明该方法符合生物的视觉注意机制,具有良好的鲁棒性。 相似文献
4.
一种基于视觉显著图的舰船红外图像目标检测方法 总被引:1,自引:0,他引:1
提出了一种基于视觉显著图的红外舰船目标定位方法,即通过改进的Itti模型生成视觉显著图,并基于视觉显著图分割出目标区域,从而实现目标检测。先用小波变换替代Itti模型中的高斯滤波来生成图像多尺度金字塔,然后用center—surround算子提取出多尺度的视觉差异特征,并对生成的视觉特征图进行合成,生成显著图。最后,利用阈值分割方法分割出目标区域,并对原始图像进行标记,从而实现目标检测。实验结果表明,与传统的Otsu阈值分割方法相比,该方法能够准确检测出目标区域。 相似文献
5.
为了快速搜索图像中的人脸区域,依据人类视觉系统的特点,引入Itti模型,提出了一种基于肤色特征和方向特征的人脸区域预检测注意力模型,并应用于复杂背景下彩色图像的人脸区域预检测.首先把图像从RGB空间转换到HSI空间,利用肤色在色度空间的聚散性,采用Gaussian金字塔和center-surround算子获取肤色和方向特征的多尺度视觉差异,通过这2个不同特征图的规格化和线性融合获得综合的显著图,由显著图地址转换成图像坐标找出原图中的人脸区域.实验结果表明,该方法能有效检测出人脸区域,且检测速度快,为后续的处理和分析提供了良好的基础. 相似文献
6.
分析了基于自底向上的视觉注意计算模型的感兴趣区域检测方法;它分别提取颜色、灰度、纹理三个特征图像,然后进行线性融合得到综合显著图。而显著目标通常自身灰度相近,但与背景灰度不同,根据这个特性结合灰度概率统计方法对视觉注意计算模型进行改进。实验结果验证了,该模型能够更好的模拟视觉注意的过程,而且计算复杂度较低。 相似文献
7.
该文根据人类视觉系统的生理结构与认知特点,提出了一个基于自底向上视觉注意的遥感图像分析模型,并在此基础上开发出了一种新的遥感图像分析方法。该方法在一定程度上具备了类似于人类视觉系统的选择性加工能力。将其应用于多种类型的真实遥感图像,获得了较为满意的实验结果。 相似文献
8.
9.
10.
11.
该文将脑功能网络引入到脑电特征提取的研究中,提出一种基于感兴趣脑区LASSO-Granger因果关系的新方法,克服了当前基于孤立脑区的研究方法的不足。先利用主成分分析提取各感兴趣区的最大主成分,然后计算它们之间的LASSO-Granger因果度量,并将其作为特征向量,最后输入支持向量机分类器,对BCI Competition IV dataset 1中的4组数据进行分类识别。结果表明,基于感兴趣脑区间LASSO-Granger因果关系分析和支持向量机分类器的方法对不同的运动想象任务识别率较高,提供了新的研究思路。 相似文献
12.
13.
针对高性能视频编码(HEVC)帧内预测编码算法复杂度较高的问题,该文提出一种基于感兴趣区域的高性能视频编码帧内预测优化算法。首先,根据图像显著性划分当前帧的感兴趣区域(ROI)和非感兴趣区域(NROI);然后,对ROI基于空域相关性采用提出的快速编码单元(CU)划分算法决定当前编码单元的最终划分深度,跳过不必要的CU划分过程;最后,基于ROI采用提出的预测单元(PU)模式快速选择算法计算当前PU的能量和方向,根据能量和方向确定当前PU的预测模式,减少率失真代价的相关计算,达到降低编码复杂度和节省编码时间的目的。实验结果表明,在峰值信噪比(PSNR)损失仅为0.0390 dB的情况下,所提算法可以平均降低47.37%的编码时间。 相似文献
14.
3维波数域成像处理方法对回波信号距离历程不做近似,成像重建精度高。机载下视阵列3D SAR跨航向阵列长度相比跨航向幅宽小很多,需将回波信号尺寸补零到成像场景尺寸以防止FFT时出现卷绕,过高的补零倍数给波数域成像处理带来内存需求和运算量的激增。如果能够仅对ROI (Region Of Interest) 而非整个观测场景进行成像处理就能够极大程度降低补零倍数,提高该算法的时效性。该文提出的波数域快速成像方法首先在波传播-航迹向和波传播-跨航向完成两次2维成像处理,结合两次2维成像处理结果确定ROI,最后使用3维波数域算法对ROI进行3维精确重建。实验数据验证了该文算法的有效性。 相似文献
15.
16.
为解决空间遥感图像数据量及信道带宽之间的矛盾,该文提出一种基于JPEG2000的感兴趣区域(Region Of Interest, ROI)编码算法。主流的JPEG2000 ROI编码算法难以兼顾ROI质量和系统计算量,且在低码率编码时有完全丢失背景的隐患。该算法通过精确控制各子带中背景系数的精度,使ROI分配到更多码流。并引入了人眼视觉特性,使较少的背景码流产生尽量好的视觉效果。另外,根据该算法提出了针对矩形ROI的超大规模集成电路(VLSI)设计,此设计经过简单调整,亦可适用于主流的ROI编码算法。测试结果表明,该算法在ROI质量和重建图像视觉效果上均表现优异,且支持任意形状ROI编码,兼容JPEG2000协议。该VLSI设计仅使JPEG2000系统运行时间增加一个周期,具有极高的吞吐率,可满足实时处理要求。 相似文献
17.
一种基于词袋模型的图像优化分类方法 总被引:1,自引:0,他引:1
该文应用词袋模型对图像进行分类,并针对传统词袋模型存在的不足进行改进,提出了一种基于兴趣区域(Region Of Interest, ROI)提取以及金字塔匹配原理的优化方法。首先对训练图像进行ROI提取,对得到的ROI区域进行密集尺度不变特征变换(Scale-Invariant Feature Transform, SIFT)特征的抽取和描述并生成视觉词典,由此产生的视觉词典更能精确的描述图像的特征,且能够抵抗多变的位置信息及背景信息的影响。其次应用金字塔匹配原理对图像进行基于视觉词典的直方图表示,代入支持向量机(Support Vector Machine, SVM)分类器进行分类。通过对Caltech 101和Caltech 256两个数据库进行实验,结果表明该方法较传统方法提高了分类的正确率,且能够在训练图像较少的情况下达到良好的分类效果。最后通过与现有同类方法的比较验证了该方法的优越性。 相似文献
18.
针对当前全景图像显著性检测方法存在检测精度偏低、模型收敛速度慢和计算量大等问题,该文提出一种基于鲁棒视觉变换和多注意力的U型网络(URMNet)模型。该模型使用球形卷积提取全景图像的多尺度特征,减轻了全景图像经等矩形投影后的失真。使用鲁棒视觉变换模块提取4种尺度特征图所包含的显著信息,采用卷积嵌入的方式降低特征图的分辨率,增强模型的鲁棒性。使用多注意力模块,根据空间注意力与通道注意力间的关系,有选择地融合多维度注意力。最后逐步融合多层特征,形成全景图像显著图。纬度加权损失函数使该文模型具有更快的收敛速度。在两个公开数据集上的实验表明,该文所提模型因使用了鲁棒视觉变换模块和多注意力模块,其性能优于其他6种先进方法,能进一步提高全景图像显著性检测精度。 相似文献
19.
The Wyner-Ziv distributed video coding scheme is characterized for its intraframe encoder and interframe decoder which can also approach the efficiency of an interframe encoder-decoder system. In Wyner-Ziv residual coding of video, the residual of a frame with respect to a reference frame is Wyner-Ziv encoded, which can reduces the input entropy and leads to a higher coding efficiency than directly encoding the original frame. In this paper, we propose a new approach of residual coding combined with Region Of Interest (ROI) extraction. Experimental results show that, the proposed scheme achieves better rate-distortion performance compared to conventional Wyner-Ziv coding scheme. 相似文献