共查询到19条相似文献,搜索用时 56 毫秒
1.
自然场景文本区域定位是场景图像内容分析的重要步骤,文本区域定位能够为后续的文本识别提供便利.从场景文本特性出发,提出了一种基于最大极值稳定区域(maximally stable extremal regions,MSER)、颜色聚类和视觉显著性的鲁棒性文本定位方法.为了尽可能多地提取出潜在的文本区域,分别在灰度图像和彩色图像上采用最大极值稳定区域和颜色聚类来进行连通域的分析.对于得到的候选连通域,利用自然场景文本的显著性特征和少量的先验信息来滤除其中的非文本区域.将保留的文本区域用数学形态学水平膨胀的方法连成文本行输出.显著性评估的引入使得该方法能够减少大量参数的设定.标准数据集上的实验结果表明,在没有额外的训练数据和少量先验信息的情况下,该方法可以获得较好的正确率和召回率. 相似文献
2.
文章探讨了三类自然场景图像的基于纹理、边缘以及连通域文本定位方法的不同特点,并选取基于阈值的连通域方法,对复杂场景中的车牌图像中的文本实现图像的分割,最后分析了此方法在自然场景文本定位方法今后的应用前景。 相似文献
3.
为了提高井下定位系统的定位精度,提出了基于梯度提升回归树(gradient boost regression tree, GBRT)的井下定位算法。本文首先介绍了GBRT算法的实现过程,然后利用射线追踪算法模拟井下多径信号叠加后的接收信号强度(received signal strength, RSS)数据集,最后对比了GBRT、K最近邻(k-nearest neighbor, KNN)、随机森林(random forest, RF)、支持向量机(support vector machine, SVM)和神经网络多层感知器(multi-layer perceptron regressor, MLPR)算法的定位结果并对GBRT的定位结果进行5点平均滤波。实验结果表明,在100个点组成的行人轨迹定位中,GBRT算法的定位结果的均方误差为0.381米,明显优于其他四种算法,平滑滤波后的定位轨迹更加贴合真实轨迹。因此,本算法可以有效提高定位精度,可以满足井下定位系统的精度要求。 相似文献
4.
在自然场景文本图像超分辨中,针对先验信息利用不准确、不充分以及文本边缘恢复不完整的问题,提出了一种基于文本语义指导的自然场景文本图像超分辨方法。该网络结构由超分辨重建模块和文本语义感知模块组成。为进一步提高超分辨网络的表达能力,提出使用循环十字交叉注意力,捕获全局上下文信息,使得模型在训练的过程中更加关注文本区域,同时,提出软边缘损失、梯度损失对重建过程进行约束,生成具有锐利边缘的超分辨结果。采用公开的自然场景文本图像超分辨数据集TextZoom对提出模型的性能进行验证,与8种主流深度网络模型进行了对比,结果表明:该模型在3个不同识别器下的平均识别率相比TSRN分别提升了2.06%、1.80%和2.89%,在PSNR和SSIM指标上也具有一定的优势。 相似文献
5.
杨丽玲 《吉林师范大学学报(自然科学版)》2014,(4):133-135
文中介绍了使用核覆盖算法进行中文文本分类.研究了采取不同的特征选取方法、利用核覆盖算法进行文本分类的区别.通过实验,除互信息外的其它几种特征选取方法在核覆盖算法分类过程中均取得了较优的实验结果,可看出核覆盖算法在文本分类中是一个不错的方法. 相似文献
6.
一种基于纹理能量的JPEG图像文本定位算法 总被引:2,自引:0,他引:2
提出了一种新的JPEG图像人工文本定位算法.该方法直接在DCT域中计算各DCT块的纹理能量特征,并以此初步定位文本区域.然后利用文本的连通和几何特性,精确定位文本区域.实验结果表明,使用该方法可以快速有效地定位JPEG图像中的人工文本区域. 相似文献
7.
自然场景文本识别是计算机视觉领域一项极具挑战性的任务,为此提出一种适用于任意方向的自然场景文本识别算法.使用高分辨分割网络作为基础框架提取文本的空间信息,利用卷积长短时记忆网络提取文本的时空序列信息,同时通过设计字符注意机制使模型专注于字符上,并采用可微分二值化函数进一步加大网络对前景的注意力,削弱对背景区域的关注,网... 相似文献
8.
《西安交通大学学报》2017,(1)
针对从背景复杂、视角多变、语言形式多样的场景图像中难以准确提取文本信息的问题,提出了一种基于最大稳定极值区域(MSER)和笔画宽度变换(SWT)场景文本提取方法。该方法结合MSER、SWT算法的优点,采用MSER算法的准确检测文字区域,建立文本候选区域,利用SWT算法计算文本候选区域笔画宽度得到候选文本区域的笔画宽度;根据笔画宽度图,利用连通域标记建立笔画宽度连通图,然后根据笔画宽度连通图,建立笔画连通图的启发性规则,删除非文本候选区域,并根据文本的几何特征分析及局部自适应窗口最大类间方差(Otsu)分割,有效提取出自然场景图像中的文本,文本提取的准确率、召回率及综合性能分别为0.74、0.64及0.68。仿真实验结果表明,在文本视角多变,字符大小、尺寸、字体各异的复杂条件下,所提方法具有较好的鲁棒性,适用于多语言和多字体混合的场景文本提取。 相似文献
9.
提出了一种文档聚类方法,对用户的检索结果中类似的文档进行聚类,提供目录结构,辅助用户浏览检索结果.首先分析了现有的文本聚类方法,讨论了它们的优势和不足,然后提出了基于后缀树的中文文本聚类算法,并详细描述了该算法的原理和构造使用过程,及在算法实现的过程中遇到的关键问题及解决方案. 相似文献
10.
11.
针对中文漫画图像的特点, 提出一种无监督的中文漫画图像对白自动定位方法, 以满足中文漫画移动阅读的需求。不同于现有基于学习的方法, 该方法不需要训练集, 且具有较强的鲁棒性, 主要包括3个步骤: 1) 利用包围漫画图像文字的空白区域(气泡)的连通性进行气泡检测, 并在气泡中检测完整字符对; 2) 基于字符形状与字符排版规则的一致性, 聚类形成字符行或字符列, 并提取字体特征; 3) 联合多页漫画图像字体特征, 利用贝叶斯分类器检测多页漫画中的剩余字符。在包含900页漫画图像的数据集上进行实验, 结果表明, 该方法可以有效定位中文漫画图像中的对白区域, 取得比较满意的实验结果。 相似文献
12.
随着网络信息的迅猛发展,如何快捷、准确地识别和获取有用信息显得更为重要。文本自动分类系统是信息处理的重要研究方向,它是指在给定的分类体系下,根据文本的内容自动判别文本类别的过程。Boosting算法是一种新兴的机器学习算法。在文本分类中应用Boosting算法经过试验证明是有效的,并且优于目前的大多数分类算法。 相似文献
13.
焦炭是高炉炼铁的重要原料,其质量是影响铁水质量和高炉顺行的重要因素,针对焦炭质量存在检验难、滞后性、预测误差大等问题,提出一种基于梯度提升决策树算法的焦炭预测模型;结合专家经验与相关性分析方法,深入研究配合煤质量对焦炭质量的影响;最后利用配合煤质量指标对焦炭质量指标灰分、硫分、耐磨强度、抗碎强度进行建模预测;根据某焦化厂历史生产数据对模型进行评估,实验结果表明:基于梯度提升决策树的焦炭质量预测模型相较于线性回归模型、随机森林模型,决策树模型误差小、准确率高,可以为焦化厂配煤炼焦提供一定的理论依据。 相似文献
14.
广告视频中的文本定位是视频广告探测系统的一部分,为了能够更加精确地定位出广告的边界位置,可以在视频广告探测系统中引入文本信息作为一种判断的依据。文章对原有的基于边缘特征多次投影分析的文本定位方法进行改进,提出了一种基于多分辨率的广告视频文本定位算法,实验表明该算法对于广告文本的定位效果较好,并为广告边界位置的定位提供了辅助信息。 相似文献
15.
提出了一种静止摄像机条件下基于计算机视觉的工业机器人的定位算法。采用单目视觉系统,由线性摄像机模型推导出定位测量模型。通过序列图像,以一种改进的自适应混合高斯模型更新背景,运用背景差分法检测出运动目标,用CAMSHIFT算法实现对运动目标的跟踪,确定其位置和姿态,估计出运动参数,反馈给机器人指导其准确运动。实验结果表明,该方法快速、有效,能够满足视觉定位的实时性要求。 相似文献
16.
互联网与实体经济融合发展背景下,网络优惠券往往承担了提升用户体验、促进再次消费的重要功能。构建梯度提升树、随机森林等模型,预测网络优惠券使用行为;并对影响因素的重要性进行排序。结果表明:梯度提升树算法的五折交叉验证平均测试精度、曲线下面积值分别为0. 804与0. 886,高于随机森林与单棵决策树算法。优惠券折扣率对于用户使用优惠券行为起着决定性影响,用户经常活动的地点离该商户最近门店的距离、领取优惠券时间等特征对用户使用优惠券行为具有重要影响。 相似文献
17.
根据词条聚合和决策树原理,提出了一种文本分类的新方法.决策树分类方法具有出色的数据分析效率和容易抽取易于理解的分类规则等优势,但只能应用于维数较低的特征空间.本方法将与各个类别相关程度相似的词条聚合为一个特征,有效地降低了向量空间的维数,然后再使用决策树进行分类,从而既保证了分类精度又获得了决策树易于抽取分类规则的优势. 相似文献
18.
针对当前自动文摘方法的缺陷,提出了基于文本聚类和自然语言理解的自动文摘实现方法.将文本聚类引入自动文摘中,实现多文档的自动文摘.提出了基于标题和段首句的二次自动分词算法.实验结果表明,分词正确率和召回率均在95%以上.实现了面向塑料行业的基于文本聚类和自然语言理解的自动文摘系统,其多文档自动文摘的正确率和召回率都在75%以上.实验表明该方法可行,对自动文摘系统的设计具有借鉴意义和深入研究价值. 相似文献
19.
针对人群计数问题,基于优化InceptionResNetA模块,使用集成学习中的Gradient Boosting方法提出了一种可用于稀疏人群和密集人群的人群计数方法, 并给出此方法实现的具体细节.通过在三个公开数据集和真实场景(含光照和视角变化)中进行测试,检验了该方法对于光照、人群密度、视角等变化的鲁棒性.实验结果表明,该方法对于以上变化具有较强的鲁棒性,并且相比于之前的人群计数方法在准确性和稳定性方面具有更好的性能. 相似文献