首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
针对现有基于图像文档转换为文本后进行文档检索的方法,无法满足当今超大量数字图像库的处理场景。文中提出一种基于文本布局块的文档图像检索方法。根据文本布局块之间的距离特征,定义了新的距离函数,利用新的距离函数计算得到文本布局块之间的距离矩阵,并结合匈牙利算法求出文档图像的最佳匹配结果。通过大量实验证明,所提方法能够有效地提高图像文档检索准确度,并且能保证78.2%的正确率。  相似文献   

2.
王萍霞 《电子世界》2004,(10):15-15
用数码相机拍摄的文字照片也可以进行OCR识别吗?这不是只能用扫描仪才可以实现的功能吗?要是这样想,那可就大错特错了……坐在办公室里,你突然发现报纸上有一条不错的新闻,但公用物品带回家毕竟是不好的。这时,何不拿出你的数码相机将其拍摄下来,回到家里再用OCR软件将照片上的  相似文献   

3.
现有方法在进行票据的识别时,需要特定设备扫描或大量的票据标签才能达到很好的识别效果.为了解决上述问题,提出了采用OCR技术进行票据识别算法.该算法是由OCR识别和N版本程序策略两部分组成.在OCR识别阶段,采用了OCR进行票据文字的识别,将识别后的非结构化数据转化为结构化数据.在N版本程序设计策略中,提出了两种算法:前者进行主关键字的匹配;后者通过选择基准,计算字符大小从而推算出其它字段.选取火车票和发票作为实验数据,广泛的实验结果证明:算法在自然场景下票据识别具有很好的结果.  相似文献   

4.
随着互联网信息的爆炸式增长,文档检索已经成为自然语言处理的热点问题.对于长文本检索,使用传统的基于词频的表示方法往往忽略了文本的语义信息,而使用嵌入模型进行文本表示,受输入长度的影响,长文本通常会被截断,此外,一些相似度计算方法会受到文本长度的影响.针对上述问题,提出将多示例学习框架用于文档检索中,以语义相对完整的句子...  相似文献   

5.
王晓艺  高挺挺 《激光杂志》2020,41(12):156-160
以转化并翻译纸张等载体上文本资料为数字化信息为目标,提出一种基于OCR光学字符识别的翻译优化方法。利用具备摄像功能的设备拍摄含待翻译字符的图像,图像预处理时采用区域灰度差生长算法和叠加灰度值方式判断原始图像中背景信息和表格线条,去除原始图像中非字符像素干扰,得到二值化文本图像;图像分割时采用基于改进FCM聚类算法的图像分割方法,利用小波多尺度图像框架,引入时效性函数,降低二值化文本图像分割计算量,充分考虑相邻域信息,解决图像分割缺陷及干扰,获取二值化文本图像单个字符或单词;依据一阶Minkowski距离实现分割后的图像特征分类后,利用后处理方式结合上下文信息展开特征分类结果的进一步处理,提升翻译准确度。实验结果表明:所提方法可实现文字的精准翻译,应用效果较好。  相似文献   

6.
现如今,由于互联网信息技术的持续性发展,图片的信息量也日益扩大,从而促进了图像识别领域的发展。光学字符识(optical character recognition,OCR)是图像文字识别的一个非常重要的技术,改变了传统纸质文本作为介质传输信息的观念。本文主要采用百度智能云提供的OCR文字识别技术来实现核酸截图文字的识别与相关信息提取,结合PyQt5模块设计了一个功能交互式窗口操作系统,以此完成图片文字信息识别、提取等基础功能,并在该基础功能上对系统功能进行深入拓展并完成开发,如:实现对核酸结果截图的导入、调用摄像头识别绿码或二维码等。  相似文献   

7.
8.
本文提出一种新颖的基于内容和图像检索方法,基于运动子块分割并根据视觉特性对不同区域做不同的加权,比较各子块相似度,分析相似度矩阵,并检索查询物体。通过将图象分割细化,充分利用了原图的颜色位置信息,通过实验,实现了对特定物体进行检索。该物体检索方法可进一步发展,为特定的后续处理奠定基础,如在人脸识别等功能中发挥重要作用。  相似文献   

9.
计算机激光打印文档鉴别与检索   总被引:2,自引:0,他引:2  
该文为解决计算机对打印文档的自动鉴别与检索问题,研究激光打印机的工作机理,以器件特性反映到打印图形中的差异做为打印文档鉴别与检索的依据。设计一种新的双极性Hausdorff距离用于有效的一对一打印字符匹配,之后综合样本的所有字符,采用字符集匹配计算二次距离进一步提高打印图形鉴别和检索的准确性。实验表明该方法能够取得较为理想的效果,其中检索正确率为90%,鉴别最小错误率为17.80%。  相似文献   

10.
基于内容的图像检索技术   总被引:4,自引:0,他引:4  
基于内容的图像数据库检索技术是当今的一个研究热点.本文介绍了基于内容图像检索的基本原理、检索方式和关键技术,并列举了几种较为先进的图像检索系统.最后探讨了当前研究中存在的问题以及今后的研究方向.  相似文献   

11.
服务外包业中OCR前期对图片的处理   总被引:1,自引:0,他引:1  
易博 《电子测试》2009,(7):83-86,90
在服务外包也中常常用到OCR(Optical Character Recognition)技术将传统的纸质文件转换成电子文档。由于文件印刷质量不高或采集设备有限等因素的制约,采集来的文件图片质量往往不能够达到OCR的要求,或者对其OCR以后,文字识别率很低。因此,对原始图片进行适当的处理,可以大大提高OCR的效率。使用Photoshop图像处理软件,对图片的模式、亮度、对比度和几何形状进行调整,使图片达到要求。  相似文献   

12.
基于Android的手机OCR识别技术设计与实现   总被引:3,自引:0,他引:3  
朱怀中 《电子科技》2012,25(9):45-48,51
介绍了OCR文字处理和识别的工作原理,以及OCR运用在手机平台的优越性。设计了基于Android的OCR中英文识别日程小秘书软件,重点对OCR识别软件的功能进行分析,并设计实现方案,最终完成了OCR日程提醒功能。经过对软件系统功能的测试,结果表明,OCR识别软件在功能上能完成日常的文字识别与提取。  相似文献   

13.
Document images belong to a unique class of images where the information is embedded in the language represented by a series of symbols on the page rather than in the visual objects themselves. Since these symbols tend to appear repeatedly, a domain-specific image coding strategy can be designed to facilitate enhanced compression and retrieval. In this paper we describe a coding methodology that not only exploits component-level redundancy to reduce code length but also supports efficient data access. The approach identifies and organizes symbol patterns which appear repeatedly. Similar components are represented by a single prototype stored in a library and the location of each component instance is coded along with the residual between it and its prototype. A representation is built which provides a natural information index allowing access to individual components. Compression results are competitive and compressed-domain access is superior to competing methods. Applications to network-related problems have been considered, and show promising results.  相似文献   

14.
张峰  钟宝江 《电子学报》2018,46(8):1915-1923
当前图像检索算法通常针对整体图像提取特征以完成检索任务.然而,在很多情况下用户只会关注图像的一部分,即他们的兴趣目标.此时,从整体图像提取的特征一部分是有效的,另一部分则是无效的且会对检索过程带来消极影响.为此,本文提出基于兴趣目标的图像检索方案,并借助于现有的显著性检测、图像分割、特征提取等技术实现一款有效的图像检索算法.首先采用HS (Hierarchical Saliency,分层显著性)检测算法分析用户的兴趣目标并应用SC (Saliency-based Image Cut,基于显著性的图像分割)算法将其分割,然后针对兴趣目标提取HSV (Hue、Saturation、Value,色调、饱和度、明度)颜色特征、SIFT (Scale Invariant Feature Transform,尺度不变特征变换)局部特征和CNN (Convolutional Neural Network,卷积神经网络)语义特征,最后计算其与数据库图像的相似度并根据相似度排序返回检索结果.仿真实验结果表明,本文算法在解决"这是什么东西"这类图像检索任务时明显优于现有的图像检索算法.  相似文献   

15.
李勍  章毓晋 《电子与信息学报》2003,25(12):1591-1597
该文提出了一种基于特征元素的新的图像俭索算法。持征元素与特征向量相比更注重根据人的主观感知来表达图像的视觉特征.在特征元素的基础上,该文先定义了图像间的相似性度量,即特征元素间的距离,又分别实现了对不同特征元素类别的距离计算。检索实验表明,基于特征元素的图像检索算法能够取得更符合人们视觉感知的结果。  相似文献   

16.
基于DCT压缩域的图像检索方法   总被引:13,自引:0,他引:13       下载免费PDF全文
黄祥林  宋磊  沈兰荪 《电子学报》2002,30(12):1786-1789
本文提出了一种基于DCT(Discrete Cosine Transform)压缩域的图像检索方法.对于DCT编码的图像数据,在不需要完全解码的情况下,直接抽取图像的内容特征进行图像检索.首先,重组DCT域的频率系数,使其具有方向性、多分辨率等特点,并利用这些特点提取图像的大致轮廓.接着统计图像轮廓的连通直方图(CRH:Connected-Region Histogram),进行图像检索.并利用DC图的灰度直方图对检索结果进行重新排序.这种检索方法对灰度、旋转、平移等都具有一定的鲁棒性,具有较好的检索效果.  相似文献   

17.
提出了一种融合图像颜色、纹理和形状特征的提取及归一化方法,并将其应用于基于内容的对象检索中,实验证明,融合颜色、纹理、和形状特征的对象检索比单一特征的对象检索效果要好。  相似文献   

18.
基于内容的图像检索一直是一个受关注的研究热点,这里利用图像的颜色和形状特征,将基于内容的图像检索应用于电子购物领域。提出先利用不变距与傅里叶描述子相结合的方法对图像形状特征进行检索,再利用改进的颜色直方图进行二次检索的检索方法。在检索前引入图像背景消除法消除图像中背景信息的影响。最后通过实验验证了基于颜色和形状特征的服装图像检索效果以及利用图像背景去除对检索效果的影响。  相似文献   

19.
党妮  胡方明  曹越 《电子科技》2012,25(12):137-140,150
通过对图像进行特征提取的方法,设计并实现了一种基于小波纹理特征的图像检索原型系统,并利用所获得的纹理特征对图像库进行检索。实验结果表明,小波变换是一种有效的纹理特征提取方法,能有效地提高检索的准确度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号