首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于注意力机制的多方向文本检测
引用本文:徐健,郭湛澎,刘秀平,陈博,闫焕营.基于注意力机制的多方向文本检测[J].光电子.激光,2023,34(2):166-173.
作者姓名:徐健  郭湛澎  刘秀平  陈博  闫焕营
作者单位:西安工程大学 电子信息学院,陕西 西安 710048,西安工程大学 电子信息学院,陕西 西安 710048,西安工程大学 电子信息学院,陕西 西安 710048,西安工程大学 电子信息学院,陕西 西安 710048,深圳罗博泰尔机器人技术有限公司,广东 深圳 518109
基金项目:陕西省科技厅项目(2018GY-173)和西安市科技局项目(GXYD7.5)资助项目
摘    要:针对多方向排列的文本因其尺度变化大、复杂背景干扰而导致检测效果仍不甚理想的问题,本文提出了一种基于注意力机制的多方向文本检测方法。首先,考虑到自然场景下干扰信息多,构建文本特征提取网络(text feature information ResNet50,TF-ResNet),对图像中的文本特征信息进行提取;其次,在特征融合模型中加入文本注意模块(text attention module, TAM),抑制无关信息的同时突出显示文本信息,以增强文本特征之间的潜在联系;最后,采用渐进扩展模块,逐步融合扩展前部分得到的多个不同尺度的分割结果,以获得精确检测结果。本文方法在数据集CTW1500、ICDAR2015上进行实验验证和分析,其F值分别达到80.4%和83.0%,比次优方法分别提升了2.0%和2.4%,表明该方法在多方向文本检测上与其他方法相比具备一定的竞争力。

关 键 词:场景文本检测  注意力机制  文本特征提取网络(TF-ResNet)  文本注意模块
收稿时间:2022/3/9 0:00:00
修稿时间:2022/4/29 0:00:00

Multi-directional text detection based on attention mechanism
XU Jian,GUO Zhanpeng,LIU Xiuping,CHEN Bo and YAN Huanying.Multi-directional text detection based on attention mechanism[J].Journal of Optoelectronics·laser,2023,34(2):166-173.
Authors:XU Jian  GUO Zhanpeng  LIU Xiuping  CHEN Bo and YAN Huanying
Abstract:
Keywords:scene text detection  attention mechanism  text feature information ResNet50 (TF-ResNet)  text attention module (TAM)
点击此处可从《光电子.激光》浏览原始摘要信息
点击此处可从《光电子.激光》下载免费的PDF全文
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号