首页 | 本学科首页   官方微博 | 高级检索  
     检索      

英文光学字符识别的后处理
引用本文:吕学强,迟呈英.英文光学字符识别的后处理[J].鞍山科技大学学报,2002,25(3):192-196.
作者姓名:吕学强  迟呈英
作者单位:抚顺师范高等专科学校数理系 辽宁抚顺113006 (吕学强),鞍山钢铁学院计算机科学与工程学院 辽宁鞍山114002(迟呈英)
摘    要:总结了英文光学字符识别 (OCR)系统中的常见错误类型 ,论证了使用拼写检查技术发现错误的可能性 .以最相似单词替换OCR的错误输出 ,从而达到改正错误的目的 .利用编辑距离实现词汇相似性评估 ,并用动态规划技术优化了编辑距离的计算 .试验结果证明该方法可以使OCR系统的单词识别率提高 6 2 5 % .

关 键 词:OCR后处理  拼写检查  编辑距离  字符识别率  单词识别率
文章编号:1000-1654(2002)03-0192-05
修稿时间:2002年2月13日

Postprocessing of English OCR
LU Xue_qiang ,CHI Cheng_ying.Postprocessing of English OCR[J].Journal of Anshan University of Science and Technology,2002,25(3):192-196.
Authors:LU Xue_qiang  CHI Cheng_ying
Institution:LU Xue_qiang 1,CHI Cheng_ying 2
Abstract:Putting up the type of the common errors from the system English OCR,it has proved it feasible to use a spelling check technology to find its errors.Using the most similar words to replace OCR's error output,to correct such errors,using edit distance to evaluate the similaring of words,and using dynamic planning technology to optimize the calculation of edit distance,the recognition rate of words from OCR can be improved by 6 25%.
Keywords:postprocessing of OCR  spelling check  edit distance  character recognition rate  word recognition rate
本文献已被 CNKI 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号