共查询到19条相似文献,搜索用时 97 毫秒
1.
区别于传统基于图像和西文文档的公式定位方法, 针对中文电子文档的特点, 提出一种基于机器学习和规则相结合的独立公式和内嵌公式的定位方法。设计了适合中文文档的页面分行策略和词块划分规则; 选择适合中文文档的公式特征和机器学习算法; 针对公式定位中的过分割问题, 提出行合并与词块合并等后处理手段。实验结果表明, 该方法可以有效地从中文电子文档中自动定位公式区域。此外, 构建了公开可用的中文数据集, 以促进不同数学公式定位方法间的相互比较及性能评估。 相似文献
2.
提出了一种自底向上和自顶向下相结合的定位英文科技文档图像中数学表达式的新方法.首先,利用整幅图像的统计数据计算出用于分类的基准参数,然后利用局部极大成分的水平投影数据进行初步行分割,再利用每行的竖直投影数据将每行的符号分成数个子区域.对每一个子区域依据其性质利用基准参数进行分类,通过对特定类别子区域的适当合并,最终得到文档图像中公式的位置.新方法可以用于处理图文混排的文档图像,能够降低文档中的图片、表格等元素对于公式定位结果的影响. 相似文献
3.
基于文档结构的信息抽取工具很多,XWrap,W4F,Lixto以及自主开发的PQagent是其中比较有代表性的几个.这几个工具采用了不同的规则描述形式,XWrap,W4F,Lixto使用的是自定义的规则描述形式,PQagent采用了通用的规范XQuery来描述规则.现将XWrap,W4F,Lixto使用的规则描述形式与PQagent采用的XQuery进行比较,说明了采用XQuery描述抽取规则的优越性. 相似文献
4.
数学公式重构是公式识别的重要环节,目前相关的研究还很欠缺.针对数学公式重构展开了研究,提出了一种基于MathML的数学公武重构的方案.实验表明,这种数学公式重构方法可以完美准确地表达数学公式,而且可以和目前流行的字处理软件中的公式编辑器兼容. 相似文献
5.
基于Nutch的Web数学公式提取 总被引:1,自引:0,他引:1
本文主要研究基于公式的数学搜索引擎中数学公式的识别和提取方法,总结了MathML、Open-Math、LaTex、Infix格式数学公式在网页中出现时的各自特征,提出了基于特征和启发式规则的公式识别和提取方法,并用实验说明了该识别和提取方法的可行性和准确率. 相似文献
6.
曹东 《中南民族大学学报(自然科学版)》2014,(4):137-139
指出了科技期刊双栏排版给数学公式转行带来的影响,基于国家标准详细分析了各种类别数学公式转行时遇到的编排问题,针对其特点,结合编排实践,对数学公式的转行处理提出了可供选择的具体方法. 相似文献
7.
郭继创 《合肥学院学报(自然科学版)》2000,(4)
本文从数学公式的教学与数学能力的培养的关系出发,就公式教学的五个环节进行了分析,根据各环节的特点以及学生的心理特征,设计了相应的教学方法。 相似文献
8.
张颖 《内蒙古师范大学学报(自然科学版)》2010,39(3):322-324
在经济学类图书中,数学公式中量的符号表达形式很不统一,大致可分为两类:一类量的符号使用斜体或正斜体混用;一类均用正体,这样的表达形式均不符合现行的国家标准,就如何对经济科学中涉及数学量的符号进行规范处理,又能同时兼顾该学科的习惯用法作了探讨. 相似文献
9.
数学公式的识别与检索对于信息快速共享和防止学术不端都有非常重要的现实意义,已成为信息化教育和数字图书馆的研究热点.分析了数学公式识别与检索的研究现状,详细介绍了几种主要的数学公式识别技术和检索技术,比较了它们的优缺点,并给出了数学公式识别和检索未来的研究方向. 相似文献
10.
袁晓峰 《成都大学学报(自然科学版)》2012,31(4):367-369
考虑到文档中出现频率较高的词语能够体现文档的主题,设计了一种中文文档主题抽取算法.该算法首先对目标文档进行预处理,然后计算文档中每个词语的出现频率,用出现频率最高的几个词语作为文档的主题.其中,将词语间的相关度作为计算出现频率的参考因素.词语相关度的计算是基于中文知识库《知网》的方法.实验证明,本算法具有较高的准确性. 相似文献
11.
关于数学符号和数学式编排规范的思考 总被引:3,自引:0,他引:3
唐燕玉 《安庆师范学院学报(自然科学版)》2005,11(3):60-62
按照国家标准局颁布的《科学技术期刊编排规则》的要求,结合国内40种数学期刊和进入SC I的59种国际数学核心期刊的编排格式和书写方式所涉及到的常用国家标准中的部分条款,如数学符号与数学式编排的规范标准,分析了编排中的数学符号使用不规范,数学式转行不科学以及数学式不加标点符号的问题,找出了差距,从而提高了初步看法和改进意见。以便提高我国科技期刊编排格式标准化、规范化的程度。 相似文献
12.
基于数学形态学的图像特征提取 总被引:3,自引:0,他引:3
陈波 《科技情报开发与经济》2007,17(17):161-162
阐述了数学形态学的腐蚀,膨胀,开、闭等基本运算原理,采用数学形态学抑制背景,得到保留小目标的图像,并对包含小目标信息的图像进行处理和图像特征提取。 相似文献
13.
14.
超声强化超临界流体萃取的数学模型及机理 总被引:3,自引:5,他引:3
采用自行设计的内插式超声强化超,临界流体萃取(USFE)装置,研究了超声强化超,临界流体萃取的数学模型及机理.实验结果表明:所提出的数学模型既证实了超声对超临界流体萃取(SFE)具有强化效应,又对USFE和SFE过程具有很好的预测功能,能够反映萃取的实际过程;低频超声强化超,临界流体萃取的效果比高频超声要好;超声强化超临界流体萃取的机理是超声在微环境内产生的机械波动效应和热效应, 相似文献
15.
印刷体数学公式中存在粘连字符是限制公式识别系统性能提升的主要因素之一。因此提出一种针对公式粘连中字符水平粘连和角标粘连的切分算法。该算法首先以滴水法为指导思想寻找峰和谷,然后根据峰和谷的形态特征、位置关系及对应位置的垂直投影等特点选出候选切分点,最后根据切分点附近的笔画信息确定切分路径。实验结果表明,该方法能够很好的适用于公式中水平和角标的粘连字符的切分。 相似文献
16.
对公式符号切分这一公式识将符号分离与符号合并策略相结合,提取公式符号的方法,对具有包含关系的符号进行分离操作,而对由多个连通部件构成的符号进行合并处理.实验表明,该方法能够较好地适应公式特点,具有较高的准确性. 相似文献
17.
周有文 《湖南大学学报(自然科学版)》1988,15(4)
本文首先扼要介绍二值数学形态学的基本运算和主要结果,然后通过具体实例阐述用开运算和击中运算提取印刷体汉字各种特征的方法,还给出了C语言程序及其运行结果. 相似文献
18.
文中介绍了我国教学工作者1993年在国内232种期刊和国外82种期刊上发表的论文及这些论文受国家自然科学基金资助的情况,给出了高产的单位和个人。介绍了我国数学工作者和1992年美国《数学评论》各分支领域的论文分布。在分析、比较的基础上,提出了我国数学工作者的研究动向及我国数学科学与世界先进水平的差距。 相似文献
19.
指出了数学证明和数学实验对问题解决的重要意义,分析了两者的联系和区别,介绍并例证了数学建模是对数学证明与数学实验的包容。 相似文献