期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

全文获取类型

收费全文	3篇
免费	0篇

专业分类

综合类

3篇

出版年

2013年	1篇
2010年	2篇

排序方式： 共有3条查询结果，搜索用时 15 毫秒

一种基于聚类技术的图书目录识别方法

高良才汤帜林晓帆俞银燕房婧《北京大学学报(自然科学版)》2010,46(4):531-538

分析了目录识别研究的现状, 在总结当前技术优缺点的基础上, 提出了一种适应性和效率兼顾的目录识别方法。根据图书目录具有风格一致性的特点, 利用聚类技术发现目录装饰性内容, 生成具有自适应性的目录布局模型, 然后利用该模型生成目录条目及其层次关系。实验结果表明, 该方法在准确度和效率上均取得了较好的效果, 尤其是有效地处理了存在装饰性内容、折行和多种层次布局的复杂目录。该方法已应用于电子图书生产线, 显著提高了原电子目录制作系统的生产效率。相似文献

版式电子文档表格自动检测与性能评估

房婧高良才仇睿恒汤帜《北京大学学报(自然科学版)》2013,49(1):45-53

针对版式电子文档的特点, 提出一种表格线分割符和表格文本的布局特征相结合的表格定位方法, 并且对中英文档均有效。此外, 针对缺少表格定位自动评估体系, 构建了一个初具规模的公开数据集, 由中英文版式页面等比例组成, 对其标注基准结果, 并针对移动阅读应用场景提出一套评估准则。通过与现有两个开源表格定位项目的比较, 验证了新提出的表格定位方法的有效性和评估体系的实用性, 特别是对中文数据集获得了较好的结果。相似文献

一种自动发现、分割与标注引文元数据的方法

高良才汤帜陶欣房婧《北京大学学报(自然科学版)》2010,46(6):893-900

在总结现有的引文元数据抽取方法的基础上,针对引文的排版惯例——引文在文档内部风格一致,提出了一种新的引文元数据抽取方法。重点描述了以往研究中很少涉及的引文元数据的自动发现和分割,探讨了风格一致性在引文元数据标注中的应用。实验结果表明此方法在引文元数据发现、分割和标注方面均取得了较好的效果。相似文献