首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
流行的数据库管理系统通常实现了全文检索子系统,从而方便对数据库表中的文本数据建立全文索引,进而借助于这个索引来检索文本数据.达梦数据库管理系统提供多文本数据检索服务.包括全文索引和全文检索.达梦数据库实现了全文检索系统.但是此系统存在着索引膨胀率过高,索引填充时间较长的问题.全文检索,是一门综合性很强的技术.它牵扯到了很多的技术点,主要有分词技术,数据源提取和文档解析技术,相关度计算技术,存储技术.压缩技术等.  相似文献   

2.
全文检索系统的数据库设计   总被引:1,自引:0,他引:1  
应用软件工程的方法对全文检索系统的数据库进行规范化设计,给出了系统数据库组织结构图。  相似文献   

3.
简述了文史资料的特点及其开发利用现状,以临沂文史资料全文数据库系统的构建为例,详细介绍了如何利用TPI全文检索系统,开发利用数量浩大、内容丰富的文史资料,以解决传统检索方法存在的不足。  相似文献   

4.
超文本全文检索技术的研究与实现   总被引:7,自引:0,他引:7  
在分析超文本全文检索功能需求的基础上,提出了一种将非结构的超文本转换成为结构化数据库,以支持全文检索的实现思想和模型,形式化地描述了超文本检索引擎的原理,并分析了模型设计与实现的关键技术问题,如超文本关键词提取、查询条件构造、全文检索算法及查询结果处理等。该模型具有实现简单、通用性强、支持大容量超文本信息检索等特点,并已在鲁讯图书馆数字化网络化信息系统和钱学森特色数据库系统中得到了验证和应用。  相似文献   

5.
实现了中文单字切分模块,并在Lucene API基础上建立支持中英文混合检索的全文数据库。在电子文献全文检索系统项目中作为全文检索工具。中文全文数据库的主要性能和功能包括:支持中英文混合检索;可以不关机动态添加或删除一篇文档索引;采用多线程设计,能承受大量的访问请求;支持跨平台运行;提供命令行直接查询方式和基于WEB的查询方式;易学通用的检索表达式;系统可扩展性强。  相似文献   

6.
针对传统数据库检索中检索速度较慢、 检索结果不完整、 检索结果排列无序等问题, 基于全文检索工具Lucene索引的结构, 设计一种基于Lucene的数据库索引结构, 并提出记录倒排索引链表的概念, 使网站不用再按照传统顺序查找方式进行检索, 而是以索引库中的关键词进行检索, 提高了检索效率. 实验结果表明, 基于
Lucene的数据库全文检索具有查全率高、 检索结果排列有序等优点.  相似文献   

7.
介绍了一种建立基于Web的全文检索电子图书系统的方法,讨论了WWWServer与SQI.Server数据库的CGI接口,并介绍了以WWW技术建立的电子图书系统实例--家族医生杂志全文检索系统。  相似文献   

8.
详细介绍了中文报刊全文数据库文献的特点。同时对报刊全文数据库设计、实现方法以及应用作了详细的讨论,最后分析了系统的特点与改进方向.  相似文献   

9.
全文检索是搜索引擎的核心技术之一。由于目前基于LUCENE的中文全文检索正在适应中文信息技术发展的需求等方面进行探索,基于LUCENE的藏文全文检索也需要适应藏文信息技术发展的需求进行新的探索。文章介绍了一种全文检索引擎工具包——LUCENE,并结合当前藏文信息技术现状提出了藏文全文检索相关问题和需要解决的关键问题。  相似文献   

10.
对目前流行的全文检索技术——基于Lucene引擎的全文检索和SQLServer附带的全文检索功能组件Microsoft Search进行了分析研究,实现相应的检索接口,封装为Web服务且集成到使用面向服务架构的分布式仿真资源库中.通过相关性能测试,验证了全文检索接口封装为Web服务并应用于面向服务架构的可行性,结果表明基于Lucene的检索服务总体性能优于基于Microsoft Search的检索服务.  相似文献   

11.
数据去重可删除备份过程中的冗余数据,节约存储资源与与网络带宽,是目前数据存储领域研究的重点问题。针对传统方法去重率和吞吐量低的问题,提出一种新的大型文本数据库中分布式数据去重备份方法。介绍了大型文本数据库中分布式数据去重方法基本思想,通过文件管理部分对数据片组中的扶贫数据进行查询和统计,给出数据片组路由策略,分析了数据预取过程。通过最终权值完成对数据块的排列,以恢复时间与恢复成本达到最小化为目的设计适应度函数。通过改进遗传方法对大型文本数据库中分布式扶贫数据进行备份。实验结果表明,所提方法有很高的去重率和吞吐量,且成本低,恢复速度快。  相似文献   

12.
开放源码关系数据库PostgreSQL目前还不支持对中文的全文索引.文章研究和分析了PostgreSQL的全文索引技术(TSearch2),通过对其核心函数的重写和配置文件的修改,将中文分词技术引入到了Post-greSQL的全文索引技术中,并加入了去除中文无用词的功能,从而首先实现了PostgreSQL的中文全文索引.  相似文献   

13.
文本挖掘技术的研究   总被引:3,自引:0,他引:3  
本文对文本挖掘的过程极其关键技术进行了系统的分析,并探讨了其应用趋势。  相似文献   

14.
数据库表关联删除的遍历算法实现   总被引:1,自引:1,他引:0  
对数据库表关联删除的需求作了详细分析,为其解决给出了一套完整的处理方案,使数据库管理更加方便合理。直接借助或使用该方案可以在软件中操作数据库,并可以由此编制一些触发器。此外,使用树形存储结构结合树的先根、后根遍历算法,提出了一种全新的松散先根遍历算法,从而有效地解决了数据库表的关联删除在占用空间及搜索处理上效率更高的关键问题。  相似文献   

15.
全文检索是一种有效的信息检索技术,改进最大熵模型的应用研究在自然语言处理领域中受到关注。笔者利用语料库中词性标注和词频标注的上下文信息,建立基于互信息的最大熵方法的检索系统,研究的重点在于提出一种中文分词算法,并从实际问题出发,采用面向对象和模型驱动的设计方法,将该算法应用于实际的全文检索系统的设计中。  相似文献   

16.
基于关系数据库的模型库系统研究   总被引:1,自引:0,他引:1  
用关系数据库技术取代传统的文件方式创建和管理模型库系统,能够方便灵活地完成模型的存储和管理.文中分析了模型库系统的结构,阐述了模型字典的作用和组织方式,设计了模型字典的表结构,研究了模型库管理系统的功能,最后给出了软件成本估算专家系统模型库中FPA的TCF模型的设计实例.  相似文献   

17.
针对观点检索问题,把主题检索和情感分析相结合,通过构造情感词典、程度词典等,利用SVM对文本进行主客观分类,构造正则表达式进行中文句式识别,提出了计算文本褒贬倾向的方法,结合主题相关性和情感强度计算置信度.在COAE2009的任务5-观点检索的评测中,取得了较好的结果.  相似文献   

18.
提出一种基于案例分析的文本数据抽取方法,通过将知识进行特征化表示,借助"用户特征—案例特征—案例知识"三者之间的映射关系和概念模块间的知识关联,完成复杂信息的知识抽取,同时引入增量式案例知识学习模型,有效地避免了因人工干预导致的知识拓展的不连续性,提高了抽取过程的识别效率.  相似文献   

19.
介绍了两种网络课件、网络课程等制作完成后生成光盘,脱离后台服务器支持,实现光盘数据库查询功能的解决方法:一是HTML网页内嵌JavaScript或VBScript脚本访问本地数据库(MS Access);二是采用HTML Appucadon(HTA)形式来访问数据库.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号