首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
在Web上存在一些长文档,它们包含着多个子主题,如果把这样的文档分成段,每个段的内容只围绕一个主题,将会提高检索质量.阐述了使用HTML结构中带有语义特征的标记来将多主题的文档分成段,在此基础上,对10G规模的Web数据实现了分段检索的方法,并通过使用TREC-9的查询做实验,比较了分段检索方法和传统的文档检索方法的检索质量.实验结果显示,在多主题文档集上分段检索方法比文档检索方法的11点平均准确率提高了大约9%,而在所有文档集上分段检索比文档检索提高了大约1.6%.分析发现,分段检索方法可以明显改善结果的排序,而且实际检索质量提高的幅度比现有的评价结果显示的更显著.  相似文献   

2.
探索了如何从用户的检索条件中获取用户的潜在意图.并利用获得的意图信息对检索结果进行改善.首先给出了检索意图的定义,之后根据特定的意图分别对待检索文档和检索条件进行数据建模.讨论了几种形式的意图建模结果改善检索效果的方案,通过实验对所提到的方法进行测试.结果表明,在检索中加入用户意图的因素对检索结果有明显改善.  相似文献   

3.
针对一个特定的查询意图,用户往往需要提交多次查询请求。有效地识别连续查询请求之间的意图变化边界,能够帮助检索系统更好地理解用户完整查询意图,以提高查询推荐及查询扩展的效果,并能够辅助个性化检索中用户模型的建立。在充分分析前人研究的有效特征基础上,提出了基于主题相似度检测意图边界的方法,并在SVM及CRF模型上都取得一定的提升。实验结果显示,所提方法的最优性能比Baseline系统F值提高了2%。  相似文献   

4.
一种启发式异构分布式数据库的查询优化方法   总被引:8,自引:2,他引:6  
目的提高异构分布式数据库的直询处理速度.方法提出了一个求异构分布式数据库查询处理中,使网上数据传输量达到最小的连接与半连接执行序列的启发式算法.该算法通过一个系列启发式规则,在搜索空间中,选择最有希望的节点作为下一个被扩展的节点,以减少搜索的节点数.结果提出了有用半连接的概念,虽然有的半连接就其本身讲是无益的,但是与一系列连接结合起来使用却是有益的,结论该方法能提高分布式数据库的查询处理速度,尤其在广域网上效果更为明显.  相似文献   

5.
描述了一种基于本体的信息检索模型,通过构造领域本体来有效提高系统对自然语言文本的理解能力,具体介绍了查询模型中三个抽象层的设计及使用,最后利用聚合函数对查询结果进行合并与评价,使用户最终得到与检索要求内容匹配度较高的文档。  相似文献   

6.
针对传统基于关键字的信息检索系统查全率和查准率都不高的缺点,提出了一种基于语义Web的智能信息检索模型,此模型在语义Web的环境下,利用本体技术,将最初的检索词通过查询扩展模块得到更完善的检索词集,然后利用扩展的检索词集进行检索。将基于关键字匹配的信息检索系统提升为基于本体知识库扩展查询的智能检索系统,从而提高了查全率与查准率,满足了人们对信息检索系统的要求。最后给出了模型的一种实施方案。  相似文献   

7.
分析了网上信息检索的过程及策略,针对信息准率、查全率的要求,提出了一种适合于某个Web站点上信息检索的改进策略,并根据该策略给出了一个网页全文信息检索实例。  相似文献   

8.
随着互联网技术的蓬勃发展,基于Web的信息成指数增长,如何在海量信息中获取自己真正需要的信息成为巨大挑战。因此,基于Web信息检索技术随之孕育产生。详细介绍了基于文本的和基于图像的检索技术,并对几种传统的文本检索模型进行了对比,指出了它们各自研究的焦点。  相似文献   

9.
Internet的普及和发展 ,使互联网中的信息量与日俱增 ,人们普遍采用搜索引擎进行各种信息检索 ,但效率及精确度偏低 .从用户的角度及检索机制上 ,比较客观地分析了目前造成这种现象的原因 ,并从多方面给出了提高信息检索精度的几种策略 .实验结果表明 ,检索效果有一定的提高  相似文献   

10.
赖宏慈 《科技资讯》2010,(19):254-254
在信息"爆炸"的今天,信息增长速度惊人,特别是尖端科学、新兴学科信息增长更快,数量庞大,类型复杂,文种多样,内容交叉重复。为了准确迅速地检索到自所需的信息,用户必须熟练掌握自己专业领域的常用检索工具和检索系统,本文就图书馆信息检索途径作一个简要的分析。  相似文献   

11.
分析了传统检索技术中存在的问题,即基于关键字的检索忽视了关键字本身所包含的语义信息,导致较低的查全率和查准率。将Ontology应用于信息检索系统改善这种状况,提出了基于Ontology的Web信息检索模型,给出了基于此模型的Web信息检索流程。  相似文献   

12.
信息检索管窥   总被引:1,自引:0,他引:1  
针对文献检索的特点,介绍了文献的类型、文献检索的一般原理,并根据工作实践对其具体操作作了较细致的阐述.  相似文献   

13.
提出一种定性地理信息检索方法, 用于地理信息的定性表达、语义匹配、推理和结果排序, 可以避免目前定量地理信息检索中语义信息丢失问题。采用命题逻辑方法综合表达查询和文档中的主题信息和地理语义信息, 将文档与查询的相关性度量分为主题相似度和地理相似度。前者通过命题关键词间加权本体距离获得。后者可进一步分为概念相似度和位置相似度, 分别基于地理本体和空间语义度量。由于信息的表达形式为命题和信息单元, 采用证据理论和模糊逻辑对上述子相关性度量进行统一建模。所提方法可以基于语义检索网页中的定性地理信息, 并对相关文档进行排序。这种检索和排序方法符合人类空间认知, 因此可以有效提高地理信息检索的效率。  相似文献   

14.
介绍了Web2.0的概念和技术特征,阐述了Web2.0信息组织和检索的特点,比较了Web2.0与Web1.0在信息组织和检索方面的差异,分析了Web2.0在应用中存在的问题。  相似文献   

15.
网络的飞速发展使得网络信息检索成为人们迫切的需求。本文对网络信息检索技术进行了介绍、分析和比较,在此基础上,对未来的应用前景进行了展望。  相似文献   

16.
传统信息检索与可视化信息检索之比较   总被引:3,自引:0,他引:3  
阐述了传统信息检索系统的不足及可视化信息检索的优势,探讨了信息检索过程中的信息检索可视化研究问题。  相似文献   

17.
介绍了通用查询类的目标和概览以及辅助类和接口的构建,阐述了SqlQuery类关键方法的实现,提出了使用SqlQuery对象实现查询组件的方法。  相似文献   

18.
WWW的信息检索技术研究   总被引:3,自引:0,他引:3  
介绍了信息检索技术的发展阶段。详细论述了WWW的3种信息检索技术分类目录式(网站级)检索、全文(网页级)检索、基于内容的多媒体检索,指出WWW网络搜索引擎的主要发展趋势。  相似文献   

19.
用户查询与文档之间语义匹配但词法不匹配现象是影响信息检索效果的重要原因之一.鉴于语义检索受限于本体自身的质量,为了降低其对检索效果的影响,通过分析目前语义查询扩展的研究现状,在已有概念相似度计算算法研究基础上进行改进和融合,提出了一种基于本体的信息检索查询扩展方法,并主要对基于本体技术的概念相似度计算算法进行修正,得到了组合向量空间模型QCR(Q,Ci)=∑k=1.….K wk*Sim_Rel(qK,Ci),作为引入查询扩展后的查询结果相关度评价方法.这种方法中,通过建立本体模型并计算本体中概念间的语义相似度来确定扩展查询词,它可以根据用户输入的名称,检索出相关文档并由用户自由设置相似度阈值,并将普通主题检索与语义检索合并,在本体乏力时返回普通检索结果,这在一定程度上弥补了垂直检索系统发展的不足.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号