首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 359 毫秒
1.
搜索引擎网页爬行器的任务是收集网页,而收集能力的好坏直接影响搜索结果.本文提出了维、哈、柯多文种搜索引擎中网页爬行器的结构及其设计方案.  相似文献   

2.
本文以维哈柯汉多语种、多向词典为背景,指出了语言所特有的一些技术难点,这些技术难题包括:如何识别书写方向,如何区分维哈柯字母。针对这些问题,本文给出了相应的解决方案,例如:用XML属性和Unicode区域分析来决定书写方向,计算特殊字母出现的频率并选择用户定义字体。最后通过实验验证我们的方案的可行性。  相似文献   

3.
随着卫星定位技术和移动互联网技术的飞速发展,地理空间数据来源变得更加多源异构.面对海量地理空间数据,如何快速有效地找到目标周围的兴趣点变得异常重要.依据空间k近邻(kNN)查询算法,提高效率的关键在数据索引和数据块存储结构设计,通过引入云计算的MapReduce编程模型,设计了一种面向MapReduce的地理空间数据双层倒排网格索引,利用CircularTrip算法实现了目标点近邻查询计算,最终获得距离目标点最邻近的数据点集.实验结果表明,该索引方法较单层倒排网格索引下的kNN查询效率有明显提高,且数据量越大效率提升越明显,此法适合大规模并行计算.   相似文献   

4.
本文以汉、维、哈、柯等具有多种书写方向的多文种电子词典软件系统开发为背景,针对语种相关的词语书写方向识别,词语的文种识别,提出了相应的解决方案:通过XML的标注属性和字母的Unicode区域从属关系来判断词语的书写方向;通过计算组成词语的各个字母来自不同语言的概率来判断词语的文种,应用结果表明该技术方案具有可行性和有效性.  相似文献   

5.
本文主要是针对网页浏览器在其界面和功能方面的不足,保留了现有Web浏览器所具备的所有功能的基础上,在Windows平台下,设计并开发出基于IE内核的具有维、哈、柯文特色的Web浏览器。主要内容包括了介绍向浏览器中嵌入维、哈、柯文字库及输入法技术,实现网页地址转换和文种转换等功能,在浏览器上实现汉、维、哈、柯四种语言来支持用户的使用需求。  相似文献   

6.
针对目前搜索引擎引擎系统存在的数据量庞大、访问用户高并发性和搜索延迟性的特点,提出了基于云存储的文档索引分类存储模型,并在索引数据分类存储算法实现过程中,采用基于Map/Reduce编程模型的二次索引词权重计算,以降低分类过程中的模糊粒度.通过实验验证基于该存储模型的算法不仅可以提高海量数据索引库的数据处理效率,而且在一定程度上降低了检索系统查询延迟,提高了搜索效率.  相似文献   

7.
由我校物理系信息研究室承担的自冶区1984~1985年重点开发研究项目“维、哈、柯汉、英、多种文字信息IBM微机处理系”统已按期完成,经过几个月的试用和完善,于1986年5月27~28日在自治区计算机领导小组和自治区科委举行的鉴定会上通过了技术鉴定。  相似文献   

8.
分析了基于Windows Mobile平台的维吾尔文产品管理系统,着重研究Windows Mobile的应用开发及维吾尔文的书写特点、手机输入法设计中的难点与不等宽问题.设计实现了具有不同编辑方向的维、汉、英、多语种智能手机的混合输入和屏幕显示.在基于.NET compact Framework的智能设备开发框架下,使用Pocket outlook对象模型,实现了客户的便捷通讯功能.在系统的设计和实现过程中,引入Windows Mobile技术和SQL Server Mobile数据库技术来解决相关数据的存储和处理问题.  相似文献   

9.
本文主要介绍基于规则的维吾尔语、哈萨克语机器翻译的设计与实现过程:(1)根据这两种语言之间的对应关系,构建了其词尾映射库、翻译规则库;(2)对源语言维吾尔语进行形态分析后,根据映射库和翻译规则,初步实现了基于规则的维吾尔语、哈萨克语机器翻译系统.在收集的维哈对齐的语料上做了实验,实验结果BLEU值为0.2,表明本文采取的方法是可行的.  相似文献   

10.
传统的基于网页方式的搜索引擎服务不能很好地满足用户个性化的需求,搜索引擎Web API概念的提出较好的解决了这一问题.本文提出了一种基于SOAP和WSDL标准的搜索引擎Web API的构架模型.该构架模型的接口由五大部分组成,内容涵盖了用户自定义搜索条件的各项参数以及返回结果剥离所需的各项参数.采用SOAP和WSDL标准保证了该接口跨语言、跨平台特性.文章系统地介绍了框架的构造、功能,并对接口方法以及参数定义进行了详细的说明.  相似文献   

11.
中国中文信息研究会少数民族语言文字信息处理专业委员会于1986年9月12日—9月16日在乌鲁木齐市召开了全国第三届少数民族语言文字信息处理学术讨论会。这次会议共收到学术论文三十余篇,技术资料十余篇。内容涉及蒙、哈、朝、藏、彝、柯、锡伯等八种文字信息处理问题,即有基本字符编码、标准化和新开发的各种文字信息处理系统、激光照排系统,又有图书管理、情报检索、民医诊断、事务管理以及机器翻译、语言语音信息号处理基础研究等方面的内容。会议还激请有关专家做了专题报告。  相似文献   

12.
分析了语义服务的结构,提出了一种语义索引库的构建方法.对于每一个注册的服务,抽取出其所有概念,并对每个概念在概念索引库中进行检查,对于不在概率索引库的概念建立索引.对语义服务的输入、输出、前置条件和后置条件分别建立到语义服务的索引,并记录下该语义服务;同时保存该语义服务的其他信息.该索引库免去了查询时进行语义推理的过程,同时由于语义概念均与语义服务相关,避免了大量的无关搜索;另外,由于索引库是采用倒排序索引,极大的减少了搜寻空间.仿真实验表明,该语义索引库的建立极大的提高了语义服务发现的效率.  相似文献   

13.
针对空间数据库的现有索引方法可扩展性差和检索效率低的问题,提出了一种分布式复合时空索引方案MixIndexer,可以满足对大量时空传感器数据的查询需求.首先,本文提出了一种基于Couchbase的分布式时空索引体系结构,该体系结构由全局索引和局部索引组成;其次,结合分布式增强R+(MDR+)树算法,提出全局四叉树索引方法以提高时空数据的检索和查询效率,并设计了一种基于MapReduce的大时空传感器数据批量构造指标并行处理方法;最后,基于Couchbase几种常见的键值结构实现了MixIndexer复合索引.经实验,MixIndexer复合索引方法优于典型空间数据库的索引方法和单个树索引R+(Cache Conscious R+Tree,CCR+)方法,相比较查询耗时分别缩短42%和25%.  相似文献   

14.
为进一步统一与完善维哈柯文各种系统软硬件的键盘布局,在传统键盘标准的基础上,本文经过多次讨论及分析,重新确立了符合GB12510-90标准的新的键盘布局。并且按照这些新规定的原则制定出了新的pc键盘布局及数字键盘布局。此外,还有新出的各种嵌入式软硬件的键盘布局标准。文中给出了这些新制定的键盘布局图,并通过例子进一步验证了其有效性。  相似文献   

15.
分析了目前通用搜索引擎用于组件搜索的局限性,提出一种专用于组件的搜索引擎技术.该技术通过组件分类方法对组件资源进行统一描述,并利用组件库技术能有效的针对组件进行搜索.  相似文献   

16.
大规模RDF数据的高效查询和推理是语义Web研究中关键问题.通过研究RDFS推理规则,结合ORDPATH编码机制,提出了一种新的大规模RDF数据的索引构建方案——S-Index.S-Index的一个显著特点是,通过对RDF数据的查询即可得到RDFS蕴含知识,实现了离线推理.对RDF数据中的ABox和TBox进行区分,通过ORDPATH编码,分别构建TBox中的Class和Property子父关系,以及domain和range关系的语义信息.将构建的语义编码信息持久化到RDF三元组索引中,使得三元组索引承载有语义信息,也即构成语义索引并最终持久化到底层数据库.设计并进行了一系列实验,对比了语义索引与一般索引在存储和查询时的性能.实验结果表明,S-Index语义索引在没有给不支持语义的传统RDF索引增加显著额外负担和开销的情况下,获得了在查询时对推理的有效支持.  相似文献   

17.
提出了VAC(vector approximation clustering)索引方法,该方法针对多维空间中存在的大数据量问题,利用空间类聚类和数据压缩结合的方法,综合了层次索引和顺序扫描的优势,提高了多维空间中的检索速度,对于多维空间中常见的复杂检索方式如NN查询和范围查询提供了较好的支持。分析与实验结果均表明,VAC方法在数据量和空间维数都很高的情况下都取得了令人满意的效果。  相似文献   

18.
地理国情统计分析是深度研究地理国情普查数据的首要前提.针对现有单机集中式数据存储与处理方式存在耗时长、效率低甚至不支持的问题,设计了"格网索引+MapReduce"策略,基于规则格网设计普查数据文件的分块组织与分布式存储方式,研制了格网索引与空间分析相结合的双层过滤机制,构建基于MapReduce的地理国情并行统计算法.最后,与无索引MapReduce、ArcGIS平台进行性能对比测试,结果表明:"格网索引+MapReduce"方法的统计效率远高于ArcGIS平台,对无索引MapReduce方法亦有明显的效率优势,研究拟为地理国情普查数据的高性能、多类型、大批量统计分析提供优选方案.  相似文献   

19.
地表覆盖是地理国情监测的重要对象,为地理国情分析评价模型提供了可靠的数据源.高效的地表覆盖数据检索方法是挖掘地表覆盖数据潜在价值的前提.由于地表覆盖数据体量庞大、更新频繁,要素分布密集且不均匀,传统的空间检索方法出现了扩展困难、检索能力不足等问题.提出了一种基于HBase与静态多级格网索引的地表覆盖数据空间检索方法,针对地表覆盖数据特征设计了基于HBase的静态多级格网索引,利用MapReduce实现索引并行构建,通过多级过滤的方式,提高了地表覆盖空间范围的查询效率.实验表明,该方法能快速完成大规模、密集分布的地表覆盖数据的空间索引构建,提升空间检索性能,并具有良好的扩展性,可为其他海量空间矢量数据的检索提供借鉴.  相似文献   

20.
基于数据挖掘的方法,设计和实现了两种复合聚类的算法,并对图像特征库按此算法建立了索引结构,形成了图像的索引库,通过实验,结果显示聚类方法具有很大的应用潜力.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号