排序方式: 共有15条查询结果,搜索用时 31 毫秒
1.
大规模中文搜索引擎的用户日志分析 总被引:14,自引:1,他引:13
北大"天网"是一个大规模分布式搜索引擎系统.文中对其用户日志进行了分析和研究.结果显示用户对系统的访问时间并不均等,一天中早晨、下午和晚上各出现一个波峰;通常用户在一天内只进行1~2次内容不同的查询,多于2/3的用户点击了结果页面中的某些网址(URL);多数用户输入的查询串中只含有一个词项并且包含中文字符,其中以2~4个汉字居多;用户查看结果页面的时间大约是2~3 min;只有少数用户查看历史网页(或称网页快照).用户日志中不同查询串、不同用户和点击不同URL的数量满足Heaps定律. 相似文献
2.
针对毁伤试验数据少、不均匀、不连续、范围窄等带来的计算精度不高的问题。研究通过数据挖掘技术进行毁伤效应计算。利用数据库管理毁伤数据,通过数据清洗技术识别并清除数据异常点,以保证数据库中数据的质量。建立了算法评价方法以选择最优经验算法。通过特征选择对高维毁伤数据进行降维,确定毁伤效应的主要控制参数进行神经网络学习和k-近邻检索。在此基础上建立基于数据融合的“三阶段”毁伤效应计算模型,可依据试验数据、经验算法和神经网络模型进行毁伤效应计算。实际应用表明,所提出的计算方法,能够满足实际应用需求。 相似文献
3.
为提高系统实时性,缩短中断响应时间,提出了一种基于映像寄存器的操作系统内核实现方案。在分析实时操作系统中中断处理过程基础上,总结了影响系统中断响应时间的因素,给出了利用映像寄存器提高中断响应效率的方法。该方法利用处理器中提供的映像寄存器,将内核运行于映像寄存器上,用户进程运行在通用寄存器上,这样对于内核空间发生的中断可以免去保存上下文的开销。该方案成功用于CK520处理器平台上的μCOS-II实时操作系统中。实验结果表明,提出的实时操作系统设计方案在每个中断处理程序中可以平均减少执行54.97条指令。 相似文献
4.
微分几何定理证明中最简单辅助条件的计算 总被引:1,自引:0,他引:1
在微分几何定理证明中,一个定理成立的辅助条件(非退化条件)不是惟一的,但越简单越好。对预先确定的标准如变元个数最少、导数算子阶数最低等,利用根微分理想分解的Rosenfeld—Groebner算法,给出了微分几何定理机器证明中最简单辅助条件的构造性算法。 相似文献
5.
一种词汇共现算法及共现词对检索系统排序的影响 总被引:6,自引:0,他引:6
为了探讨共现词对检索系统排序相关性的影响,提出一种新的共现词汇算法--FDC.算法中考虑了词汇在文档中的共现频度、相对距离和共文档率.从天网搜索引擎查询日志中选取部分查询词,用本算法和潜在语义索引(LSI)方法分别求其共现词汇,并以相同的评分策略改变原始排序结果.Discounted cumulative gain(DCG)评估结果表明,本算法获得的共现词在99%的置信度下对原始排序的相关性有改进;而LSI方法获得的共现词对排序相关性也表现出同样显著的改进效果.结果显示共现词汇能改进检索系统结果排序的相关性,并且不依赖于特定算法. 相似文献
6.
基于海量数据可视化分析方法,对云计算的出现背景和发展历史进行计量分析。首先确定一批云计算研究领域核心作者,基于这一作者群近十余年来发表文献的题录数据,构建云计算核心作者群的研究共词网络。引入社群结构抽样算法和G-N聚类算法,对领域研究总体分布情况进行分析。引入概念团队隶属度算法,对重点学科团队研究特色进行比较分析。从时间维度分析云计算核心作者群进入该领域前后研究兴趣点的迁移轨迹,并对国内云计算领域演化发展的基本阶段进行划分。 相似文献
7.
根据柱状钻孔和多孔剖面的地质数据特点,提出了一种具有矢量几何拓扑性的基本数据结构,并将知识推理技术引入地质剖面建模算法,从而实现了用户对剖面建模算法和剖面图形的智能决策,解决了传统的地质剖面建模系统由于无法融入可供决策的专家知识和经验而产生的准确性和实用性不高的问题,同时给出了系统实现以及分土层工程量计算的实例. 相似文献
8.
要保证工程的探查质量,应根据实地管线特点,进行适当的管线归类,选用相应的探测方法,并加强实地对比验证。从而为保质、保量完成地下管线普查工程提供有力的理论依据。 相似文献
9.
判定拟代数簇的包含关系问题不能由计算其相应的饱和理想来确定 .利用一阶逻辑等价公式 ,将拟代数簇的包含关系问题化为检验另一个拟代数簇是否为空的问题 ,之后用 Grobner基方法加以判定 .文中给出了判定算法和计算实例 相似文献
10.
利用支持向量回归确定相关Web查询 总被引:1,自引:0,他引:1
对用户输入的查询请求,如果搜索引擎系统能给出一个相关查询列表,将有助于用户进行查询修正,进而检索到用户所需要的信息.文中提出了一种利用支持向量回归确定相关Web查询的新方法.对一个给定的Web查询,首先从用户的使用记录中抽取候选查询的5个量化指标:被查询的次数、被查询的用户量、用户在反馈结果中的点击次数、与给定查询间的共有词项个数和点击相同网址(URL)的个数;然后用手工标记部分训练数据,进而建立支持向量回归模型,根据相关度的大小确定相关Web查询.实验结果表明该方法具有较高的准确度. 相似文献