共查询到18条相似文献,搜索用时 62 毫秒
1.
随着数据挖掘的广泛应用,许多实际的数据挖掘应用需要用过去和当前数据对未来数据状态进行预测,针对这一现状,文中提出基于矩阵的数据流频繁模式预测算法(MFP).MFP算法可预测在下一时间窗口中可能性较大的频繁项集,以满足用户需要.该算法首先将数据转换为0-1矩阵;然后通过矩阵剪裁和位运算更新矩阵,并从中挖掘频繁项集;最后,利用当前窗口数据预测下一时间窗口中可能出现的频繁项集.实验结果表明,MFP算法在不同实验环境下能有效预测频繁项集,该算法是可行的. 相似文献
2.
3.
文章研究和分析了数据流上几种典型的聚类分析算法,分析了这几种算法的优点和不足。研究了现在数据流聚类分析的现状,指出未来发展方向。 相似文献
4.
5.
综合分析了数据流分类算法以及云计算的基本理论,提出了基于Hadoop框架的数据流系综分类算法,算法采用MapReduce并行编程模型对传统基于动态权重系综模型进行改进,以提升算法的分类效率.分析结果表明,该算法在处理快速海量到达的数据流时,其执行效率远高于传统系综算法. 相似文献
6.
文章通过定义环节节点、有向边构建了基于有向图的工作流模型,利用此模型可以直观地、清晰地表达各种业务工作过程,以解决传统工作流模型在过程表达方面的不足,并结合信息系统开发实例进行了设计和实现。 相似文献
7.
数据流预处理主要是在原始观测数据的基础上进行,包括对原始监测到的数据集中的缺失数据进行插补或剔除,是数据流预测过程中一个重要性环节,是数据流应用中必不可少的组成部分.数据流预处理技术可以改进监测数据流的质量,从而有助于提高其后的处理过程的精度和性能. 相似文献
8.
9.
数据流上基于K-median聚类的算法研究 总被引:1,自引:0,他引:1
文章研究和分析了数据流上的K-median聚类算法技术,包括:(1)流模型和K-median问题定义;(2)基于流的K-median聚类基本决策和内在机理;(3)理论上有性能保证的流算法。对于每一特征,这种技术能在没有实际保留任何数据流对象的情形下有效地确定聚类点。它通过一个聚类块的一分为二或相邻聚类块的合二为一来动态地生成聚类点,从而实现上述目标。作为结果,这种技术所确定的聚类点将比其他常规方法更准确。在数据流环境中,这种技术能够在产生高质量聚类结果的同时非常有效地执行。 相似文献
10.
数据流系统以连续查询为特点,连续查询的处理机制能够保证数据处理做到实时处理。但是现有的通用的数据流系统没有对空间数据处理的支持,而基于位置服务显然是一种需要空间数据处理的应用。本文从支持位置服务的后台数据处理出发,提出用基于数据流系统的流数据库来支持基于位置服务的数据处理的思想,并结合当今数据流系统的发展和基于位置的服务的需求,对数据流系统进行空间扩展,提出一种空间数据流系统的模型。 相似文献
11.
目前许多应用领域产生数据流的流速不断地震荡,使得面向数据流的挖掘变得困难.系统采用RCSW来完成数据流抽取,提出了实时度T、关键时点集、数据流处理率的概念,并进一步提出了数据流速度异常检测算法.系统监控、预测数据流速,当数据流速异常减速或增速时,系统智能调节环形缓冲区和数据流处理率来应对异常,为解决数据流处理能力与流速、流量与有限空间之间的矛盾提供解决方案.实验表明数据流速度异常检测算法能够保证数据流的挖掘持续正常实施,最大程度的满足系统的实时性要求. 相似文献
12.
分布式处理是数据流管理中的主流技术,SWAT算法可以有效地减少聚集操作时通信量.提高分布式系统信道的使用率。文章在SWAT算法的基础上,改变不同结点的更新周期,平衡了算法的计算速度和精确度.并且使用国际通用数据集,在斯坦福大学开发的STREAM系统上进行了测试。对于分布式系统.在数据流数据速率变化比较快的情况下,用时少、误差小。 相似文献
13.
基于数据流处理的雷达对抗仿真系统通过模拟雷达和雷达对抗装备各个关键环节和功能模块对信号/数据流的处理过程,建立完整的雷达与雷达对抗装备之间信息流动与处理的动态闭环仿真环境,为研究雷达的抗干扰能力和雷达对抗装备的下扰能力提供了灵活的仿真试验平台。文中提出了基于数据流处理的雷达对抗仿真系统的基本设计思路,并结合实例介绍了部分仿真模型的实现方法。 相似文献
14.
基于信息熵差异性度量的数据流增量集成分类算法 总被引:2,自引:0,他引:2
对分类器之间的差异性进行了研究,提出了一种基于信息熵差异性度量的增量集成分类算法,将信息熵差异性度量方法融入到基分类器选择过程中,通过对训练数据集的基分类结果的信息熵差异度计算,采用循环迭代优化的选择方法,以熵差异性最优化为约束目标,动态调整基分类器个数,实现了分类准确稳定,减少了系统开销。通过实验比对,证明了算法在数据流处理时比其他算法具有更小的开销和较强的适应性。 相似文献
15.
在网络的许多应用中数据是以流的形式存在的,例如网络流、传感器数据,以及网页点击流等,分析和挖掘这类数据,可以发现某中有价值的信息。在此,针对数据流挖掘算法中出现的一些问题(如概念漂移问题),提出了一种自适应模糊决策树的优化算法。该算法对于解决处理数据流概念中的漂移问题有较好的效果。 相似文献
16.
17.
卫星健康状况监测是卫星安全保障的重要基础,而卫星遥测数据又是卫星健康状况分析的唯一数据来源。因此,卫星遥测缺失数据的准确预测是卫星健康分析的重要前瞻性手段。针对极轨卫星多组成系统、多仪器载荷以及多监测指标形成的高维数据特点,该文提出一种基于张量分解的卫星遥测缺失数据预测算法(TFP),以解决当前数据预测方法大多面向低维数据或只能针对特定维度的不足。所提算法将遥测数据中的系统、载荷、指标以及时间等多维因素作为统一的整体进行张量建模,以完整、准确地表达数据的高维特征;其次,通过张量分解计算数据模型的成分特征,通过成分特征可对张量模型进行准确重构,并在重构过程中对缺失数据进行准确预测;最后,提出一种高效的优化算法实现相关的张量计算,并对算法中最优参数设置进行严格的理论推导。实验结果表明,所提算法的预测准确度优于当前大部分预测算法。
相似文献18.
该文针对多属性不确定数据流的频繁模式发现问题,借鉴生物信息学中的模体发现思想,提出了一种基于MEME(Multiple Expectation-maximization for Motif Elicitation)的多属性不确定数据流模体发现算法。该算法根据不确定数据流的特点,设计了基于混合型模型的不确定滑动窗口更新计算方法,改进了SAX(Symbolic Aggregate approXimation)的符号化策略,提出了不同滑动窗口下多属性模体的相似性分析方法。在实验当中,用防空反导情报传感器网络中的一组不确定数据流验证了其功能,通过植入不同数目的模体测试了其发现准确率,并在元组有效概率设置为1的条件下与已有算法进行了比较,结果表明:该算法可以较准确地发现多属性不确定数据流中的频繁模式。 相似文献