排序方式: 共有28条查询结果,搜索用时 93 毫秒
1.
基于nested-loop的大数据集快速离群点检测算法 总被引:1,自引:0,他引:1
针对已有的多数离群点检测算法存在扩展性差,不能有效应用于大数据集的问题,在已有的基于距离的离群点检测算法的基础上,设计模信息表存储结构,利用向量内积不等式关系以及合理的存储分配和调度策略,提出一种高效离群点检测算法DBoda.该算法通过在预处理中存储每个点的模信息,减少点间距离的计算量,并对嵌套循环方法进行优化,进一步减少I/O的开销.理论分析和试验结果表明,所提算法具有时间消耗小和适用于处理大数据集的特点,可以有效地解决离群点检测中的算法时间复杂性和算法扩展性问题. 相似文献
2.
孙志挥 《东南大学学报(自然科学版)》1980,(3)
DSK—1系统绘图软件对源程序进行信息处理,生成积分机数据代码。本文叙述了该系统绘图语言的定史、结构及其实现,并给出了程序图形的实例。 相似文献
3.
针对现有k-匿名隐私保护方法的缺点,提出了3种基于敏感元组的隐私数据发布方法.首先,通过定义敏感元组,设计了只保护隐私信息的朴素敏感元组匿名方法(NSTAM).然后,在引入敏感元组密度的基础上,提出了一种扩展的敏感元组保护方法(e-STAM);该方法通过对敏感元组进行mk-匿名运算,引入(1-m)k个非敏感元组,并同等概化引入的非敏感元组,使得匿名后每个分组中的敏感元组密度满足用户设定的阈值m.最后,针对实际应用中发布数据的敏感度差异,引入了加权敏感元组密度概念,并设计了加权的敏感元组数据保护方法(WSTAM);该方法通过对敏感值和敏感元组赋予不同的权重,实现对敏感元组的区别保护.理论分析和实验结果表明,这3种算法能够提高发布数据的精度,保证敏感数据的安全度,因此是有效可行的. 相似文献
4.
改进的差别矩阵及其求核方法 总被引:48,自引:0,他引:48
粗糙集方法提供了一种新的处理不精确、不完全与不相容知识的数学工具.属性约简是粗糙集理论的重要研究内容之一,而现有的很多属性约简算法都是从信息系统(或决策表)的核开始.针对HU利用差别矩阵求解粗糙集中的核方法的错误,叶东毅提出了新的差别矩阵及其求核方法,但计算代价高.为此,给出了改进的差别矩阵定义和求核方法,该方法纠正HU方法的错误,且可有效地降低计算代价. 相似文献
5.
从网络数据传输量和响应时间这两个性能因素出发,分析了联邦数据库管理系统原型系统SU-FDBS的运行性能,给出代价分析模型和数据测试的结论。 相似文献
6.
在处理不确定信息的概率关系模型PRM(Probabilistic Relational Model)的基础上,为了弱化关系中元组间互斥的约束条件,从事件发生条件概率和谓词的角度出发,进一步论述了概率关系数据库模式的语义、定义及相关操作,给出了更为合理的概率型数据库结构的形式化描述,并对关键字的定义、性质以及概率数据库更新、查询等应用方面做了深入研究。 相似文献
7.
基于Rough Set的缺省加权规则挖掘算法 总被引:8,自引:0,他引:8
本文在引入规则加权支持度概念后,提出了一种基于Rough Set的缺省加权规则挖掘算法-MDWRBR算法,实验结果表明,该算法能有效地过滤噪声,提高规则的挖掘效率。 相似文献
8.
一种基于分布式数据库的全局频繁项目集更新算法 总被引:4,自引:0,他引:4
在算法FMAGF的基础上,提出了一种基于分布式数据库的全局频繁项目集更新算法-UAGFI,该算法主要考虑最小支持度发生变化时全局频繁项目集的更新情况。UAGFI在最坏的情况下仅须扫描各局部数据库一遍,并利用已挖掘的结果,可避免传送某些原全局频繁项目对应的条件频繁模式树,从而降低网络通讯代价,实验结果表明,UAGFI算法是有效可行的。 相似文献
9.
实时电子签名是CIPS实现所需解决主要问题之一,其正确性直接关系到系统的安全性及业务流程的正确走向。本文根据CIPS实时电子签名的特点及需求提出一种安全、有效的实时电子签名实现技术。 相似文献
10.
数据挖掘技术及其应用 总被引:26,自引:0,他引:26
数据挖掘是数据库研究中一个很有应用价值的课题,它融合了数据库、人工智能、机器学习等多个领域的理论和技术,本文介绍数据挖掘系统的体系结构、数据挖掘的方法及应用。 相似文献