首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 78 毫秒
1.
将单个属性按照B精度的均值和方差决定的属性重要性,从大到小依次加入到约简属性中.对重要性相等的属性,再计算划分的B精度来决定加入哪些属性,直到满足约简条件为止.与不用属性重要性的算法相比,计算量较少,提高了计算速度.  相似文献   

2.
目的针对不完备信息系统寻找处理方法。方法利用粗糙集扩充模型限制容差关系,取代经典粗糙集理论中的不可分辨关系,对不完备信息进行处理。结果理论上证明了算法的完备性,并使用UCI机器学习数据库对属性约简算法进行测试。结论所述的属性约简算法,不仅可以处理不完备信息,而且在效率上有所提高。  相似文献   

3.
一种改进的粗糙集属性约简启发式算法   总被引:43,自引:0,他引:43  
提出了一种改进的属性约简启发式算法 ,讨论了启发式信息的构造 .通过两个反例证明了现有的两种属性重要度定义 (基于属性依赖度的定义和基于信息熵的定义 )的不完备性 ,提出了一种加权平均的属性重要度定义 ;在此基础上构造了两种启发式算法 .通过 UCI机器学习数据库中的几个实例验证了此算法的有效性  相似文献   

4.
一种基于聚类的粗糙集连续属性的离散化算法   总被引:4,自引:0,他引:4  
粗糙集理论是一种新的处理不精确、不完全与不相容知识的数学工具。粗糙集理论只能对离散属性进行处理,而不能处理连续属性。中针对这一缺陷,利用连续数值属性有序性的性质和统计方差理论,提出了一种基于聚类的连续属性离散化算法。运用典型数据将本算法与现有方法进行了比较分析,得到了满意的结果。  相似文献   

5.
为提高大数据粗糙集挖掘能力,提出基于信息熵的粗糙集连续属性离散检验算法﹒在云计算环境下进行粗糙集连续属性大数据挖掘,采用特征空间重组方法进行粗糙集连续属性离散数据的模糊特征重构,提取粗糙集连续属性离散数据的信息熵,并得到其分布序列特征;对所提取的信息熵进行聚类分析,采用空间决策树模型,获取离散数据闭繁项关联分析度量;通过数据特征权重的决策树分布特征量化集,得到粗糙集连续属性离散数据空间重组;采用大数据挖掘方法,将离散数据空间重组的信息融合,得到优化的粗糙集和连续属性离散数据检验输出;根据粗糙集连续属性的融合结果,实现离散检验优化﹒仿真结果表明:在迭代次数为400时,收敛程度为0.265%,远远高于其它方法,证明采用该方法进行粗糙集连续属性离散检验的数据聚类性较好﹒  相似文献   

6.
基于粗糙集理论的决策表属性约简算法   总被引:2,自引:1,他引:2  
属性约简是粗糙集理论的一个重要内容,是进行知识获取中的核心问题之一.本文在粗糙集理论的基础上构造了区分图,在区分图上以属性的重要度作为启发信息,快速缩小搜索空间,求解最小属性约简.给出了一个最坏情况下时间复杂度为max(O(|C|^2),O(|C‖U|^2))的快速属性约简算法.该算法统一考虑一致性决策表和不一致性决策表两种情况下的属性约简.  相似文献   

7.
决策树是分类数据挖掘的重要方法.C4.5算法延用了经典ID3算法的基本策略,增加了处理连续属性的方法.在C4.5算法的基础上,讨论了新的基于属性变换的连续属性处理方法.该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度.  相似文献   

8.
结合一致性准则的粗糙集属性约简算法   总被引:1,自引:0,他引:1  
文章从属性选择角度对粗糙集属性约简概念进行扩展,在属性约简综合多重属性选择标准方面做了初步的研究。将属性类内一致性选择标准与粗糙集属性约简结合,以获得抗噪的约简;设计了一种全局最优算法和一种次优filter算法,从分类正确率、最简性及类内类间距离方面对一致性判据JC进行了测试,实验结果显示一致性高的属性约简集优于其他约简集。  相似文献   

9.
决策树是分类数据挖掘的重要方法。C4.5算法延用了经典ID3算法的基本策略,增加了处理连续属性的方法。在C4.5算法的基础上,讨论了新的基于属性变换的连续属性处理方法。该方法基于统计概率信息,依据概率属性的最佳分裂对应分裂连续属性,增加了决策树的分类精度。  相似文献   

10.
为获取连续属性数据集的最小属性子集,提出一种基于模糊粗糙集和人工蜂群算法的约简方法。首先由边缘蕴含算子和t-模给出集合的模糊粗糙近似,以下近似构建模糊粗糙正域,并据此确定决策属性对条件属性集的依赖度,然后通过依赖度和约简率构建能够反映属性集大小和重要性的目标函数,将属性约简问题转化为优化问题,最后以目标函数为迭代准则,利用人工蜂群优化算法完成数据集的属性约简。仿真结果表明:该方法在不降低分类正确率的同时,可以有效降低属性维数。  相似文献   

11.
基于逼近精度的一个粗糙集属性约简算法   总被引:10,自引:0,他引:10       下载免费PDF全文
43(2000)01-0007-04摘要:根据信息表中相对每个条件属性的集合和划分的粗糙逼近精度,给出衡量属性重要性程度的一种准则.在此基础上,提出了信息表属性约简的一个较为简单有效的算法.  相似文献   

12.
用于粗糙集约简的并行算法   总被引:1,自引:0,他引:1  
通过对数据挖掘粗糙集约简算法的研究, 提出一种基于区分能力指数的信息系统数据划分思想. 先将系统按属性区分能力分成若干子表, 再由子表的约简求原系统的约简, 这种思想较好地简化了布尔函数的化简过程. 根据该思想设计了一个属性约简并行算法, 并利用Petri网模拟工具CPN Tools对算法的负载平衡进行了分析, 通过实验与相应的串行算法在时间上进行了对比, 实验结果显示, 该算法对于对象较多的大规模系统具有较高的效率.  相似文献   

13.
一种基于粗糙集理论的连续属性离散化方法   总被引:14,自引:0,他引:14  
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的·  相似文献   

14.
粗集中属性约简的一种启发式遗传算法   总被引:24,自引:1,他引:24  
为了获得决策系统中属性最小相对约简,将信息论角度定义的属性重要性度量作为启发式信息引入遗传算法,提出了一种启发式遗传算法。通过构造一个新的算子来引入启发式信息,使得选择的属性子集的分类能力不变。该算子体现了一种利用启发式信息的局部搜索技术,使得算法既保持整体优化特性,又具有较快的收敛速度。从理论上对算法作了分析,对新算子所能选择属性子集的分类能力不变作了证明。最后的实例表明,该算法能有效地对决策系统进行最大程度的约简。  相似文献   

15.
朱果平 《太原科技》2010,194(3):83-84
在粗糙集理论中,决策表的属性约简是一个非常重要的研究课题。通常人们期望找到最小属性约简,而遗传算法根据个体适应值动态地调整个体的交叉概率和变异概率,提高了遗传算法的寻优能力和收敛速度。  相似文献   

16.
基于Rough Set理论中的不可分辨性原理,给出两个新的定义属性的最大区分值(Maximum Dis-cernibility Value,MDV)和属性冗余度(Attribute Redundancy Rate,ARR)。在数据预处理阶段,属性的MDV数值用于确定关于自组织映射网络SOM输出单元数量的启发式搜索策略;属性冗余度则用于衡量属性约简结果的信息冗余程度,并以此作为优化SOM网络输出层结构的依据。不依赖于领域经验知识,建立了MDV、SOM、ARR的组合算法模型,实现了Rough Set理论中连续属性的自动离散化计算,并明显提高了属性约简的速度。最后,通过项目实例对全过程进行有效验证。  相似文献   

17.
基于属性约简的方法,放弃以往复杂的规则匹配算法,提出将约简后的多种属性组进行析取,筛选特征项,并构造分类器.实验结果表明,此算法不仅简单,还能降低维数和提高分类结果.  相似文献   

18.
在决策表中求取知识时可以进行属性约简,而属性约简中大部分算法都需计算核.文章基于现有的属性约简算法,提出了改进的约简算法.该算法不需要求核,从而节约了时间与空间,使粗糙集在面对大数据时能更好的处理.  相似文献   

19.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号