首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 62 毫秒
1.
一种基于聚类的粗糙集连续属性的离散化算法   总被引:4,自引:0,他引:4  
粗糙集理论是一种新的处理不精确、不完全与不相容知识的数学工具。粗糙集理论只能对离散属性进行处理,而不能处理连续属性。中针对这一缺陷,利用连续数值属性有序性的性质和统计方差理论,提出了一种基于聚类的连续属性离散化算法。运用典型数据将本算法与现有方法进行了比较分析,得到了满意的结果。  相似文献   

2.
基于SOM网络的上市公司聚类分析   总被引:1,自引:0,他引:1  
针对现有上市公司聚类模型(如传统的统计方法和近年来出现的模糊模型)实际聚类效果并不理想的问题,引入了自组织特征映射神经网络方法,为了说明该方法的可应用性,建立了上市公司聚类指标体系,并在实际数据样本的基础上,利用自组织特征映射神经网络方法对上市公司进行了分类评价.通过对其结果进行分析,证实了该方法能有效地解决这一问题.  相似文献   

3.
文中给出了基于属性值出现的频率的连续属性离散化的一种方法。在离散化问题描述的基础上,利用属性值出现的频率确定频数候选断点,再利用边缘断点算法进一步减少断点数目,达到离散化目的。该方法提高了决策属性关于条件属性的支持度,提高了属性约简的满意度。  相似文献   

4.
一种基于粗糙集理论的连续属性离散化方法   总被引:14,自引:0,他引:14  
基于粗糙集的有关理论,提出了一种新的连续属性离散化方法·首先说明决策属性支持度的概念,再利用决策属性支持度作为反馈信息,提出一种领域独立的基于决策属性支持度的连续属性离散化算法·该算法能在保证决策表原始分类能力不变的前提下,提高约简效率·同时,各个属性拥有较少的分割区间,会使规则集合更加简洁·通过实例分析比较,说明该算法是非常有效的·  相似文献   

5.
本文探讨了基于属性重要性、基于信息熵、基于遗传算法和基于聚类的离散化算法,通过分析总结了各算法的优点及不足,并提出有待解决的问题.  相似文献   

6.
连续属性离散化是粗糙集应用研究的重点内容之一.基于条件熵可以反应属性依赖度的性质,将决策属性对条件属性的条件熵作为离散化标准,提出了一种粗糙集连续属性离散化方法,并通过实例证明了该方法的正确性.  相似文献   

7.
杜茜  杜晓 《科技信息》2007,(27):61-61,63
约简是粗集理论的重要概念,由定义计算约简是一个典型的NP问题且由于约简的不唯一,往往最后获得的属性集并非是最好的属性。本文针对Rought set理论的属性约简进行了研究。研究了通过可辨识矩阵求得属性约简集,利用Rought set与灰色理论相结合,提出一种属性约简的启发式算法。实验证明可以获得约简集合中最有利的属性。  相似文献   

8.
讨论模糊C均值聚类算法在决策表条件属性对决策属性的相容程度的指导下对粗集理论中的连续属性进行离散化的一种新算法。该算法充分考虑属性之间的相关性,将所有连续属性转化为矩阵同时处理,能明显提高传统动态层次聚类算法离散化过程的速度。算法测试结果表明,新算法能较好地保留有效属性,提高离散化精度。  相似文献   

9.
为在应用粗糙集理论处理数据时,对连续属性进行离散化预处理,采用k均值算法对连续属性进行离散化的方法,将属性无监督聚类成两类.通过在UCI数据库上选取的4组数据进行实验,首先离散化,再通过粗糙集约简,最后使用k NN(k=10)分类器,并和其他两种离散化方法进行对比.研究结果表明:该方法能够提高离散化的效率,降低实验的复杂度,并有效减少断点数.  相似文献   

10.
数据集的质量会极大地影响分类算法的精度,针对一类隐式互斥的数值型数据提出了一致性分类方法.借鉴连续函数的思想,提出了数值型连续数据的分类一致性定义;改进了SOM算法的计算过程,使其满足文中提出的分类一致性最优条件.通过改进的SOM方法得到一个新的聚类数据集,减少了原始数据集中容易出现的隐式分类不一致性问题,从而有效地提高了分类方法的效率和分类精度.通过在一个实际的数据集上的比较,表明提出的算法的预测精度明显优于其他算法.进而还从VC维的角度分析了提出算法的优点.  相似文献   

11.
结合高压输电线路远程监测系统,在参考粗糙集理论的基础上,结合粗糙熵相关知识,针对复杂系统故障影响因子的特点,提出了一种属性约简算法,最后得出相应的算法规则,解决了复杂信息数据简化的问题。实例证明,该算法是可行的。  相似文献   

12.
提出和探讨了一种新的基于模糊粗糙集和断点简约化的离散化方法.综合考虑到规则的支持度和可信度及其关系,应用属性离散指标作为离散化的标准,证明了该指标可以作为离散化彻底的充分条件.并且在时间复杂度和空间复杂度方面分析了算法的有效性,与同类算法比较可以发现该算法在基本不损失分类信息的基础上有效降低这两方面的复杂度,能有效地避免以往各种算法中出现的弊端.最后将其应用于电网故障诊断中,通过具体算例测试,证明该算法的有效性和实用性.  相似文献   

13.
一种改进的粗糙集属性约简启发式算法   总被引:43,自引:0,他引:43  
提出了一种改进的属性约简启发式算法 ,讨论了启发式信息的构造 .通过两个反例证明了现有的两种属性重要度定义 (基于属性依赖度的定义和基于信息熵的定义 )的不完备性 ,提出了一种加权平均的属性重要度定义 ;在此基础上构造了两种启发式算法 .通过 UCI机器学习数据库中的几个实例验证了此算法的有效性  相似文献   

14.
基于粗集理论的数据离散化新算法   总被引:20,自引:0,他引:20       下载免费PDF全文
连续属性值的离散化一直是机器学习领域中殛待解决的关键问题之一,他对于提高后继学习算法的运行速度、降低算法的实际空间要求和时间消耗、提高学习结果的聚类能力等都具有极其重要的意义。本文首先分析了基于粗集模型的数据离散化方法的特点和基本思路,研究了候选断点重要性的衡量方式,在此基础上提出两种新的从候选集合中最终确定离散化断点的启发式算法。这两种算法考虑并体现了粗集理论的基本特点和优点,选择的断点都能够保证信息系统的分辨关系,并能够取得较理想的离散化结果。  相似文献   

15.
基于启发式信息熵的粗集数值属性离散化算法   总被引:1,自引:0,他引:1  
在一致性假设前提下,以数据集的统计性质作为启发式知识,从候选离散点集中选择离散点,根据数据集的期望值和方差来确定搜索最优离散点的区域,提出一种新的基于信息熵粗集数值属性离散化算法,并采用UCI国际标准数据集来验证新算法.新算法与已报道的算法所得到的离散断点集完全一致,决策表的离散化结果也相同,但时间代价不同,新算法比其计算效率提高40%~50%.  相似文献   

16.
为了解决目前航材订货模型单纯依托人为经验,对航材消耗规律变化反应滞后且可信度不高工作量过大的问题,提出在原始订货模型的框架下,使用PAM聚类、粗糙集全局离散和粒子群算法,计算模型中的航材分类、属性离散和区间权重,从而建立启发式航材订货模型,并在测试集上对比新老模型的均方离差。结果表明,启发式航材订货模型可以使人摆脱依靠经验确定模型的繁琐工作,并且能有效提高模型的准确性和及时性,从而提高航材订货工作效率。  相似文献   

17.
胡国定教授基于“概念的内涵与外延的反比例关系律”这种思想,给出了一种信息度量方法。本文以粗糙集理论为基础,利用胡教授提出的这种信息度量,讨论了决策表属性约简和信息量之间的关系,证明了对于相容决策表,其属性约简在代数表示和此种方法给出的信息表示下的等价性。并举例说明对于不相容决策表,其属性约简不能用信息量来等价表示。  相似文献   

18.
提出一种基于分类目标的启发式离散化算法, 通过该算法能够解决粗糙集理论中的连续属性离散化问题. 该算法充分考虑目标分类和属性的重要性, 在减少决策规则的同时完成了属性约简. 通过茶味觉信号的验证及与传统算法结果的比较, 验证了所给算法的有效性.  相似文献   

19.
朱果平 《太原科技》2010,194(3):83-84
在粗糙集理论中,决策表的属性约简是一个非常重要的研究课题。通常人们期望找到最小属性约简,而遗传算法根据个体适应值动态地调整个体的交叉概率和变异概率,提高了遗传算法的寻优能力和收敛速度。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号