首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 93 毫秒
1.
基于LSI和Rough集的文本分类研究   总被引:2,自引:0,他引:2  
针对传统的基于VSM的文本分类算法未能考虑到VSM中各特征向量间相互影响关系,构成VSM的词条集合并不能完全、准确地反映文本的内容,分类精度不是很理想的问题,提出了一种基于LSI和Rough集的文本分类方法.在构造VSM的过程中引入了LSI理论,将语义关系体现在VSM中,从而减少了向量空间的维数,然后再运用粗糙集理论中规则推理方法,建立文本分类的规则库,对于任意一个未知文本,只需要将其条件属性与规则库中的规则进行相似匹配,即可完成分类.实验表明,该方法在文本分类的精度和效率方面比传统的基于VSM的文本分类方法均有10%以上的提高.  相似文献   

2.
基于Rough集的决策树算法   总被引:1,自引:0,他引:1  
针对基于Rough集的经典分类算法值约简算法等不适合大数据集的问题,提出了基于Rough集的决策树算法。采用一个新的选择属性的测度——属性分类粗糙度作为选择属性的启发式,该测度较Rough中刻画属性相关性的测度正区域等更为全面地刻画了属性分类综合贡献能力,并且比信息增益和信息增益率的计算更为简单。采取了一种新的剪枝方法——预剪枝,即在选择属性计算前基于变精度正区域修正属性对数据的初始划分模式,以更有效地消除噪音数据对选择属性和生成叶节点的影响.采取了一种与决策树算法高度融合的简单有效的检测和处理不相容数据的方法,从而使算法对相容和不相容数据都能进行有效处理。对UCI机器学习数据库中几个数据集的挖掘结果表明,该算法生成的决策树较ID3算法小,与用信息增益率作为启发式的决策树算法生成的决策树规模相当。算法生成所有叶节点均满足给定最小置信度和支持度的决策树或分类规则,并易于利用数据库技术实现,适合大数据集。  相似文献   

3.
针对传统的基于VSM的文本分类算法未能考虑到VSM中各特征向量间相互影响关系,构成VSM的词条集合并不能完全、准确地反映文本的内容,分类精度不是很理想的问题,提出了一种基于LSI和Rough集的文本分类方法.在构造VSM的过程中引入了LSI理论,将语义关系体现在VSM中,从而减少了向量空间的维数,然后再运用粗糙集理论中规则推理方法,建立文本分类的规则库,对于任意一个未知文本,只需要将其条件属性与规则库中的规则进行相似匹配,即可完成分类.实验表明,该方法在文本分类的精度和效率方面比传统的基于VSM的文本分类方法均有10%以上的提高.  相似文献   

4.
基于信息熵的Rough集粗糙性度量新方法   总被引:1,自引:0,他引:1  
基于等价关系和一般二元关系,通过引入Rough集边界熵概念,利用Rough集边界的知识粗糙性和Rough集本身的粗糙度来刻画Rough集粗糙性,为Rough集粗糙性提供了一种更为合理的度量方法,为Rough集中概念的获取和刻画提供了理论依据.  相似文献   

5.
基于等价关系的Rough集模糊化方法   总被引:2,自引:1,他引:1  
提出了一种利用等价关系将Rough集进行模糊化的新方法,给出了等价类集的模糊化和Rough集模糊化的定义、性质,讨论了Rough集的交、并、补集模糊化后的运算性质,并给出了证明.  相似文献   

6.
提出了基于Rough集理论的车牌字符识别方法。该方法根据训练样本的特征向量建立决策表,应用Rough集理论对决策表属性进行约简,从约简后的决策表中获取决策规则,按照规则可信度的大小进行规则的匹配。实验表明该方法有效减少了决策属性的个数,提高了规则的泛化程度,简化了规则匹配算法,在车牌字符识别中取得了较好的识别效果。  相似文献   

7.
基于多元组Rough集的不相容决策   总被引:4,自引:0,他引:4  
Rough集理论是一种具有模糊边界集合理论,它被广泛应用于不相容决策 规则提 文讨论了基于多元组Rough集的不相容决策方法,并给上应的算法,同时 不相容规则的相容度作了分析,该方法比普通Hough集方法更简单、更有效、文中所给出的算法特别适用于具有重复元素且的决策表。  相似文献   

8.
为了有效地从凸序列中约简数据和发现知识,解决Rough集集中的凸序列问题,在深入研究凸序列和Rough集理论的基础上,提出了凸Rough集模型,定义了凸Rough集和凸Rough集糊集,给出了凸Rough集糊集的隶属函数和应用凸Rough集进行数据约简及规则发现的算法,最后分析了一个应用案例,验证了模型的可行性,表明应用凸Rough集模型可以更好地进行数据约减和规则发现。  相似文献   

9.
Rough集和Vague集都是处理不确定、不完备、不准确信息的强大工具。Rough集研究主要针对于对象之间不可分辨的性质,Vague集研究主要针对对象边界的模糊程度。经过分析代数观的Rough集理论和信息观的Rough集理论与Vague集之间的关系,发现信息观的Rough集可以认为是一种特殊的Vague集;而代数观的Rough集与Vague集则是相互独立的,但是两者也有联系。在这2种理论下,信息的不确定性都是由元素部分属于集合而表现出来的,但是这2种理论对不精确信息的处理方法则不同。  相似文献   

10.
在理论与实证分析相结合的基础上,提出基于Rough集的指标体系选择的分析方法,实践证明,Rough理论体系是一种新型的处理不完整性和不确定性问题的数学工具。对于指标的选取同样有效,通过研究以期在理论和实例验证中对指标体系的构建工作能有所帮助。  相似文献   

11.
粗糙集与模糊集的比较研究   总被引:1,自引:0,他引:1  
近来许多研究致力于不确定性问题的知识获取,不确定产生于许多方面:它可以来自于对事物进行描述的术语的模棱两可;也可以来自描述过程中对规则的怀疑;或者数据的错误、丢失.处理不确定性问题的理论有很多,粗糙集与模糊集都是有效手段,它们有联系有区别,可以相互补充有机结合起来解决更多问题.  相似文献   

12.
主要叙述在等价关系、一般关系和概率论中的粗糙集模型,给出它们的定义、性质、各自的几种定义类型和它们之间的联系以及若干例子.  相似文献   

13.
基于R0ugh Set的任务复杂度与协同模型研究   总被引:2,自引:0,他引:2  
基于Rough Set(RS)理论,在知识的层次上,给出了相关任务的知识表达以及任务复杂度的概念。针对多Agent系统,提出了衡量Agent基于知识水平的能力,协同的冗余度等方法。运用粗糙度,信息熵和知识这三个指标,讨论了协同的可能条件以及必然条件。对于协同满足可能条件而不满足必然条件的情况下,提出了进行学习的最小知识集的概念。在此基础上,给出了相关任务T的静态协同模型与算法。最后,指出了有待解决的问题。  相似文献   

14.
基于覆盖的程度粗糙集模型   总被引:1,自引:0,他引:1  
在基于覆盖的粗糙集模型的基础上,引入分类误差,建立了基于覆盖的程度粗糙集模型,并讨论了该模型的一些相关性质.  相似文献   

15.
粗糙集理论是一种新的处理模糊和不精确问题的重要数学工具,是一种新的数据挖掘技术。本文主要研究基于粗糙集的数据挖掘的算法在规则提取阶段的应用。  相似文献   

16.
基于包含度的粗糙集模型   总被引:1,自引:0,他引:1  
提出了包含度近似空间的概念,得到了基于包含度的粗糙集模型,从而为知识获取提供了一个新的不确定性方法。  相似文献   

17.
首先定义了各论域上的支撑函数;其次通过支撑函数分别给出了不同论域一般多粒度模糊下上近似算子的定义,建立了双论域的一般多粒度模糊粗糙集模型;此外,还讨论了各近似算子的性质.  相似文献   

18.
一种基于粗糙集的知识约简方法   总被引:1,自引:0,他引:1  
最佳知识约简问题是信息系统与知识发现中面临的一个重要问题.提出了基于粗糙集的理论对信息系统生成的差别矩阵进行约简的方法.该方法先对连接差别矩阵进行一致化处理,然后再将差别矩阵进行约简,最后在约简后的矩阵中作最佳知识约简.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号