首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
文中主要研究了粗糙集理论在空间数据分类中的应用。在空间数据分类的同时考虑了数据的空间属性和非空间属性,并提出了一种新的基于Rough集理论的决策表离散化算法。由于空间数据对象的属性受其附近的其他空间对象的影响,所以在进行基于空间数据库的数据分类时应该考虑到这种影响。文中首先对空间数据进行预处理,在其属性表中添加空间属性信息,然后使用粗糙集理论处理扩展后的属性表,对其进行数值型数据的离散化、属性表的属性约简和值约简等操作,最终生成分类规则。  相似文献   

2.
基于粗糙集的文本自动分类方法的研究   总被引:4,自引:0,他引:4  
提出一种利用粗糙集理论生成文本分类规则的方法 ,通过将文本关键词的权值进行离散化处理后 ,作为规则的条件属性 ,文本所属的类别用作决策属性 ,构造决策表。然后通过属性约简和规则化简提取出文本的分类规则。该方法生成的规则易于理解 ,分类准确度较高 ,分类速度快。  相似文献   

3.
粗糙集理论作为智能信息处理技术的一个新成果,是对不完整数据进行分析的新方法。毫无疑问,它是除模糊集理论外的又一种最具挑战性的领域,也是现今计算机应用中一个新的,非常重要且发展迅速的研究和应用领域。粗糙集是知识发现、数据约简、决策支持、分类、模式识别和控制等领域中新的,有效数学方法。首先对粗糙集基本概念和理论进行了介绍,给出了基于粗糙集的知识推理方法。然后以一个实际例子讨论如何利用粗集理论从现有学生综合素质数据库中进行知识约简,获取新决策规则,并使之用于对学生的操行评定。  相似文献   

4.
王泽 《通讯世界》2016,(1):225-226
文本分类在数据库和搜索引擎的应用较为广泛,SVM是文本分类算法中的重要算法,适用于多种分类问题,能够解决传统算法中的弊端.本文对支持向量机和支持向量机算法做出具体的介绍,对该算法在文本分类中的应用具体指标进行探讨,旨在为我国的文本分类方式的进步和发展提供理论帮助.  相似文献   

5.
集值决策表拓展了经典决策表,但其现有属性约简算法中属性重要度度量方式单一.针对集值决策表,采用近似条件熵提出属性约简及其启发式约简算法.将近似精度与条件信息熵进行信息融合,定义近似条件熵,证明粒化单调性等性质;提出基于近似条件熵的属性约简,设计启发式约简算法;采用集值决策表实例与数据实验进行有效验证.实验结果表明:与现...  相似文献   

6.
王丁  运海红  张辉 《信息技术》2005,29(3):64-65
利用贝叶斯算法,通过对训练文本的学习,构建了一个文本分类器,从而实现了本文提出的自动分类的目标。贝叶斯分类算法是现在比较流行的方法,它的分类效果比较好,简单而且高效,可以通过大规模的训练语料提高分类的质量。文本的分类是选择最有可能生成该文本的类。只有建立了知识库,分类进行训练,才可以构造相应的分类器,对相关的文本进行分类。  相似文献   

7.
是对消息的一种高度概括,因此,如何有效地对摘要进行快速、准确的识别,是当前中文摘要识别领域的一个重要课题。文章提出TF-IDF和贝叶斯算法相结合的新闻分类方法,通过TF-IDF算法提取短文文本中的特征词集合,捕捉短文文本表达的语义,并计算出相应的TF-IDF值,将TF-IDF值形成特征向量作为贝叶斯算法的输入来实现新闻文本分类,最后根据错误率对预测结果进行评价。试验结果表明,该方法可以将贝叶斯方法与TF-IDF相结合,实现对信息的快速分类。  相似文献   

8.
针对传统高精度分类算法在面对不定因子时,无法确定计算数据信噪度,造成计算精度不佳的问题,提出基于属性约简的粗糙集数据的高精度分类算法。通过对影响粗糙集数据分类精度的各影响因素进行详细分析,对粗糙集数据属性进行约简,抵消对应不定因子以及信噪数据,提高粗糙集数据分类精度。实验结果表明,采用改进分类算法相比传统分类方法,其分类精度及抗噪性均有提高,且其记录结果数据致盲率较低,具有一定优势。  相似文献   

9.
现如今对文本情感分类的方法多种多样,将语义理解与统计学方法相结合的机器学习算法是目前比较可取的方法之一。这种算法的步骤是,首先对文本中的情感词汇进行汇总,作为特征应用,通过统计学方法衡量出这些特征的初始权重,然后通过对文本语义结构进行分析修改特征权重,最后应用以Bayesian作为基本分类算法的Boosting算法对文本最终进行分类。实验结果表明,基于语义理解的Bayesian分类算法的分类准确率远远的高于基于统计学的Bayesian分类算法,这种算法的分类准确率最高可以达到百分之九十。  相似文献   

10.
基于Rough集的信息融合目标识别方法   总被引:2,自引:0,他引:2  
研究了Rough集理论在基于不同谱段光学信息融合的目标识别系统中的应用技术,在介绍了目标知识表示方法的基础上,提出了用C均值算法实现连续信息离散化的方法,并通过决策表属性的约简来生成决策表,以实现对目标的识别。针对可见光、中/长波红外等三种不同谱段下的三种不同目标图像进行了实验,实验结果表明,该方法具有对先验知识获取的易实现性和对目标识别的有效性。  相似文献   

11.
一种基于粗糙集增量式规则学习的问题分类方法研究   总被引:2,自引:0,他引:2  
该文提出一种基于粗糙集增量式规则自动学习来实现问题分类的方法,通过深入提取问句特征并采用决策表形式构建训练语料,利用机器学习的方法自动获取分类规则。与其他方法相比优势在于,用于分类的规则自动生成,并采用粗糙集理论的简约方法获得优化的最小规则集;首次在问题分类中引入增量式学习理念,不但提高了分类精度,而且避免了繁琐的重新训练过程,大大提高了学习速度,并且提高了分类的可扩展性和适应性。对比实验表明,该方法分类精度高,适应性好。在国际TREC2005Q/A实际评测中表现良好。  相似文献   

12.
基于粗集与遗传算法相结合的文本模糊聚类方法   总被引:1,自引:0,他引:1  
该文将粗集与遗传算法相结合的方法成功应用于文本模糊聚类.在聚类过程中,将权重参数的设定也通过编码由遗传算法确定,从而使得权重参数的设定具有科学性和可操作性,避免了在类似算法中确定权重时的主观性和不可靠性.最后的实例说明了算法的可行性.  相似文献   

13.
An Incremental Rule Acquisition Algorithm Based on Rough Set   总被引:3,自引:0,他引:3  
1 Introduction Rough set theory introduced by Pawlak (1982)[1] is avalid mathematical theory developed in recent years, whichhas the ability to deal with imprecise, uncertain, and vagueinformation. It has been used successfully in such field asmedicine, pharmacology, market analysis, engineering,pattern recognition, data mining etc. Pawlak showed that theproblems of machine learning could be explained, analyzedand disposed within the framework of rough set theory[2]. Inhis paper[2], t…  相似文献   

14.
基于粗糙集的过程控制规则挖掘算法及应用   总被引:1,自引:0,他引:1  
在现代工业生产过程中,如何从实际生产过程中提取出有用的规则,用于调整控制生产是过程控制中一个难题。文章提出了一种基于粗糙集的过程控制规则挖掘算法,可以较大的降低计算复杂度,并将算法用于实际烟草制丝生产线的关联规则提取.得到了可用于实际生产过程控制的规则。  相似文献   

15.
基于变精度粗糙集的粗集神经网络   总被引:2,自引:0,他引:2  
本文研究了基于变精度粗糙集模型下的粗集神经网络设计,对近似约简条件进行了弱化推广,同时提出了近似约简的选取原则。在对Brodatz纹理图像的分类实验中,比较了经典粗集神经网络RNN和变精度粗集神经网络VPRNN的性能,VPRNN不仅具有更为精简的结构和更短的训练时间,而且具有更强的近似决策和泛化能力。  相似文献   

16.
为解决粗逻辑神经网络精度与网络规模复杂性和推广泛化能力之间的矛盾,该文提出了一种具有可变离散精度的粗逻辑神经网络设计方法.该方法通过近似域划分,将论域空间划分为确定性区域和可能性区域,由于可能性区域信息粒度过大是造成误分类的重要原因,只需对可能性区域离散区间进一步细化,即可达到提高粗逻辑网络的精度,同时抑制网络规模增长过快的目的.在长白山地区的遥感图像分类实验中,常规方法在离散等级为7时有最好性能,而该文方法以较小的网络代价和训练时间获得了逼近的分类结果.  相似文献   

17.
基于粗集和多Agent技术的分布式数据挖掘   总被引:4,自引:1,他引:3  
在分布式数据库基础上,对各个站点的数据库使用粗集的方法进行挖掘,产生各个站点的规则,将这些规则库组合起来,产生一个全局的规则库,从而可以为管理者提供决策的依据.但是,产生的全局库中往往会有不一致的规则出现,一方面,是由于数据库本身的不一致等原因,导致了规则的不一致;而另一方面,则由于各个站点都追求规则的简洁性,使得直接从全局数据提取的规则不矛盾,在分布式环境下却得到矛盾的规则.对于第一种情况,可以通过现有的增加规则的可信度等方法加以避免;而对于第二种情况,本文提出了三种算法来解决了这个问题,并对这三种算法的效率、得到的一致规则的长度等问题进行详细的分析,说明了算法3是一种高效实用的算法.另外,本文对局部站点的核和全局站点的核的关系进行了研究,并证明了一个定理.  相似文献   

18.
基于粗糙集和遗传算法的知识发现方法   总被引:4,自引:0,他引:4  
粗糙集理论是一种处理不确定和不精确问题的新型数学工具,为数据挖掘提供了一条崭新的途径。提出了结合粗糙集理论和遗传算法的知识发现方法。首先通过粗糙集理论对数据进行预处理,在实现属性约简中采用了遗传算法,以提高搜索效率,然后进行规则提取。以农业病虫害诊断知识发现应用为实例说明了该方法的可行性。  相似文献   

19.
随着Internet的出现,信息过程量已经成为电子商务经营决策人员必须面对的问题。如何才能在大量的可用信息资源中及时发现有用的知识,已经引起了广泛关注。粗集理论在数据挖掘节中的应用,提供了应用处理模糊和不确定知识的数学工具,获取知识、精炼知识和实现知识增值的方法。在粗集基本概念的基础上,探讨了根据粗集理论分析处理信息、提取有用特征的方法,以及通过分析、推理产生最小决策规则的方法。  相似文献   

20.
基于粗集理论的信息熵属性约简算法   总被引:2,自引:0,他引:2  
本文针对粗集属性约简存在的问题,提出了一种信息熵的属性约简算法,算法中引入了信息熵的概念代替粗集约简γ准则作为属性选择的标准,克服了粗集约简γ准则对数据噪声的敏感性和不能表达属性间概率因果关系的缺点,本文通过两个实例表明,当属性间存在确定性关系性算法能够象粗集约简γ准则一样找到表达这些关系的属性集,当属性间是概率因果关系,或确定性关系被数据噪声所掩盖,因而粗集约简γ准则无法使用时,算法能够找到具有确定性关系的属性集,或是具有最小不确定性概率因果关系的属性集。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号