首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 46 毫秒
1.
针对现有大数据分类算法中存在准确率低的问题,本文提出一种基于差异灰狼优化决策树的大数据分类方法.该方法首先将复杂的大数据输入M ap-Reduce框架中,采用主成分分析法对输入数据进行降维;然后利用支持向量机对压缩后的数据进行粗略分类;最后采用基于差异灰狼优化的决策树对支持向量机输出的类标签进行精细分类,获得更高的分类...  相似文献   

2.
利用决策树发掘分类规则的算法研究   总被引:15,自引:4,他引:15  
主要介绍决策树方法,回顾利用决策树发掘分类规则的各种方法,并对算法进行评价,最后提出了一个利用决策树分类技术进行月降雨预报的算法。  相似文献   

3.
不完备信息系统也有很多有用信息,可以得出支持决策的确定规则。基于决策树的完备信息系统规则提取方法很多,如比较有影响的ID3算法等,但是在不完备信息系统中应用决策树进行规则提取的方法还不是很多。本文提出用多变量决策树方法对不完备信息系统进行规则提取的方法,可以得出部分确定信息,方法简单易行。  相似文献   

4.
基于粗糙集理论的分类规则发现   总被引:25,自引:0,他引:25  
研究了利用粗糙集理论中核的概念,求取信息系统的最小简化策略,给出了从数据库中发现分类规则的方法。  相似文献   

5.
近似集动态更新方法的性能评测与规则获取   总被引:1,自引:1,他引:0  
对属性集变化时特性关系下粗糙集扩展模型中近似集动态更新的方法进行性能测试,验证了该方法的有效性和适用性;并依此方法设计了一个伪增量规则提取的系统,可以直接用来为决策服务.  相似文献   

6.
类别不平衡数据的分类问题是数据挖掘及机器学习过程中的一个研究热点,基于代价敏感学习方法通常用于解决类别不平衡数据分类问题,然而,它在实际应用过程中通常因样本的误分类成本未知而受到限制.针对此问题,文中采用群体智能算法优化样本的误分类代价.果蝇优化算法(Fruit fly optimization algorithm,F...  相似文献   

7.
提出一种改进随机子空间与C4.5决策树算法相结合的分类算法.以C4.5算法构建决策树作为集成学习的基分类器,每次迭代初始,将SMOTE采样技术与随机子空间方法相结合,生成在特征空间和数据分布上差异明显的合成样例,为基分类器提供多样化的平衡训练数据集,采用绝大多数投票方法进行最终决策的融合输出.实验结果表明,该方法对少数类和多数类均具有较高的识别率.  相似文献   

8.
9.
从信息系统发展的角度综述了知识发现及知识发现过程中数据的方法和应用。  相似文献   

10.
不平衡数据分类是机器学习的研究热点之一。传统的机器学习分类算法通常假定用于训练的数据集是平衡的,不能直接应用于不平衡数据分类。利用朴素贝叶斯和决策树对数据不平衡的敏感度不同,提出一种基于投票的不平衡数据分类集成算法。基分类器选择NB和C4.5,通过投票平均方法进行分类决策;并选择公开的不平衡数据集进行实验验证。实验结果表明,该算法能有效提高不平衡数据的分类性能,特别是对正类(少数类)的误报率较低,具有良好的鲁棒性。  相似文献   

11.
一种基于概念层次的分类规则挖掘算法研究   总被引:6,自引:1,他引:6  
从概念层次的角度,提出了一种新的基本概念层次的分类规则挖掘算法,并阐述了相关概念及属性归纳技术与相关性分析方法,以城市人口与收入信息数据库和测试数据,给出了该算法的试验结果,研究结果表明,本算法生成的决策树大小适合,具有高的分类规则挖掘效率。  相似文献   

12.
面向知识发现的数据分类技术在网络教学中的应用研究   总被引:2,自引:0,他引:2  
提出将数据挖掘技术应用于网络教学平台的设计,采用决策树分类方法从学习者的大量信息中分析学习者的学习能力,构建学习者特征模型,提高网络教学对不同学习者个体的针对性,为实施个性化教学提供决策支持.  相似文献   

13.
论文以决策树分类算法为主要研究对象,应用分类技术对高校人力资源数据源中的信息进行分析,给出了一种新的定量的人才识别方法,开发了分类与决策树算法人才识别系统模块,利用过去已有的引进人才的经验数据分析提取规则,为以后的人才识别提供合理的、科学的决策支持。  相似文献   

14.
分类是把数据项映射到其中一个事先定义的类中的这样一个学习函数的过程.文章介绍分类数据挖掘的定义、分类的过程以及算法的分类,论述数据分类的常用技术,对分类的应用和分类算法的发展方向进行了展望.  相似文献   

15.
分类是数据挖掘中的一个重要问题.概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述.在量化的相对约简格基础上,提出一种新的分类规则发现算法,该算法的生成结果剔除了冗余的分类规则,算法在时间性能、空间性能等方面均有较大的提高.  相似文献   

16.
在介绍数据挖掘、分类算法有关概念的基础上,介绍了决策树的具体生成算法.为了减少数据量,改进决策树算法实现时的数据结构,详细描述了基于SPRINT(scalable paraUehzable induction of decision trees)分类算法的实现,给出了SPRINT算法的性能评估。  相似文献   

17.
利用决策树算法对银行的信用卡客户进行分类,构建了客户分类模型,给出了分类步骤中信用卡的客户类型特征,为银行的信用卡推广业务提供相应策略.  相似文献   

18.
在数据流分类学习过程中,类不平衡和概念漂移是两大挑战问题.在分析传统特征选择算法和代价敏感学习方法的基础上,将代价敏感学习算法的思想引入特征选择算法中,设计并实现了一种基于代价敏感的Relief F剪枝的数据流分类算法,不仅能删除冗余的特征,而且适应动态变化的数据流环境.与经典的算法进行分析比较,结果表明所提算法可显著提升分类效果.  相似文献   

19.
中医药领域不完整的数据普遍存在,而数据的不完整很大程度地降低分类模型的学习效果。大多数已有的处理不完整数据的分类算法只关注在其学习阶段处理不完整数据,而对于不完整数据出现在分类阶段则不能处理或效果不好。文章提出一种新的分类算法用于处理不完整数据的分类问题。首先给出一个新的用于处理不完整数据的决策树算法,并针对传统的Boosting算法在迭代过程中使用确定性决策方法而没有充分考虑到数据集中的不完整数据,进一步提出改进的Boosting算法,在迭代过程中对每一个假设使用模糊决策方法,权重的更新机制是增加错误分类样本的权重和减少正确分类样本的权重,最终使用加权投票的方式得出最优的分类结果。最后,通过两组实验证明提出的算法策略在处理不完整数据问题时的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号