首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
基于关联规则的中文文本分类算法的改进   总被引:4,自引:1,他引:4  
随着中文电子刊物和Web文档数量的飞速增加,中文文本自动分类工作变得日益重要.将文档视为事务,将关键词视为项,文本预处理时提出特征权重阈值,用构造的分类器对未知文档分类时,采用了CDD(Class Differen-tiate Degree)改进算法,对基于关联规则挖掘的中文文本自动分类方法进行了改进.实验结果表明,该算法能较快地获得可理解的规则并且具有较好的宏平均和微平均值.  相似文献   

2.
针对关联分类算法产生的规则普遍存在分类器分类精度、效率低的问题,提出了一种提取有效规则的关联分类算法--ACDER算法.首先定义了剩余支持度和剩余置信度,然后通过计算规则剩余支持度和剩余置信度建立了分类器并进行剪枝,以达成对分类尽量少且最有效的规则构成分类器,确保分类器中不存在任何冗余规则和冲突规则.在8个数据集上的测试结果表明,所提算法的平均分类精度比关联规则算法提高了4.15%,而在所有数据源分类器上的规则数却减少了54%.  相似文献   

3.
提出了一种快速基于约束的医疗图像关联分类算法(CBCPFP-growth算法).算法利用扩展项集表征约束,通过加入最大支持度和项出现位置的约束,并利用最小支持度、最小置信度、关联规则数量的约束有效地在算法执行之初和算法执行过程中删除了冗余模式和规则,通过将频繁项集进行划分并在多个处理器上独立执行,充分利用多处理器协同工作的处理能力,使算法具有并行和分布处理的可扩展性.算法在满足医疗图像领域高精确度,高稳定性要求的同时提高了算法运行效率和医疗图像分类的有效性.  相似文献   

4.
杨剑  刘玉梅 《应用科技》2009,36(1):39-42
车载Adhoc网络已经成为受人关注的课题,但在现有的地理路由协议中,位置定位错误对协议的性能会造成很大影响。该文首先对GPSR协议进行了仿真,并通过仿真对位置定位错误影响的协议性能进行了分析,发现即使10%的错误率也会对GPSR协议性能造成很大影响。最后对GPSR协议的平面图算法提出了一种改进,使GPSR协议在定位错误的情况下性能有所提升。  相似文献   

5.
为了解决基于Apriori的分类关联规则算法挖掘数值型数据时效率和准确率偏低的问题,提出基于定量关联规则树的分类及回归预测算法。采用改进的定量关联规则算法挖掘数值型数据生成关联规则库,并基于关联规则树结构实现分类及回归预测。研究结果表明:改进的Apriori定量关联规则挖掘算法提高了分类预测的准确率并降低了计算复杂度;而采用关联规则树结构可使分类与回归预测时间明显加快,提高了样本匹配学习的速度。  相似文献   

6.
挖掘重要项集的关联文本分类   总被引:1,自引:0,他引:1  
针对在关联规则分类算法的构造分类器阶段中只考虑特征词是否存在,忽略了文本特征权重的问题,基于关联规则的文本分类方法(ARC-BC)的基础上提出一种可以提高关联文本分类准确率的ISARC(ItemSet Significance-based ARC)算法.该算法利用特征项权重定义了k-项集重要度,通过挖掘重要项集来产生关...  相似文献   

7.
8.
为提高分类精度,通过距离测度学习可以得到样本在新的特征空间里新的表示.针对马氏距离未考虑不同类别样本维度间相关性存在差异这一缺陷,提出了一种新的有监督的距离测度学习算法,即独立-差别分量分析方法(Independent Discrimi-Native Component Analysis,I-DCA),并将其运用于基于k近邻分类器的运动神经与感觉神经分类中.作为对照,还详细分析了已有的相关分量分析方法(Relevant Component Analysis,RCA)和差别分量分析方法(Discrimi-Native Component Analysis,DCA)这两种距离测度学习算法.实验结果表明,改进算法的分类精度相较于马氏距离提高了近45%,相较于RCA与DCA也提高了15%左右,分类精度的提高说明了改进算法的有效性.  相似文献   

9.
对基于商品分类信息的多层关联规则挖掘进行了深入研究,提出了一种改进的基于商品分类信息的多层关联规则挖掘算法,该算法可以有效提高其挖掘性能。  相似文献   

10.
本文对本科、高职高专、中专等各医学院校使用的《生物化学》教材中氨基酸分类方法进行了探讨。  相似文献   

11.
测试集测试结果对程序错误定位算法(testing-basedfaultlocalization,TBFL)没有考虑到程序和测试用例集本身的信息,而智能随机TBFL方法,则是利用随机理论将测试员、程序员关于测试用例和程序的先验知识和测试结果信息结合起来,去定位程序的错误语句.智能TBFL算法主要从人类处理信息的通常过程着眼,把测试员交给开发人员的测试结果(主要是用例是否失败和用例覆盖语句情况)分两个层次处理,首先构造执行矩阵曰,利用程序先验分布计算测试集捕获错误的能力等级分布,它相当于人类处理信息首先考察信息的正确性和重要性这一事实;其次构造功效矩阵F,利用前述的测试集能力分布计算程序语句出错可能性的等级分布,它相当于人类处理信息时挖掘信息内涵并对信息加以综合从而做出正确判断这一事实.因此文中提出的算法称之为智能算法,它在理论上是可信的.根据文中所提出的两个有关不同TBFL算法比较标准,并在一些实例上把智能算法与其他一些传统错误定位方法进行对比,发现智能算法的功效比较满意.  相似文献   

12.
软件故障诊断探讨   总被引:2,自引:0,他引:2  
软件在国民经济和社会生活中发挥着重要作用。软件出现故障可能造成严重危害。但是,目前尚未明确提出软件故障诊断的概念,缺乏对软件故障诊断的系统深入研究。当前硬件系统故障诊断的研究和实践都取得了较大的进展。本文分析软件故障产生的原因和软件失效机理,介绍各种硬件系统故障诊断技术,并对软件故障诊断进行了初步的探讨。  相似文献   

13.
数据挖掘中的数据分类算法综述   总被引:63,自引:0,他引:63  
分类算法是数据挖掘中的最重要的技术之一。通过对当前提出的最新的具有代表性的分类算法进行分析和比较 ,总结每类算法的各方面特性 ,从而便于研究者对已有的算法进行改进 ,提出具有更好性能的新的分类算法 ,同时方便使用者在应用时对算法的选择和使用  相似文献   

14.
针对输电线路距离长、覆盖范围广,易受到自然环境和人为因素的影响,对输电线路故障分类和识别非常困难.在输电线路故障分类中将经验小波变换与改进的学习矢量量化神经网络相结合,使用经验小波变换提取输电线路的故障特征,并使用改进的学习矢量量化神经网络识别故障特征.通过对不同故障类型、故障位置、过渡电阻和初始故障角度进行仿真,验证该模型的准确性和有效性.仿真结果表明,该方法在故障分类中具有一定的优势,不受上述因素的影响,具有良好的鲁棒性和故障分类性能.该研究为中国输电线故障识别技术的发展提供一定的参考.  相似文献   

15.
基于插桩技术的程序谱构建方法   总被引:1,自引:1,他引:0  
为了满足软件测试、软件调试和程序优化等领域对程序谱的需求,提出了基于插桩技术的程序谱构建模型,主要包括插桩预处理、双缓冲处理、有穷自动机处理识别插桩点、植入探针生成插桩代码、编译连接并执行插桩程序以收集执行轨迹构建程序谱。采用双缓冲处理机制,可有效提高源代码处理效率,有穷自动机能够准确识别插桩点。在软件错误定位中的应用结果表明基于插桩技术构建的程序谱可为准确、高效的程序理解和分析提供方便。  相似文献   

16.
如何对网上用户分类是W eb挖掘领域应用最多的任务之一,本文尝试将关联分类方法应用到W eb用户分类模式的挖掘.我们首先对服务器日志文件进行预处理,形成一个访问事务集;然后对该事务集进行数据挖掘,找出所有满足最小信任度和支持度的类别关联规则;最后,我们用这些类别关联规则去预测用户的兴趣.实验证明此方法是有效的.  相似文献   

17.
基于关联维数分析方法对输电线路故障检测、分类与测距进行研究.通过计算和分析比较输电线路正常和各类故障下电压行波的关联维数,得到用于故障检测的关联维数阈值Dth,为进一步判断故障是否接地,引入接地评价指标(Index)th,实现对高压输电线路故障的初步分类;进而基于变步长关联维数突变时刻搜索算法捕捉故障发生时行波到达线路两端的时间差Δt,并以双端行波测距法进行故障测距.最后以仿真验证关联维分析法在高压输电线路故障检测、分类和测距中的有效性.  相似文献   

18.
概念格通过概念的内涵和外延及泛化和例化之间的关系来表示知识,因而适用于从数据库中挖掘规则的问题描述;在概念格的内涵中引入等价关系并将其外延量化,得到量化概念格;利用量化概念格挖掘关联规则,与采用Apriori算法计算频繁项目集获取关联规则相比较,不需要计算频繁项目集,容易获得用户感兴趣的关联规则,同时减少了大量冗余的规则,提高了挖掘效率。  相似文献   

19.
基于多目标遗传算法的模糊分类系统设计   总被引:1,自引:0,他引:1  
提出了一种基于多目标遗传算法的模糊建模方法,实现了具备最大分类精度、最少特征变量和模糊规则数目的模糊分类系统的设计.首先,为缓解维数灾难问题,采用多目标遗传算法进行特征变量的选择和论域的模糊划分,构造基于栅格划分的初始模糊分类系统.然后为减少规则数目,提高模糊系统的解释性,采用遗传算法进行规则选择,得到具备较少规则数目的精简模糊分类系统.最后为提高精确性,采用约束遗传算法对精简模糊分类系统进行整体优化,在解释性不变的前提下,提高模糊分类系统的精确性.Iris和W ine分类系统的仿真,验证了该方法的有效性.  相似文献   

20.
针对Apriori和AprioriTid算法中存在的项集生成瓶颈问题,提出了一种基于事务集压缩、候选项集压缩和支持度布尔矩阵的改进AprioriTid算法.该算法中通过删去不必比较的事务来有效缩减数据集;优化频繁项集的自连接方式来减少生成的候选项集个数;使用支持度布尔矩阵来加快候选项集的验证速度.实验结果表明改进算法比原算法执行效率明显提高,同时也验证了该算法在油液监测故障诊断中的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号