首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到19条相似文献,搜索用时 93 毫秒
1.
在文本分类中,文本特征向量通常高达几千甚至上万维,给整个分类过程带来了相当庞大的计算量,因此进行有效的降维处理是非常重要的.在不完备信息系统理论的基础上,结合文本分类的特点,提出了一种量化容差关系和启发式的属性约简算法.实验证明该属性约简算法不仅能有效地降低文本特征向量的维度,同时能保证分类的正确率.  相似文献   

2.
不完备信息系统的粗集扩展模型   总被引:1,自引:0,他引:1  
经典粗集理论以等价关系为基础,它们在处理不完备信息系统的时候存在一定的局限性.作者首先从扩展粗集理论适应范围的角度出发,引入信息系统对象的先验概率,结合量化相容关系的思想,提出基于先验概率的相容关系模型,然后以该模型为基础研究了不完备信息系统的属性约简,通过严格的数学证明,得到基于分辨矩阵的属性约简算法.最后通过一个实例验证了该改进相容关系模型及其基于分辨矩阵的约简算法.表1,参20.  相似文献   

3.
基于粗集的不完备信息系统属性约简   总被引:21,自引:0,他引:21  
属性约简是粗集理论研究的核心内容之一。经典粗集理论是建立在完备信息基础之上的,然而在现实中,不完备信息系统的广泛存在极大地限制了粗集理论向实用化迈进。该文基于相容关系,将分布约简、最大分布约筒、分配约简引入不完备信息系统,提出了一种新的约简——分配序约简,并讨论了几种约简之间的关系。给出了分配约简的一种启发式算法:条件信息量约简算法,分析了该算法的时间复杂度。经实验检验,该算法是有效的。  相似文献   

4.
针对不完备信息系统(含有缺省数据或不精确数据),研究它的粗糙分类;并基于相容关系,将分布约简、最大分布约简、分配约简、近似约简引入不完备信息系统;且给出了最大分布约简的一种启发式算法:条件信息量约简算法。经实验检验,该算法是有效的。  相似文献   

5.
基于不完备信息系统的分配约简的启发式算法   总被引:2,自引:0,他引:2  
研究了不完备信息系统下的属性约简,基于相容关系提出一种遗传算法的分配约简算法,算法编码采用了二进制一维编码形式,比较适合地表达了遗传算子.为了加快算法的收敛,在适应值函数中引入了惩罚函数,可以保证所求约简既含较少属性又有较强支持度.在交叉规则中,采用了单点交叉,最大迭代代数被作为停止准则,算法获得较佳的搜索效果.通过实例分析,可以证明该算法是求解知识约简问题的快速有效方法.  相似文献   

6.
分析文献[5]提出的针对不完备信息系统的粗糙集分层递阶约简方法,对其进行一定的改进,使算法的效率提高,计算量减少.属性重要性的使用使算法更适用于实际问题.  相似文献   

7.
从理论扩展、属性约简以及规则抽取对目前基于Rough Set(RS)理论的不完备信息系统处理方法进行了分析和评述,提出了该领域的下一步研究方向,为构造面向不完备信息系统的高效实用的挖掘方法提供了基础。  相似文献   

8.
很多信息系统都是不完备的,处理不完备信息系统的方法有很多,但粗糙集理论能够有效处理不完备信息.简要介绍了不完备信息系统下的粗糙集模型,并对一个应用实例进行了知识约简且做出决策.  相似文献   

9.
在含缺省值的不完备信息系统中,以对象的等值度与矛盾度概念为基础,定义了关于对象及信息系统的属性约简概念,给出了约简存在的充要条件,提出并证明了属性约简定理,解决了基于容差关系的属性约简导致系统有用信息损失的问题,为信息系统知识发现提供了新的工具.  相似文献   

10.
蔡正琦  曹永春 《甘肃科技》2012,28(4):17-19,24
将粗糙集模型扩展后应用于属性值为集合值的不完备信息系统,并由属性值集合间的关系导出集值不完备信息系统下的半半序关系,提出基于这种二元关系的可辨识属性矩阵构造方法,研究了集值不完备信息系统的属性约简方法,并给出属性约简判定定理,从而为不完备信息系统的处理提供了一种新的思路和方法.  相似文献   

11.
基于信息熵的不完备信息系统属性约简算法   总被引:11,自引:0,他引:11  
在现实生活中信息的不完备现象广泛存在,等价关系不一定成立,限制了经典Rough集理论在一些实际问题中的应用.从信息论角度出发引入信息熵的概念,提出了不完备信息系统中知识熵的度量方法,定义了信息观下不完备信息系统知识约简的方法,分析并讨论了与现有其他约简定义的关系,给出了一种基于信息熵的不完备信息系统属性约简算法,通过仿真实验说明了该算法对于不完备信息表知识约简是可行的.  相似文献   

12.
传统的k近邻(k-nearest neighbors,kNN)文本分类中,由于文本被表示成向量空间模型后维数非常高,且训练文本的数目巨大,kNN分类算法通常被视为是一种虽然有效,但并非高效的文本分类算法。针对传统kNN分类算法效率低下的问题,提出了一种基于投影寻踪思想的kNN分类算法加速策略。基本思想是:通过投影的方法缩减训练集的规模,同时在寻找k近邻过程中对文本进行降维处理,从两方面着手降低算法的计算开销。实验数据表明,优化后的kNN算法比传统kNN算法在时间性能上有较大的提升,同时保证了分类的精度。  相似文献   

13.
一种不完备信息表的预处理方法   总被引:1,自引:0,他引:1  
针对不完备信息表预处理问题中的不完备数据的填补问题、冗余属性的约简问题和连续属性的离散化问题进行了研究. 应用粗糙集理论,由相容信息表中条件属性与决策属性间的一致性对应关系,定义了划分区间的加法运算,解决了不完备数据填补问题;根据类别概念,定义了差别向量,利用差别向量加法运算删除了冗余属性;根据条件属性与决策属性之间的依赖关系及相对信息熵概念,实现了连续属性的离散化. 数值示例和实验结果显示此方法是有效可行的.  相似文献   

14.
基于粗糙集理论的不完备信息处理方法研究   总被引:2,自引:0,他引:2  
针对不完备信息处理问题,分析了不完备信息的语义解释,将粗糙集理论中处理不完备信息的技术策略归纳为数据补齐法和模型扩展法两类.在对已有典型粗糙集扩展模型的定义及其优缺点进行分析的基础上,分别对限制容差关系和特征关系的定义进行改进,得到新的扩充关系模型,讨论了它们的性质.对量化容差关系中对象间的相似度度量方法,给出了3种不同的度量方式及其相应的量化容差关系模型.  相似文献   

15.
针对不完备信息处理问题,分析了不完备信息的语义解释,将粗糙集理论中处理不完备信息的技术策略归纳为数据补齐法和模型扩展法两类。在对已有典型粗糙集扩展模型的定义及其优缺点进行分析的基础上,分别对限制容差关系和特征关系的定义进行改进,得到新的扩充关系模型,讨论了它们的性质。对量化容差关系中对象间的相似度度量方法,给出了3种不同的度量方式及其相应的量化容差关系模型。  相似文献   

16.
为了获取连续值域信息系统的决策规则,本文突出了一种新的方涛,这种新的方法无需对连续值域信息系统进行离散化,因此减少了由于离散化预处理所丢失的信息.通过对文中允许误差的系统对规则获取效率的影响的讨论,可以发现,在实际应用中新的方法比传统的方法更有效.  相似文献   

17.
为了更好地从含有杂合数据和不完备数据的信息系统中提取合理的规则知识,构建基于广义相似关系的不完备信息系统粗糙集模型.其步骤为:针对决策信息系统中存在杂合数据的情况,并对决策信息系统中所存在的不完备信息进行细致区分,给出广义相似关系的定义;通过提出上、下广义相似划分的上、下近似的概念,给出2种划分意义下的属性约简和规则知识提取策略;最后,在理论上对该扩展粗糙集模型的正确性进行相关证明,并用实际算例进一步验证该模型的有效性和优越性.  相似文献   

18.
研究不完备形式背景的属性约简问题。通过比较对象间属性值的一致性, 定义了对象集上的一个相似关系, 进而定义了基于相似关系的粗糙近似算子, 利用目标集的粗糙集近似, 可以提取语义明确的决策规则。基于不完备形式背景中相似关系给出一种属性约简的概念, 研究了属性约简的判定定理, 给出了三类属性的特征刻画。 最后, 利用对象间的辨识属性, 给出了一种属性约简的方法, 并举例说明了方法的可行性。  相似文献   

19.
基于VSM的中文文本分类系统的设计与实现   总被引:25,自引:0,他引:25  
文本分类是指在给定分类体系下,根据文本的内容自动确定文本类别的过程。该文阐述了一个基于向量空间模型的中文文本分类系统的设计和实现。对文本分类系统的系统结构、预处理、特征提取、训练算法、分类算法等进行了详细介绍。引入标题权重系数改进词语权重,并提出了一种新的分类算法。实验测试结果表明查全率和准确率均达到90%左右,而且标题权重的引入和新分类算法的实施有效地改善了分类性能。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号