首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 62 毫秒
1.
多标签特征选择指在多标签场景下选出代表性属性.已有的多标签特征选择方法大多集中在事先获得全部特征空间,而没有考虑流式特征情况.随着时间的推移,这些特征不断地流入模型中.此外,一些流方法需要在学习之前指定参数.因此,在训练不同类型数据集之前,如何选取统一和最优参数成为一种难题.基于此,本文定义自适应邻域粗糙集关系-Gap...  相似文献   

2.
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除...  相似文献   

3.
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除不相关特征及冗余特征;最后,利用基于相关性度量的特征评估函数以及序列搜索算法进一步降低特征维数,确定最优特征子集。实验表明,在保证算法整体分类精确率的前提下,算法能够有效提高小类别的分类性能。  相似文献   

4.
特征选择是目标分类的一项重要步骤,直接影响到分类器的设计和性能。本文利用实际水声目标辐射噪声数据,对遗传算法和互信息算法两种特征选择方法分别作了分析。在特征维数较大的情况下,两种方法都需要很长的计算时间,为此,提出一种遗传与互信息混合算法,旨在降低计算时间。最后,分类器用三种选择后的特征子集作为输入进行分类,并与任意选择的特征子集作为输入的分类结果作了比较。  相似文献   

5.
文本分类中改进型互信息特征选择的研究   总被引:5,自引:2,他引:3  
互信息是文本分类中常用的特征选择方法.提出了一种新的基于互信息的特征选择方法.首先分析了特征选择影响文本分类精度的因素,将这些因素组合起来表征特征对于分类的强弱,并用公式直观地表示由组合因素计算出的特征值,根据这些值得大小选择对分类影响大的特征.最后理论证明了其可行性,并通过实验证明了该方法在提高分类精度方面比传统方法提高了10%.  相似文献   

6.
龙华  杨明亮  邵玉斌 《通信学报》2020,41(4):134-142
针对语音通话中语音段的起始检测性能不佳,检测语音连续性结构受到破坏的问题,提出了一种基于特征流融合的带噪语音检测算法。首先,根据语音特性分别提取时域特征流、谱图特征流和统计特征流;其次,利用不同的语音特征流分别对带噪音频中的语音段进行概率估测;最后,将各个特征流估测得到的语音估测概率进行加权融合,并利用隐马尔可夫模型对语音估测概率进行短时状态处理。通过对复合语音数据库在多类型噪声与不同信噪比条件下的性能测试表明,所提算法相对于基于贝叶斯与DNN分类器的基线模型相比,语音检测正确率分别提高了21.26%与11.01%,显著提高了目标语音的质量。  相似文献   

7.
中文文本分类中的特征选择算法研究   总被引:34,自引:0,他引:34  
比较了文档频率、信息增益、互信息、X^2统计量、期望交叉熵、文本证据权以及几率比等7种常用于文本分类的特征选择算法。实验采用国家“八六三计划”中文文文本语料库和Rocchio分类器对以上的特征选择算法分别进行评估,测评结果表明,几率比法的性能优于其它特征选择算法。  相似文献   

8.
吕子敬  张鹏  刘志明  张志辉  韩强 《红外》2021,42(5):33-38
为了以最小的代价筛选出最优的光谱特征,从信息亏损角度提出了一种Filter型光谱特征选择算法。该算法依据联合互信息的大小对特征进行排序,并采用一种零信息亏损原则对排序后特征全集中的冗余特征进行判断和删减。这样既能获得一个规模较小并可表现整个原始光谱特征的最优光谱特征子集,又减小了由冗余特征删减带来的信息亏损。  相似文献   

9.
通过在不同文本数据集上的试验表明,文中提出的算法具有不错的表现。与文本分类中常用的特征选择算法IG、CHI相比,文中算法是有效的且能够提高分类的精确率。  相似文献   

10.
本文提出一种基于Lasso和模糊互信息多标记特征选择算法。本文所提的算法在6个多标记数据集上进行了测试,实验结果和统计假设检验说明本文算法是有效的。  相似文献   

11.
Battiti's mutual information feature selector (MIFS) and its variant algorithms are used for many classification applications. Since they ignore feature synergy, MIFS and its variants may cause a big bias when features are combined to cooperate together. Besides, MIFS and its variants estimate feature redundancy regardless of the corresponding classification task. In this paper, we propose an automated greedy feature selection algorithm called conditional mutual information‐based feature selection (CMIFS). Based on the link between interaction information and conditional mutual information, CMIFS takes account of both redundancy and synergy interactions of features and identifies discriminative features. In addition, CMIFS combines feature redundancy evaluation with classification tasks. It can decrease the probability of mistaking important features as redundant features in searching process. The experimental results show that CMIFS can achieve higher best‐classification‐accuracy than MIFS and its variants, with the same or less (nearly 50%) number of features.  相似文献   

12.
互信息是一种常用的特征选择评价函数,但研究表明它会导致分类精度相对较低.文中针对互信息倾向选择低频词的不足,提出了一种新的特征评价函数TFMIIE,将信息熵和改进互信息相结合,其中改进互信息能够避免偏向低频的生僻词,而特征熵有利于去除类别不确定的特征词.实验结果表明,采用TFMIIE进行特征选择,用得到的特征子集表示文本和构建分类器,文本分类的准确率与召回率比采用互信息的方法提高了约40%,验证了所提出的基于改进互信息和信息熵的文本特征选择方法是有效的.  相似文献   

13.
刘怡  蔚磊  刘子利  王鹏 《电子学报》2008,36(Z1):152-156
 歌曲风格的自动分类技术研究,是音乐信息检索领域中一个重要课题.本文主要讨论了对中国民歌地域风格自动分类中不同特征选择方法对于分类性能的影响.论文选用10个不同地域的1392首原生态中国民歌,进行了地域风格的分类实验.实验结果表明:在多种分类器的试验中,SVM分类器的分类准确率最高;在多种特征选择实验中使用SVM与Active Feature Selection的特征选择方法的分类准确率最高,为83%,且选择出的有效特征参数从74维降为35维,更便于进行参数分析.  相似文献   

14.
吕子敬  韩顺利  张志辉  刘磊 《红外》2016,37(1):40-44
大规模的红外光谱数据集中存在大量无关冗余的特征。针对这一问题,提出了一种动态赋权红外光谱特征选择算法(Dynamic Weight Infrared Spectrum Feature Selection Algorithm, MBDWFS)。 该算法把对称不确定性度量标准与近似Markov Blanket相结合,以删除原始光谱数据集中无关冗余的特征,从而获取数据规模较小且最优的特征子集。通过与 FCBF、ID$_3$ 和ReliefF三种经典特征选择算法的性能仿真对比试验,证明所提出的MBDWFS算法在整体分类性能上优于其他三种算法,用于红外光谱的物质分析领域时效果更好。  相似文献   

15.
现有的一种特征选择算法DPM(Discriminating Power Measure)[1],是通过计算每个特征在某一类别和剩余其他类别中的文档频,比较了特征对一个类别和对其他类别的贡献,提取出具有强类别区分能力的特征词.在研究此特征选择算法的基础上,提出了一种改进的特征选择算法,该算法同时考虑了每个特征的类别频次在计算特征类别区分能力方面的重要性.经实验验证,改进后的特征选择算法能够获得较好的分类效果.  相似文献   

16.
基于聚类分析的软件胎记特征选择   总被引:1,自引:0,他引:1       下载免费PDF全文
罗养霞  房鼎益 《电子学报》2013,41(12):2334-2338
软件胎记选择关系着软件的识别率.本文应用约束聚类分析软件特征,基于互信息度量特征的类内和类间距离,以同类和异类软件特征构建信息增益函数和惩罚函数,选择出具有高的类区分信息和最小冗余的软件胎记特征.通过分析和比较表明该算法为软件胎记特征的选择和优化提供了一种有效途径.  相似文献   

17.
面向现代战场中各类感知设备产生海量实时数据,消除冗余及无关数据是提升信息质量,降低军事信息系统资源开销的关键技术。提出了一种基于特征选择的数据降维方法,实验结果表明该方法能够大幅消减噪音数据,有效提升信息质量,降低系统开销,适用于现代战争环境。  相似文献   

18.
戴大蒙  慕德俊 《电子学报》2013,41(3):451-455
为了获取非完备信息系统的相对最小特征子集,提出一种基于非完备信息系统的启发式特征选择遗传算法.本文首先构造了适应度函数,并以特征重要度为启发式信息融入特征选择;同时利用特征的相对核对种群初始化,引导染色体的进化,缩小了算法的搜索空间;且在染色体的交叉和变异过程中,对满足条件的染色体及时删除,加快算法的收敛性;实验结果验证了算法的有效性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号