共查询到18条相似文献,搜索用时 62 毫秒
1.
多标签特征选择指在多标签场景下选出代表性属性.已有的多标签特征选择方法大多集中在事先获得全部特征空间,而没有考虑流式特征情况.随着时间的推移,这些特征不断地流入模型中.此外,一些流方法需要在学习之前指定参数.因此,在训练不同类型数据集之前,如何选取统一和最优参数成为一种难题.基于此,本文定义自适应邻域粗糙集关系-Gap... 相似文献
2.
3.
针对网络流量分类过程中出现的类不平衡问题,该文提出一种基于加权对称不确定性(WSU)和近似马尔科夫毯(AMB)的特征选择算法。首先,根据类别分布信息,定义了偏向于小类别的特征度量,使得与小类别具有强相关性的特征更容易被选择出来;其次,充分考虑特征与类别间、特征与特征之间的相关性,利用加权对称不确定性和近似马尔科夫毯删除不相关特征及冗余特征;最后,利用基于相关性度量的特征评估函数以及序列搜索算法进一步降低特征维数,确定最优特征子集。实验表明,在保证算法整体分类精确率的前提下,算法能够有效提高小类别的分类性能。 相似文献
4.
特征选择是目标分类的一项重要步骤,直接影响到分类器的设计和性能。本文利用实际水声目标辐射噪声数据,对遗传算法和互信息算法两种特征选择方法分别作了分析。在特征维数较大的情况下,两种方法都需要很长的计算时间,为此,提出一种遗传与互信息混合算法,旨在降低计算时间。最后,分类器用三种选择后的特征子集作为输入进行分类,并与任意选择的特征子集作为输入的分类结果作了比较。 相似文献
5.
文本分类中改进型互信息特征选择的研究 总被引:5,自引:2,他引:3
互信息是文本分类中常用的特征选择方法.提出了一种新的基于互信息的特征选择方法.首先分析了特征选择影响文本分类精度的因素,将这些因素组合起来表征特征对于分类的强弱,并用公式直观地表示由组合因素计算出的特征值,根据这些值得大小选择对分类影响大的特征.最后理论证明了其可行性,并通过实验证明了该方法在提高分类精度方面比传统方法提高了10%. 相似文献
6.
针对语音通话中语音段的起始检测性能不佳,检测语音连续性结构受到破坏的问题,提出了一种基于特征流融合的带噪语音检测算法。首先,根据语音特性分别提取时域特征流、谱图特征流和统计特征流;其次,利用不同的语音特征流分别对带噪音频中的语音段进行概率估测;最后,将各个特征流估测得到的语音估测概率进行加权融合,并利用隐马尔可夫模型对语音估测概率进行短时状态处理。通过对复合语音数据库在多类型噪声与不同信噪比条件下的性能测试表明,所提算法相对于基于贝叶斯与DNN分类器的基线模型相比,语音检测正确率分别提高了21.26%与11.01%,显著提高了目标语音的质量。 相似文献
7.
8.
10.
《电子技术与软件工程》2019,(10)
本文提出一种基于Lasso和模糊互信息多标记特征选择算法。本文所提的算法在6个多标记数据集上进行了测试,实验结果和统计假设检验说明本文算法是有效的。 相似文献
11.
Battiti's mutual information feature selector (MIFS) and its variant algorithms are used for many classification applications. Since they ignore feature synergy, MIFS and its variants may cause a big bias when features are combined to cooperate together. Besides, MIFS and its variants estimate feature redundancy regardless of the corresponding classification task. In this paper, we propose an automated greedy feature selection algorithm called conditional mutual information‐based feature selection (CMIFS). Based on the link between interaction information and conditional mutual information, CMIFS takes account of both redundancy and synergy interactions of features and identifies discriminative features. In addition, CMIFS combines feature redundancy evaluation with classification tasks. It can decrease the probability of mistaking important features as redundant features in searching process. The experimental results show that CMIFS can achieve higher best‐classification‐accuracy than MIFS and its variants, with the same or less (nearly 50%) number of features. 相似文献
12.
互信息是一种常用的特征选择评价函数,但研究表明它会导致分类精度相对较低.文中针对互信息倾向选择低频词的不足,提出了一种新的特征评价函数TFMIIE,将信息熵和改进互信息相结合,其中改进互信息能够避免偏向低频的生僻词,而特征熵有利于去除类别不确定的特征词.实验结果表明,采用TFMIIE进行特征选择,用得到的特征子集表示文本和构建分类器,文本分类的准确率与召回率比采用互信息的方法提高了约40%,验证了所提出的基于改进互信息和信息熵的文本特征选择方法是有效的. 相似文献
13.
歌曲风格的自动分类技术研究,是音乐信息检索领域中一个重要课题.本文主要讨论了对中国民歌地域风格自动分类中不同特征选择方法对于分类性能的影响.论文选用10个不同地域的1392首原生态中国民歌,进行了地域风格的分类实验.实验结果表明:在多种分类器的试验中,SVM分类器的分类准确率最高;在多种特征选择实验中使用SVM与Active Feature Selection的特征选择方法的分类准确率最高,为83%,且选择出的有效特征参数从74维降为35维,更便于进行参数分析. 相似文献
14.
大规模的红外光谱数据集中存在大量无关冗余的特征。针对这一问题,提出了一种动态赋权红外光谱特征选择算法(Dynamic Weight Infrared Spectrum Feature Selection Algorithm, MBDWFS)。 该算法把对称不确定性度量标准与近似Markov Blanket相结合,以删除原始光谱数据集中无关冗余的特征,从而获取数据规模较小且最优的特征子集。通过与 FCBF、ID$_3$ 和ReliefF三种经典特征选择算法的性能仿真对比试验,证明所提出的MBDWFS算法在整体分类性能上优于其他三种算法,用于红外光谱的物质分析领域时效果更好。 相似文献
15.
现有的一种特征选择算法DPM(Discriminating Power Measure)[1],是通过计算每个特征在某一类别和剩余其他类别中的文档频,比较了特征对一个类别和对其他类别的贡献,提取出具有强类别区分能力的特征词.在研究此特征选择算法的基础上,提出了一种改进的特征选择算法,该算法同时考虑了每个特征的类别频次在计算特征类别区分能力方面的重要性.经实验验证,改进后的特征选择算法能够获得较好的分类效果. 相似文献
16.
17.
面向现代战场中各类感知设备产生海量实时数据,消除冗余及无关数据是提升信息质量,降低军事信息系统资源开销的关键技术。提出了一种基于特征选择的数据降维方法,实验结果表明该方法能够大幅消减噪音数据,有效提升信息质量,降低系统开销,适用于现代战争环境。 相似文献