首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
基于密度敏感最大软间隔SVDD不均衡数据分类算法   总被引:1,自引:0,他引:1       下载免费PDF全文
陶新民  李晨曦  沈微  常瑞  王若彤  刘艳超 《电子学报》2018,46(11):2725-2732
为了提高传统支持向量域描述(C-SVDD)算法处理不均衡数据集的分类能力,提出一种基于密度敏感最大软间隔支持向量域描述(DSMSM-SVDD)算法.该算法通过对多数类样本引入相对密度来体现训练样本原始空间分布对求解最优分类界面的影响,通过在目标函数中增加最大软间隔正则项,使C-SVDD的分类边界向少数类偏移,进而提高算法分类性能.算法首先对每个多数类样本计算相对密度来反映样本的重要性,然后将训练样本输入到DSMSM-SVDD中实现数据分类.实验部分,讨论了算法参数间的关系及其对算法分类性能的影响,给出算法参数取值建议.最后通过与C-SVDD的对比实验,表明本文建议的算法在不均衡数据情况下的分类性能优于C-SVDD算法.  相似文献   

2.
为了解决常规的不均衡数据分类方法存在的分类精度较低问题,保证数据分类的准确性,需要设计新的BP NNS非均衡数据分类方法,即采集处理不均衡数据信息降低数据分类难度;计算不均衡数据分类子类样本数量提高数据分类敏感性;构建不均衡数据分类模型提高数据分类的流畅性,从而实现不均衡数据高精度分类。实验结果表明,设计的不均衡数据分类方法的分类精度较高,满足不均衡数据分类的分类准确性需求,具有一定的应用价值,可作为后续数据处理的参考。  相似文献   

3.
文中针对低温潮湿环境下风机易出现的叶片结冰现象,提出一种基于SMOTE的XGBoost算法对风机叶片结冰进行早期预测。首先,结合领域知识和Wrapper法对风机SCADA数据进行特征分析,评估各特征重要性;其次,对结冰数据进行SMOTE过采样,选择适合不平衡数据集的评估指标F1Score,G-mean作为模型评估指标;最后,基于XGBoost算法构建预测模型,利用网格搜索与学习曲线对模型参数进行优化,提高预测准确率。通过与AdaBoost算法进行比较,实验结果表明文中提出的方法在准确率和时间效率方面优于AdaBoost算法,有效解决了风机结冰预测问题。  相似文献   

4.
该文通过对来自19个不同行业的4163家上市公司进行分析,基于BP-神经网络算法确定了不同行业上市公司的财务数据造假相关指标,并以此为依据确定不同行业上市公司财务造假相关数据的异同,从而确定各指标与上市公司的财务数据造假的相关性.加强监管建立常态化的退市机制.对上市公司的数据造假等问题加强监管,对投资者规避投资风险,促...  相似文献   

5.
基于改进SMOTE的不平衡数据挖掘方法研究   总被引:1,自引:0,他引:1       下载免费PDF全文
少类样本合成过采样技术(SMOTE)是一种新型的过采样方法,能够有效地处理不平衡数据分类问题.但SMOTE在产生合成样本的过程中,存在一定的盲目性.因此本文提出一种改进的过采样方法一自适应SMOTE,根据样本集内部分布特性,自适应调整SMOTE方法中近邻选择策略,控制合成样本的质量.算法分析和仿真结果表明,文中提出的方法在不影响计算复杂度的前提下,有效地提高了分类算法的整体分类准确率.  相似文献   

6.
分类预测是数据挖掘和机器学习的重要任务之一,非均衡数据广泛存在于真实世界的分类问题中.本文提出一种新的解决非均衡数据集的预处理方法(ImSMOTE-RSTR*).通过改进的SMOTE方法创建新的人工合成少数类实例,并在此基础上应用基于粗糙集理论的子集下近似技术对训练集进行清理,该算法被验证得到较理想的结果.  相似文献   

7.
王泽 《通讯世界》2016,(1):225-226
文本分类在数据库和搜索引擎的应用较为广泛,SVM是文本分类算法中的重要算法,适用于多种分类问题,能够解决传统算法中的弊端.本文对支持向量机和支持向量机算法做出具体的介绍,对该算法在文本分类中的应用具体指标进行探讨,旨在为我国的文本分类方式的进步和发展提供理论帮助.  相似文献   

8.
汽车零部件的齿轮装配过程中往往伴随着多种类型的故障,快速且精准地判断故障类型,对保证齿轮装配工位稳定运行具有重要意义。因此,提出一种基于SMOTE采样方法和随机森林(RF)分类方法的故障诊断模型——SMOTE-RF。首先,在实际齿轮装配过程中,故障数据是不平衡的,可以使用SMOTE算法生成平衡的故障数据;其次,将平衡后的数据作为随机森林算法的输入实现故障分类;最后,对模型进行性能评估。实验结果表明,SMOTE-RF模型的分类效果优于SVM和XGBoost。  相似文献   

9.
《信息技术》2018,(1):113-117
针对目前指纹室内定位系统指纹库管理效率低、实时性差和定位精度低的问题,提出了一种新的基于核化K-means和SVM分类回归的无线定位算法。首先利用核化K-means算法将输入的预处理后的RSS(Received Signal Strength)信号进行无监督聚类,将聚类后的数据信息存入指纹特征数据库,然后通过SVM回归的机器学习算法对特征数据库的数据进行训练,得到一种最优的拟合位置函数的数学模型。并且采用粒子群算法对参数进行寻优,进行实验仿真。实验结果表明,该算法有效地提升了定位精度,优于KNN、WKNN、SVR等室内定位算法。  相似文献   

10.
《信息技术》2017,(1):5-8
文中针对不平衡数据导致分类结果倾斜现象,提出了一种结合SMOTE和GEPSVM的分类方法。该方法利用SMOTE过采样重构训练集,使训练集达到相对平衡,避免了重复样本数据带来的过学习问题,最后用GEPSVM进行分类学习。在UCI数据集上的实验证明了该算法在不平衡数据集上与传统的SVM算法相比有更好的分类效果,在计算时间上也有一定的优势。  相似文献   

11.
基于SMO的不同惩罚系数的SVM算法   总被引:1,自引:0,他引:1  
王娟娟  任秋实 《信息技术》2006,30(10):45-47
非平衡数据集的分类问题经常出现在许多实际应用中。支持向量机在处理这一类问题时,整体分类性能比较低。为此,Veropoulos提出的采用不同惩罚系数的改进算法可以较好的解决此类问题。此外,可以利用序列最小优化算法简单快速的解决上述优化问题。  相似文献   

12.
电信用户欠费预测是一个不平衡数据集分类问题.针对传统支持向量机(SVM)对不均衡数据集中少数类检测精度低的问题,基于分类平面由边界样本的位置决定,提出了一种通过删除部分多数类边界样本的方法来改善传统SVM算法的不足,将该算法和其他几种算法在电信数据和多个不平衡UCI数据集上的实验结果进行对比,验证所提算法对少数类的检测精度和总体评价指标都有所提高.  相似文献   

13.
提出一种基于支持向量机的实际调制信号自动识别新方法。利用支持向量机把分类特征向量映射到一个高维空间,并在高维空间中构造最优分类超平面以实现信号分类。计算机仿真结果表明,该方法对实际采集的信号具有很好的分类性能。  相似文献   

14.
阐述如何利用多手段获取的战场多源目标态势数据生成战场态势一张图,进一步提高海上方向的监控能力。针对多源目标态势数据存在的时空误差、属性模糊等问题,提出一种运用支持向量机(Support Vector Machine,SVM)分类的多源态势数据关联方法。运用机器训练学习方式,获取不同误差下的多源态势关联,识别非线性特征参数,构建多源态势数据关联算法模型,有效形成目标批号和时空位置的唯一性。通过模拟真实数据进行验证,结果表明该算法实现效果较好,在多源态势融合方面具有较好的实用价值。  相似文献   

15.
李胜后  钟蕾 《信息技术》2008,32(3):55-57
提出了一种将支持向量机分类和最近邻分类相结合的方法,形成了一种新的分类器.实验结果表明使用支持向量机结合最近邻分类的分类器分类比单独使用支持向量机分类具有更高的分类准确率,同时可以较好地解决应用支持向量机分类时核函数参数的选择问题.  相似文献   

16.
基于人工蜂群算法的支持向量机参数优化及应用   总被引:2,自引:1,他引:1  
为了解决常用的支持向量机(SVM)参数优化方法在寻优过程不同程度的陷入局部最优解的问题,提出一种基于人工蜂群(ABC)算法的SVM参数优化方法。将SVM的惩罚因子和核函数参数作为食物源位置,分类正确率作为适应度,利用ABC算法寻找适应度最高的食物源位置。利用4个标准数据集,将其与遗传(GA)算法、蚁群(ACO)算法、标准粒子群(PSO)算法优化的SVM进行性能比较,结果表明,本文方法能克服局部最优解,获得更高的分类正确率,并在小数目分类问题上有效降低运行时间。将本文方法运用到计算机笔迹鉴别,对提取的笔迹特征进行分类,与GA算法、ACO算法、PSO算法优化的SVM相比,得到了更高的分类正确率。  相似文献   

17.
随着计算机技术的发展,人们对和谐人机交互的要求不断提高,这就要求计算机能理解说话人的情感信息,即能进行语音情感识别。本文提出了一种基于支持向量机(SVM)的语音情感识别方法,主要对人类的6种基本情感:高兴、惊奇、愤怒、悲伤、恐惧、平静进行研究。首先对自建语音情感数据库的情感语句提取特征,然后运用序列前向选择(SFS)算...  相似文献   

18.
文中讨论了基于模式分类的算法,通过常规的体检参数对骨质疏松情况进行预测和识别.由于常规体检参数和骨质疏松诊断结果之间的线性相关度小、参数方差大等问题,基于线性分类边界模型得到的分类器误差大,文中利用数据和骨质疏松之间的非线性关联特性,使用高斯核函数将原始训练数据映射到核空间进行分类,较好地实现了用体检参数预测骨质疏松.此外文中给出了利用多个分类器的分类结果进行组合方法,使得不同分类器分类结果相互矛盾时能够输出唯一的诊断结论.  相似文献   

19.
梁楠  邹志红 《电讯技术》2020,(3):331-337
在多传感器水质数据融合领域,证据理论是有效的数据融合方法之一,但基本概率分配一般不易确定,从而使数据融合能力难以有效发挥。支持向量机是统计学习理论之上的高级分类算法,具有普适性和全局优化等特点,但输出的基本概率分配有待进一步提高。提出了一种基于证据理论和新型模糊支持向量机相结合的数据融合方法,通过建立基于分类超平面距离的模糊隶属度,训练模糊支持向量机提高传统支持向量机的基本概率分配,并结合证据理论进行海河水质数据融合。通过证据理论分别结合支持向量机和模糊综合评价法与上述方法进行对比实验,经精度、平均绝对百分误差、均方根误差等指标验证,精度提高10. 5%,表明所提方法是一种可靠的多传感器的水质融合方法,较其他方法具有更高的融合精度。  相似文献   

20.
马勇  郭殿武 《信息技术》2006,30(8):63-66
提出了一种基于HHT和支持向量机的实际数字调制信号识别算法。首先介绍了HHT方法的基本原理,对三种数字调制信号进行分析,提出用于识别实际FSK,PSK和QAM信号的特征参数,然后运用支持向量机算法分类三种数字调制信号,仿真结果表明,在信噪比10dB时,识别率达95%以上。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号