首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 406 毫秒
1.
利用传统支持向量机(SVM)对不平衡数据进行分类时,由于真实的少数类支持向量样本过少且难以被识别,造成了分类时效果不是很理想.针对这一问题,提出了一种基于支持向量机混合采样的不平衡数据分类方法(BSMS).该方法首先对经过支持向量机分类的原始不平衡数据按照所处位置的不同划分为支持向量区(SV),多数类非支持向量区(MNSV)以及少数类非支持向量区(FNSV)三个区域,并对MNSV区和FNSV区的样本做去噪处理;然后对SV区分类错误和部分分类正确且靠近决策边界的少数类样本重复进行过采样处理,直到找到测试结果最优的训练数据集;最后有选择的随机删除MNSV区的部分样本.实验结果表明:方法优于其他采样方法.  相似文献   

2.
针对英文情感分类问题,对不同样本采用不同权重,通过引入模糊隶属度函数,通过计算样本模糊隶属度确定样本隶属某一类程度的模糊支持向量机分类算法,通过对比选取不同核函数和不同惩罚系数的结果.仿真实验结果表明应用模糊支持向量机进行英文情感分类具有较好的分类能力和较高的识别能力.  相似文献   

3.
支持向量机在近十年成为机器学习的主要学习技术,而且已经成功应用到有监督学习问题中。Fung和Mangasarian利用支持向量机对于既有已标类别样本又有未知类别样本的训练集进行训练,方法主要是利用少量已标明类别的样本进行训练得到一个分类器的同时对于未标明类别的样本进行分类,使得间隔最大化。此优化问题中假定样本是精确的,而在现实生活中,样本通常带有统计误差。因此,考虑样本带有扰动信息的半监督两类分类问题,给出鲁棒半监督v-支持向量分类算法。该算法的参数v易于选择,而数值试验也表明该算法具有良好的稳定性和较好的分类结果。  相似文献   

4.
为了减少求支持向量过程中二次规划的复杂度,利用训练样本集的几何信息,选出两类中离另一类最近的边界向量集合,它是样本中最有可能成为支持向量的一部分,用它代替原样本集进行训练.对新增样本,若存在违反KKT条件的样本,只对这部分新样本进行学习.同时找出原样本中可能转化为支持向量的非支持向量样本.基于分析结果,提出了一种新的基于最近边界向量的增量式支持向量机学习算法.对标准数据集的实验结果表明,算法是可行的,有效的.  相似文献   

5.
基于灰色关联分析的模糊支持向量机中隶属度的确定   总被引:1,自引:0,他引:1  
本文用灰色关联分析来替代模糊隶属度的求解,提出了一种新的有效地刻画样本不确定性的隶属度计算方法,理论上表明它是解决模糊支持向量机方法中一般使用特征空间中样本与类中心之间的距离关系构建隶属度函数的不足的方法之一,在一些特定条件下分类性能要强一些.  相似文献   

6.
针对目前半监督分类算法中未考虑缺失属性隐含信息和算法复杂度高的情况,改进了朴素信念分类,提出了两阶段半监督加权朴素信念分类模型。与直推支持向量机对比实验结果表明两阶段半监督加权朴素信念分类模型减少了分类时间,并且在其能够明确分类的样本上的正确率与直推支持向量机相当,是一种有效的不完整数据分类算法。  相似文献   

7.
基于支持向量机的最优二分类方法,以癌症诊断为例,构建了疾病诊断的支持向量机模型.对50例非癌症患者和100例癌症患者的腺苷三磷酸酶(ATP酶)和琥珀酸脱氢酶(SDH酶)活性两项指标分组进行训练和仿真诊断,检测样本的诊断正确率为98.03%,故可以用支持向量机建立临床疾病诊断系统.  相似文献   

8.
良好的成员选择方法是动态供应链平稳运行的重要基础,针对动态供应链成员选择时面临决策属性多且可供决策分析数据样本少的难题,提出了基于粗糙集和支持向量机的动态供应链成员选择算法,核心是应用粗糙集进行属性约简,然后结合支持向量机进行链上成员分类.方法在保证不会降低分类性能的前提下,达到降低数据维数和分类过程中复杂度的目的.  相似文献   

9.
针对现有供应商分类方法应用于高端装备制造业供应商所存在的局限性,从相互依赖视角构建了高端装备制造业供应商分类指标体系,提出了基于改进支持向量机的高端装备制造业供应商分类模型。该模型根据供应商误分代价不同,设计代价敏感支持向量机分类器,利用粒子群算法优化分类器的参数,并采用概率输出方法对多个优化的二类分类器的结果进行组合以实现多类分类。实验结果表明,该模型提高了现有方法的分类效果,可以降低总体误分代价,有效识别出对高端装备制造企业具有重大影响的供应商,为高端装备制造企业实施供应商分类管理提供了依据。  相似文献   

10.
用LDA Boosting算法进行客户流失预测   总被引:2,自引:1,他引:1  
本文提出一种LDA boost(Linear Discriminant Analysis boost)分类方法,该算法能有效利用样本的所有特征,并且能够从高维特征空间里提取并组合优化出最具有判别能力的低维特征,使得样本类间离散度和类内离散度的比值最大,从而不会产生过度学习,大大提高算法效率。该算法有效性在某商业银行的客户流失预测过程的真实数据集中得到了验证。与其他同类算法,如人工神经网络、决策树、支持向量机等运算结果相比,该方法可以显著提高运算精度。同时,LDAboosting与其他boosting算法相比,也具有显著的优越性。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号