首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 62 毫秒
1.
针对不平衡数据集分类问题,提出了一种基于聚类的欠采样方法.分别取不同的聚类个数,对训练集中的多数类样本进行若干次聚类,然后用聚类中心作为多数类样本,与少数类样本构成若干个新的训练集,之后用这些训练集训练分类器,剔除具有错误分类倾向的分类器,最后对分类结果进行投票.仿真实验对几种欠采样方法进行比较.实验采用16个平衡率不一的数据集进行测试.理论分析与实验结果表明:提出的基于聚类的欠采样方法能有效地改善不平衡数据集的不平衡性.  相似文献   

2.
针对英文情感分类问题,对不同样本采用不同权重,通过引入模糊隶属度函数,通过计算样本模糊隶属度确定样本隶属某一类程度的模糊支持向量机分类算法,通过对比选取不同核函数和不同惩罚系数的结果.仿真实验结果表明应用模糊支持向量机进行英文情感分类具有较好的分类能力和较高的识别能力.  相似文献   

3.
基于支持向量机的磨粒识别   总被引:1,自引:0,他引:1  
由于神经网络的局限性,上个世纪末,支持向量机被提出和发展,它在模式识别方面有广泛的应用发展前途,并由最初的二元分类发展到现在的多元分类.本文根据支持向量机的最新发展,把最小二乘支持向量机应用在磨粒识别上,并取得了好的结果.  相似文献   

4.
支持向量机中的参数直接影响其推广能力,针对参数选取的主观性,提出基于改进的遗传算法优化其参数,并将其应用于银行个人信用的五等级分类问题中,针对多分类问题,设计了3个二值分类器,不同分类的参数不同,通过实验证实可以达到更精细的分类效果.  相似文献   

5.
基于支持向量机的飞行事故率预测模型   总被引:1,自引:0,他引:1  
飞行事故率是表征飞行安全水平的重要指标,其预测是典型的小样本问题.针对目前飞行事故率预测中存在的预测精度不高的问题,提出了一种基于回归支持向量机的飞行事故率预测建模方法.最后结合实际算例,采用SVR进行了飞行事故率预测建模并把预测结果与灰色预测和灰色马尔柯夫链预测进行了对比.仿真结果表明SVR具有很高的建模精度和泛化能力,从而验证了采用SVR进行航空飞行事故率预测的合理性和先进性.  相似文献   

6.
由于RD活动的高风险性,对国防RD项目开展中止决策研究具有重要的理论和现实意义.将传统RD项目中止决策的解决途径分为两类:分类型和回归型.在分析这两种解决途径存在不足的情况下,考虑到国防RD项目自身的特点,提出一种基于混合支持向量机(support vector machine,SVM)的项目中止决策方法;同时,针对模型的建立问题,提出采用交叉验证的方法,通过粒子群优化(particle swarm optimization,PSO)算法实现模型的优化选择.通过建立混合决策模型,可以得出项目中止决策的明确结论.应用分析表明,该方法能够同时实现对项目的分类和排序,较常用方法利用信息更为全面,得出结论更为细致,对实践中的项目中止决策具有较好的适应性.  相似文献   

7.
非平行支持向量机是支持向量机的延伸,受到了广泛的关注.非平行支持向量机构造允许非平行的支撑超平面,可以描述不同类别之间的数据分布差异,从而适用于更广泛的问题.然而,对非平行支持向量机模型与支持向量机模型之间的关系研究较少,且尚未有等价于标准支持向量机模型的非平行支持向量机模型.从支持向量机出发,构造出新的非平行支持向量机模型,该模型不仅可以退化为标准支持向量机,保留了支持向量机的稀疏性和核函数可扩展性.同时,可以描述不同类别之间的数据分布差异,适用于更广泛的非平行结构数据等.最后,通过实验初步验证了所提模型的有效性.  相似文献   

8.
针对神经元的空间几何形态特征分类问题以及神经元的生长预测问题进行了探讨.结合神经元的形态数据,分别建立了基于支持向量机的神经元形态分类模型、基于主成分分析和支持向量机的神经元分类模型以及基于遗传算法和RBF网络的神经元生长预测模型,在较合理的假设下,对各个模型进行求解,得到了较理想的结果.  相似文献   

9.
支持向量回归机是解决回归问题的一个重要方法.在实际问题中由于测量及计算误差的存在,我们得到的数据往往只是真值的某种近似,带有一定的舍入误差,因此有必要研究支持向量回归机的数据扰动问题.考虑到线性回归问题在实际生活中有广泛的应用价值,把线性ε-支持向量回归机作为研究对象.由于最终关心的是它的原始问题的解,所以我们研究给定的训练集中输入数据发生微小地扰动后,原始问题的解的变化情况.在一定的条件下给出了解对扰动数据偏导数的表达式,建立了线性ε-支持向量回归机的原始问题的灵敏度分析定理.文中还进一步分析了建立该灵敏度分析定理所需要的条件,给出了条件减弱后的结果.文章最后还通过一些简单的数值试验验证了定理的准确性.  相似文献   

10.
非平衡数据集的支持向量域分类预测模型研究   总被引:1,自引:0,他引:1  
基于非平衡数据集的支持向量域分类模型,提出了一种银行客户个人信用预测方法.首先分析了信用预测的主要方法及其不足,然后研究了支持向量域分类模型及其参数的非负二次规划乘性更新算法,进而提出基于支持向量域分类模型的银行客户个人信用预测方法,最后使用人工数据和实际数据对提出方法与支持向量机预测方法进行对比实验.实验结果表明对于银行客户个人信用预测的非平衡数据分析问题,基于支持向量域模型的分类预测方法更有效.  相似文献   

11.
基于SVM理论的一种新的数据分类方法   总被引:2,自引:0,他引:2  
基于 SVM分类器在模式识别问题中有独特的优势 ,本文通过对标准 SVM模型的改造 ,提出了一种新的简单的数据分类方法 .理论分析和实验表明 ,该方法与标准 SVM分类方法相比具有处理大规模数据识别的能力且保持较高的样本识别率 ,节省存储空间等优势 .  相似文献   

12.
基于不均衡数据的小企业信用风险评价   总被引:2,自引:0,他引:2  
程砚秋 《运筹与管理》2016,25(6):181-189
小企业信用风险评价既是银行风险管理问题,又事关经济社会稳定。针对小企业贷款实践中,违约样本远少于非违约样本、且违约客户误判对银行影响较大的现实,采用不均衡支持向量机对小企业信用风险评价指标进行赋权,进而构建了能有效区分违约客户、非违约客户的评价模型。根据有无特定评价指标、特定评价指标数值变化对贷款小企业违约状态的影响程度赋权;反映了对违约状态影响越大、评价指标权重越大的赋权思路。将违约样本正确识别率、违约样本的准确率与查全率等因素作为支持向量机赋权模型中客户识别率的度量标准,改变了样本数据不均衡所导致的样本总体精度很高、违约样本精度反而不高的现象。研究结果表明:行业景气指数、资本固定化比率、净利润现金含量、恩格尔系数、营业利润率等评价指标对小企业信用风险的影响较大。  相似文献   

13.
The paper presents some approximate and exact tests for testing variance components in general unbalanced mixed linear model. It extends the results presented by Seifert (1992) with emphasis on the computational aspects of the problem.  相似文献   

14.
基于因子分析的区域经济不平衡发展研究   总被引:1,自引:0,他引:1  
以构建的区域经济发展三维评价指标体系,作为GIS(地理信息系统)相应粒度多边形的主要属性,建立空间时态数据库.通过定义的相对发展度函数进行指标规范化后,经标准化并虚拟优、劣样品,利用因子分析将之变换为因子得分。在此基础,提出加权闵可夫斯基距离法三维评价模型,引入方差、聚集度等测度不平衡程度,通过序列快照模型等表达区域经济发展不平衡格局的动态,根据公因子方差、序相关分析等进行因素诊断与调控。方法应用于福建南平市区域经济不平衡发展研究中,实证表明方法方便、有效。  相似文献   

15.
通过支持向量机(SVM)对客车车型的长,宽,高,宽长比等7个特征进行特征选择,得到的准确率最高的子集是长、宽、高、宽长比、宽高比,以它作为样本特征进行分类.对客车的4类车型进行分类,每类车型选择80个样本,50个样本进行训练,30个样本进行预测,结果表明:对1类车型的分类准确率可达到100%,对2类和4类车型可达到96%以上,对3类车可达到93%以上.得到了比选用长、宽、高作为特征进行分类更优的结果.然后运用加入参数寻优的SVM对客车的4类车型进行分类,并加以比较.基于高斯函数的特性,两次用到SVM进行机器学习时,核函数均选用RBF核函数.  相似文献   

16.
主要研究垃圾文本识别问题,利用苹果手机评论文本特征向量建立了SVM分类模型对垃圾文本进行识别,并与BP神经网络判别模型结果进行对比,得出苹果手机前400组训练样本的判别正确率为71%,后196组测试样本的判别正确率为70.12%.故得到,影响垃圾观点文本识别效果的主要原因为:1)评论文本的特征项的提取和文本特征空间向量求解.2)判别分类方法的选择,其中SVM文本识别效果最优.  相似文献   

17.
解决不平衡数据分类问题,在现实中有着深远的意义。马田系统利用单一的正常类别构建基准空间和测量基准尺度,并由此建立数据分类模型,十分适合不平衡数据分类问题的处理。本文以传统马田系统方法为基础,结合信噪比及F-value、G-mean等分类精度,建立了基于遗传算法的基准空间优化模型,同时运用Bagging集成化算法,构造了改进马田系统模型算法GBMTS。通过对不同分类方法及相关数据集的实验分析,表明:GBMTS算法较其他分类算法,更能够有效的处理不平衡数据的分类问题。  相似文献   

18.
从一定时空粒度三维评价切入,决策矩阵预处理后,利用频率法变换为概率,再根据玻尔兹曼熵函数与对立概念变换为有序度,使不同时间截面、不同对象时间序列间均可比较.经时空权变灵敏分析,利用公因子方差赋权法确定权矩阵,建立三维评价模型,提出基于三维评价的诊断和表达区域不平衡发展的方法、定量指标.根据2000~2007年福建统计年鉴,从1999~2006年福建省地级市外商投资环境三维评价切入,分析福建省外商投资环境不平衡发展特征.  相似文献   

19.
大数据具有体量大、种类丰富、增长速度快等特点,同时也存在价值密度低、代表性差等问题,为抽样调查带来了机遇与挑战.大数据背景下的抽样如何适应新的变化、具有怎样的发展和应用?文章从三个角度进行了讨论.一是在数据流环境下产生了一些适应性强的新型抽样方法,能够高效、准确地获得有代表性样本,并兼顾存储空间、处理的时间与能力.二是...  相似文献   

20.
将一种基于特征提取的ε-不灵敏支持向量机方法用于非线性系统辨识.对输入输出数据首先进行核主元特征提取,将特征提取后的数据作为支持向量机的训练数据.将该方法与基于主元特征提取的方法和直接应用ε-不灵敏支持向量机的方法进行含噪和不含噪情况下的仿真比较,结果表明,方法的拟合性能和抗干扰能力优于其他两种方法.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号