首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 18 毫秒
1.
支持向量机在处理大样本数据多分类问题时,往往会出现数据集偏斜、基分类器过多、编码方法适应性差等问题,从而导致精度和效率大幅下降。本文提出了一种启发式的支持向量机多分类层次树结构构造方法,构造出由若干子分类器协同计算的多分类层次树结构,一定程度上改善了基分类器过多、数据集偏斜、数据训练时间过长等问题。通过实验证明,该方法与常规方法相比,具有更优秀的精度和效率,在处理大样本、多特征数、多类别的样本分类时,优势更加明显。本研究方法为支持向量机多分类方面的研究提供了一种新的思路,对于本体领域内的分类和回归问题的研究也具有一定的理论参考意义。  相似文献   

2.
蛋白质折叠的识别是一种不依赖于序列相似性的蛋白质结构研究方法.本文将相关向量机应用于蛋白质折叠的识别,将两类相关向量机推广到多分类情况,对多类蛋白质折叠进行识别.与支持向量机相比较,相关向量机无需调整多余的参数,核函数不需要满足mercer条件,实际数据集上的测试结果表明,相关向量机可以得到更加稀疏的模型,在交叉检验中获得了更高的精度,表明相关向量机是一种有效的识别蛋白质折叠的方法.  相似文献   

3.
支持向量机在处理非平衡数据集时常常不能取得良好的效果,因为其分类性能只考虑了总体分类精度,而忽略了不同类别样例之间的精度权衡.本文提出了一种基于样例分布的样例惩罚支持向量机,可以针对每一个样例根据其相应的分布特性选取惩罚以获得高敏感度的分类面.实验表明,该模型比标准支持向量机在非平衡数据上具有更好的性能.  相似文献   

4.
介绍BP神经网络与多分类支持向量机等分类模型的基本原理,并基于这两种方法对水质识别与分类的准确度进行实例比较研究,随机抽取了南昌市内2010-2013年水域水质的300组数据为样本,选取了pH,氨氮,Cl-,SO2-3,总硬度,硝酸盐氮为评价的主要特征。通过把训练后的模型在测试集中进行的检验对得到的模型进行评估,表明了BP神经网络和多分类支持向量机均可以较好地解决水质识别与分类过程中存在的复杂性,多变量,非线性等问题,相比较而言多分类支持向量机有较强的鲁棒性,预测结果更为精确稳定,将其应用到水质评价中具有一定的可行性。更多还原  相似文献   

5.
基于二叉树的多类SVM在Web文本分类中的应用研究   总被引:1,自引:0,他引:1  
针对现有多分类支持向量机算法所存在的训练时间长、判别速度慢等问题,提出了一种二叉树多类支持向量机算法,该算法能够有效减少支持向量的个数,从而减少训练时间.为了验证算法的有效性,将该算法分别同l-v-r算法和l-v-1算法进行了比较,实验结果表明,提出的算法是有效可行的.  相似文献   

6.
传感器漂移是影响气体传感检测系统稳定性的重要问题之一。本文提出了一种基于支持向量机的在线漂移补偿的分类模型设计方法,并在此基础上引入遗忘系数以应对漂移影响和保证数据集平衡状态,引入起学系数来避免因数据集不平衡而导致模型一直无法得到训练的极端情况出现。经实验验证,改进的分类模型能够延长传感器的可靠使用时间,并对短中期的分类效果有一定程度的提升,模型自训练过程无须人工参与,符合现实应用场景。本文提出的研究思路和方法对相关领域的研究有一定的参考意义。  相似文献   

7.
为解决车联网中CAN(controller area network)总线易受攻击的问题,提出了一个混合攻击入侵检测模型DGAOIDS。该模型利用无监督的DBN(deep belief nets)学习正常CAN报文数据的基础特征,并利用一个带注意力机制的GRU(gate recurrent unit)网络学习其时序特征,用单分类支持向量机对其进行分类;引入一个对电子控制单元规则学习得到的过滤器,综合过滤器与前述模型的分类结果得出最终的检测结果。实验结果表明,对于不同攻击,基于规则的过滤器的假阳率均为0;DGAO-IDS模型不仅在公开数据集HCRL中的检测结果优于对比模型HyDL-IDS和MD-LSTM,而且该模型在混合攻击数据集MixAt中的精确度达到了91.05%,与HyDL-IDS模型和MD-LSTM模型相比分别高6.55%与7.93%。  相似文献   

8.
在分析模糊C均值聚类算法与支持向量机回归的特点后,将二者结合,提出了模糊聚类支持向量机回归(FCM-SVR)算法,对空气中颗粒物浓度PM2.5进行预测.该方法首先利用模糊C均值聚类算法把一个复杂的数据集分成多个群体,再在每个群体上建立支持向量机回归(SVR)模型,然后进行集成,对区域空气的PM2.5浓度进行预测.预测结果分别与自组织竞争神经网络支持向量机回归(SOM-SVR)模型和单一的支持向量机回归(SVR)的结果进行比较.结果表明,FCM-SVR模型的预报准确率高于SOM-SVR模型和SVR模型.  相似文献   

9.
基于SVM土壤重金属污染评价的训练数据集构建   总被引:1,自引:0,他引:1  
支持向量机(support vector machine,SVM)用于土壤重金属污染评价时,其训练数据集的构建对模型准确性影响重大。本文对依据土壤环境质量国家标准生成数据集的方法(国标法)进行改进,提出实际测量数据集生成方法(实测法),并在实测法样本中添加国标法样本扩大训练数据集,进一步提高模型分类准确率。结果表明:对同一组实测样本进行分类,国标法模型准确率(53. 33%)低于实测法模型准确率(75. 56%);扩大后的数据集训练所得模型与实测法模型相比,分类60个实测样本时,准确率由88. 33%提高至98. 33%,分类45个实测样本时,准确率由75. 56%提高至82. 22%。  相似文献   

10.
孪生有界支持向量机(Twin Bounded Support Vector Machine,TBSVM)是近期提出的一种优秀的距离度量学习二分类算法。在TBSVM的目标函数中,使用L2范数距离作为度量准则,因此当训练样本中出现异常值或噪声时,L2范数距离的平方很容易夸大它们的影响。为了缓和这一问题,本文提出了一种鲁棒的基于L1范数距离度量的TBSVM分类算法(L1-TBSVM)。由于L1-TBSVM的目标函数中包含了非平滑的L1范数项,很难直接对它进行求解,故我们通过迭代增广向量来更新对角矩阵,直到目标函数值收敛到一个固定值,以此来获得最优解。该迭代算法简单有效,且易于实施。最后,通过合理的理论分析,以及在UCI数据集和人工数据集上的大量实验,检验了L1-TBSVM算法的可行性和有效性。  相似文献   

11.
核主元分析具有能较好地提取非线性特征的优势;支持向量机具有的非线性映射能力,且泛化能力强.它们在分类与识别中应用时都各有自己的优点,结合核主元分析和支持向量机的特点,提出一种基于核主元分析的支持向量机识别方法,用该方法分别对 ORL 人脸库和iris数据集中的数据进行分类与识别,结果表明:如果根据设计好的核函数的参数,可以得到极高的识别率.  相似文献   

12.
针对监督学习中模型拟合的参数优化问题,提出基于粒子群优化的差分隐私拟合框架。以满足差分隐私的改进指数机制选择粒子群优化算法中个体最优和群体最优粒子,进而驱动模型拟合参数的全局优化,为训练数据集提供差分隐私安全保障。在改进的指数机制中,以拟合函数构造适合于粒子群优化的打分函数,通过参数向量候选集和选定集实现个体最优和群体最优参数向量的更新迭代。给出满足差分隐私的理论证明以及在回归和支持向量机模型中的具体应用。  相似文献   

13.
提出了利用遗传算法对多核支持向量机的权系数进行寻优的方法GA-MKL,先选择表现能力最好的参数的单核构成多核,再利用遗传算法来对多核的核系数来寻优.采用该算法在UCI标准数据集上进行了实验,结果表明,该算法为多核SVM的系数选择提供了一种可行的方法.与单核SVM相比,该方法具有更好的分类能力,和其他多核学习算法相比,性能也有一定的提高.  相似文献   

14.
标准的支持向量回归机对于参数的选取有很强的依赖性.当选取的参数不恰当,或当数据受到噪声的污染时,回归的效果将受到较大的影响.笔者将训练点被正确划分的程度引入到支持向量回归机模型中,通过理论推导,提出了一种新的支持向量回归机TSVR,并给出了TSVR算法收敛的相关证明.同时,通过大量的数值实验,证明了TSVR具有较好的回归效果,其回归结果对参数的选取较不敏感,具有比标准的支持向量回归机更好的性质.  相似文献   

15.
最小二乘支持向量机的一种改进算法   总被引:2,自引:0,他引:2  
最小二乘支持向量机相比传统的支持向量机,丧失了解的稀疏性,影响了二次学习的效率。对原有的最小二乘支持向量机在稀疏性上进行了改进,并通过实验,对改进后的摄小二乘支持向量机的分类效果进行了验证。  相似文献   

16.
一种可伸缩的支持向量机的硬件实现方法   总被引:2,自引:1,他引:1       下载免费PDF全文
提出了支持向量机(Support Vector Machine)学习过程硬件实现的一种新的数字电路结构,它可以在保证向量机学习速度的同时,提高支持向量机的硬件资源利用效率;此外基于此结构的支持向量学习机还可以适用于低于设计数的样本集.由于该设计的灵活性以及其对硬件要求的减小,使得支持向量学习机可以更好、更方便地应用于嵌入式系统中.  相似文献   

17.
隐写分析盲检测存在着检测模型的检测准确性和通用性难以兼顾的问题.本文提出一种用于隐写分析的快速支持向量分类算法FC-SS2LM(fast classification for small sphere with two large margins),通过构造最小超球体和双边最大间隔隐写分析模型,使检测模型既能准确构造分类边界又能考虑不同隐写样本的分布特点,达到了兼顾检测准确性和通用性的目的.在BOSSBase标准图像库上对提出的隐写分析盲检测模型进行验证,实验结果表明,该方法在一定程度上克服了传统隐写分析模型通用性差的缺点,同时提高了实际应用中训练数据样本不平衡情况下的检测准确率.即使在实际应用中训练集样本过大、支持向量较多的情况下,采用该方法计算也可以减小算法复杂度,提高泛化能力和分类速度.  相似文献   

18.
为解决基于单节点架构的传统分类算法存在的时间效率差、分类准确率低等问题,提出了一种基于并行Adaboost-BP神经网络的海量图像分类方法.将BP神经网络作为弱分类器,由Adaboost算法组合15个BP神经网络的输出,构建了强分类器;充分利用了Hadoop平台下Map Reduce并行编程模型,提出了海量图像的自动分类模型,设计了并行Adaboost-BP神经网络算法的Map和Reduce任务.多组实验表明,相对于传统的AdaboostBP神经网络算法,提出的算法在Pascal VOC2007数据集和Caltech256数据集上的平均分类准确率分别提高了14.5%和26.0%,而且算法运行耗时少,系统加速比随集群节点个数增加而增加,在图像规模增加到20 000时,加速比几乎呈线性增长趋势.实验结果充分证明,提出的方法适合海量图像的自动分类和预测.  相似文献   

19.
基于支持向量机(SVM)泛化误差界,提出了一种精确且有效的多核学习方法.首先,应用SVM泛化误差界推导多核学习优化形式,并给出求解其目标函数微分的计算公式.然后,设计高效的迭代算法来求解该优化问题.最后,分析了算法的时间复杂度,并基于Rademacher复杂度给出了算法的泛化误差界,该泛化界在基核个数很大时依然有效.在标准数据集上的实验表明,相对于一致组合方法以及当前流行的单核和多核学习方法,所提出的方法具有较高的准确率.  相似文献   

20.
为了有效地结合标签信息与非负矩阵分解技术,提升现有的非负矩阵分解算法划分数据的性能,提出一种用于分类问题的基于二阶段迭代的非负矩阵分解模型(2-stage iterative nonnegative matrix factorization model,2-STGINMF),在阶段1,基于训练样本之间的关系和标签信息,用非负矩阵分解技术学习训练样本的置信度分布矩阵。在阶段2,根据训练样本的置信度分布矩阵,基于训练样本和测试样本之间的关系以及测试样本内部的关系,学习测试样本关于不同类别的置信度分布矩阵。此外,提出了一种迭代式训练机制解决标签稀疏性的问题。实验结果表明,与当前的一些机器学习方法和矩阵分解方法相比,本文提出的2-STGINMF模型在不同类型的数据分类问题上都达到了最优的性能且在训练样本较少时也能获得较好的分类结果。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号