首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 10 毫秒
1.
分类大规模数据的核向量机方法研究   总被引:1,自引:0,他引:1  
标准的支持向量机算法需要求解二次规划问题,因此,在处理大规模样本的时候,求解二次规划问题的时间复杂度和空间复杂度就成为支持向量机应用的一个瓶颈.核向量机将传统支持向量机中的二次规划问题转化为求解最小包围球问题,从而显著降低了二次规划的复杂程度.使用核向量机对大规模数据进行分类,所选用的数据样本数均超过2000,并与标准的支持向量机作了对比实验结果表明:核向量机在处理大规模数据分类时,比标准的支持向量机计算复杂度低,训练速度快,耗费空间少.  相似文献   

2.
面向循证医学网络文献的SVM分类方法   总被引:1,自引:1,他引:1  
支持向量机(support vector machine,SVM)是在统计学习理论基础上发展起来的一种新的机器学习方法,是一种高效的分类识别方法.首先分析支持向量机原理,然后提出一种使用Bagging组合学习方法改进SVM算法的网页分类方法.基于循证医学网络文献分类的实验表明,该方法使训练数据规模大大减小,且比传统的SVM算法分类性能更好,具有较好的精确率和召回率.  相似文献   

3.
基于自适应核函数的支持向量数据描述算法   总被引:4,自引:0,他引:4  
为进一步提高支持向量分类器的分类精度和运行速度,提出了基于自适应核函数的支持向量数据描述分类算法。该算法的核心思想为:根据信息几何中保角映射的方法构造数据驱动的核函数修正算法,然后再利用修正的核函数训练支持向量数据描述分类算法。试验结果表明,该方法具有较好的分类精度和较快的运行速度。  相似文献   

4.
提出一种基于数据关系(Data Relationship,DR)的多分类支持向量机(Support Vector Machine,SVM)学习算法(Multi-Classification SVM Algorithm Based on Data Relationship,DR-SVM).DR-SVM算法根据每类数据的关系(如向量积等)获取子学习嚣的冗余信息,从而优化多分类器组,然后通过经典的SVM算法训练分类器组.算法在简化分类器组的同时可对多类数据分类问题获得满意的泛化能力,在标准数据集上的实验结果表明,与经典的SVM多分类方法相比,DR-SVM具有更好的泛化性能,尤其对单个类别精度要求较高的数据尤其有效.  相似文献   

5.
可变惩罚系数比例的分类SVM模型   总被引:3,自引:2,他引:1  
为了解决常规分类SVM模型在样本比例相差较大情况下的不适用问题,提出了可变惩罚系数比例的分类SVM模型.在所提出的模型中,惩罚系数的比例以其对应样本数的反比来确定.最后,在90:10样本比例下,分别用常规SVM模型和所提出的SVM模型得到相应的分割线,并将其进行比较,实验结果验证了本模型的有效性.虽然本研究所采用的核函数是最简单的向量内积,但所提出的模型对于所有的核函数都是适用的.  相似文献   

6.
大数据环境下,为了提高支持向量机(support vector machines, SVM)在网络安全应用环境下的性能,提出了面向大数据的超启发式SVM网络安全框架。所提超启发式SVM框架由SVM和超启发式框架组成,超启发式框架的作用是生成配置参数,并将其发送到SVM,SVM使用生成的配置来解决给定的问题,然后将成本函数发送到超启发式框架。超启发式框架分为高层策略和低层启发式,高层策略具有搜索性能,可以控制选择低层启发式并生成新的SVM配置;低层启发式算法构成了一组特定于问题的启发式算法,使用不同的规则实现对SVM配置搜索空间的探索。该框架自适应地集成了基于分解和基于Pareto方法的优点,近似SVM配置的Pareto集,解决了启发式框架的优化问题。实验结果表明,所提框架性能优于其他算法,说明框架的有效性。  相似文献   

7.
采用持向量机方法构建了居民出行方式选择模型,使用网格搜索方法选择支持向量参数,避免参数选择的随机性,分析不同核函数对模型构建的影响。研究表明,采用多项式核函数、RBF核函数构建的支持向量机模型对居民出行方式预测精度较高,所构建的模型可用于居民出行方式预测;在支持向量机核函数选择中,优先选择RBF核函数,其次为多项式核函...  相似文献   

8.
为解决多类分类问题,在分析SVM决策树分类器及存在问题的基础上,通过引入类间可分离性测度,并将其扩展到核空间,提出一种改进的SVM决策树分类器。实验表明了该分类算法对提高分类正确率的有效性。  相似文献   

9.
基于盖根鲍尔正交多项式,提出了向量形式的盖根鲍尔多项式,并由此衍生出一类新的支持向量机核函数——盖根鲍尔核函数.文章对盖根鲍尔核函数性态以及鲁棒性与泛化性能等方面做了研究.  相似文献   

10.
针对风速随机性大、影响因素多、预测准确度不高的情况,基于支持向量机与信息几何的统计学关联性,从信息几何学角度分析核函数的几何结构,构造数据依赖核函数,并与支持向量机回归相结合,形成数据依赖核支持向量机回归(Data Dependent Kernel-SVR,DDK-SVR)方法.将该方法用于风速预测中,建立DDK-SVR风速预测模型,并将预测结果与传统支持向量机、神经网络方法进行对比.结果表明,DDK-SVR方法具有更高的预测精度.  相似文献   

11.
将核主元分析(PCA)与支持向量机(SVM)相结合并将其应用到电子鼻模式识别单元中,实现了数据降维和改善分类器性能。实验结果表明与单纯的应用支持向量机方法进行分类相比,此方法具有更高的识别率。  相似文献   

12.
针对支持向量数据描述面临的噪声数据敏感问题和大规模数据分类问题,提出面向大规模数据的模糊支持向量数据描述.该方法引入模糊理论和核心向量机,不仅在构造最小超球体时忽略对分类结果影响较小的数据,而且将支持向量数据描述的适用范围从中小规模数据扩展到大规模数据.人工数据集和标准数据集上的实验表明新算法的有效性.  相似文献   

13.
提出一种选择支持向量分类(Support Vector Classification,SVC)最优核参数的算法,称为MI(Maximum Isolation)算法,通过定义样本间的独立性,可以获得最优核参数和相应的最优学习模型。该算法可以在支持向量机训练之前得到最优的核参数,计算代价较小,实验证明所提出的算法简单有效。  相似文献   

14.
SVM是人脸识别中最常使用的一种机器学习领域算法,它通过距离概念得到对数据分布的结构化描述,降低了对数据规模的要求,适合处理人脸图像这种小样本训练集的分类问题。其中SVM的核函数的选择对分类精度影响很大,全局核函数的预测函数对输出进行正确预测的能力较高,而局部核函数具有较强的学习能力,兼顾两者特点,使用结合RBF核和Sigmoid核的混合核来设计SVM分类器进行识别。针对ORL库进行PCA特征提取,然后使用基于混合核的SVM分类器进行识别分类。实验结果表明,在识别率上,基于该混合核函数的SVM分类器比基于普通核函数SVM分类器要更占优势。  相似文献   

15.
基于数据分割和近邻对的快速SVM分类算法   总被引:1,自引:0,他引:1  
大样本的学习是支持向量机领域中的一个重要课题。基于数据分割和邻近对策略,提出了一种新的支持向量机分类算法。在新的算法中,首先利用c均-值聚类分别对数据集中的正负类进行聚类,把大数据集分割成互不相交的子集合;然后来自正负类的子集合两两组合形成多个二分类问题,并用SMO算法求解;最后用邻近对策略对未知数据进行识别。为了验证新算法的有效性,把它应用于5个UCI数据集,并和SMO算法做了比较。结果表明:新算法不仅大大地减少了大样本学习的训练时间,而且相应的测试精度几乎没有降低。  相似文献   

16.
基因表达谱数据分布不平衡、噪声巨大,当用σ值很小的二阶软间隔高斯核支持向量机分类的时候,容易使大多数训练数据被分到占统治地位的类中。因此,B rown等认为,为了分别控制两类错误数,可以在核矩阵K中增加对角矩阵λn+NI。通过选择合适的λ,可以使属于占统治地位的类的样本上产生较小的拉格朗日乘子;而处于次要地位的类的样本上产生较大的拉格朗日乘子。但是,目前没有统一的方法选择λ。因此,提出了一种根据b值确定λ的最优值的方法。实验表明,该方法的分类效果在同等条件下好于传统的方法。  相似文献   

17.
孙秋凤 《科学技术与工程》2013,13(1):126-129,135
MicroRNA是一种单链RNA小分子,是由具有发夹结构的、更长的单链RNA前体经加工后生成.相比microRNA序列本身而言,其前体序列和二级结构隐含了更多的可识别特征与信息.因此可利用加权Levenshtein距离,结合其前体序列和二级结构构造一个指数核函数.结合SVM构造识别模型,鉴别真假前体.在用5折叠法得到最佳识别模型后,对人类数据进行测试.实验结果显示,新方法表现出了较好的识别精度,和较高的敏感性与特异性.  相似文献   

18.
 基于P300事件相关电位的脑机接口(BCI)系统中,有效的P300特征提取及分类是系统开展后续工作的关键。应用时间序列自回归(AR)模型及支持向量机(SVM)算法对脑电信号进行P300分类;对10导联脑电数据分别分段,并对每段建立AR模型;采用最小二乘法进行AR模型系数估计,由估计出的系数序列构成特征向量,送入SVM进行模式分类。实验针对BCI Competition Ⅲ dataset Ⅱ数据集进行了方法验证,提出的方法在15试次情况下识别正确率达93.5%。实验及数据分析结果表明,应用SVM分类器对AR模型提取出的系数序列特征向量进行分类,具有较好的系统识别正确率,可为实现基于P300的BCI系统实际应用奠定理论和实验基础。  相似文献   

19.
针对传统线性支持向量机在训练数据集时均等对待每一维输入特征,以及在原始空间直接分类造成预测准确率低的问题,提出低阶多项式数据映射和特征加权相结合的方法,来提高线性支持向量机的分类性能。该方法首先将每个样本映射到多项式核对应的2 阶显式特征空间,从而增加样本的隐性信息,然后使用模糊熵特征加权算法计算每一维特征的权重,通过权重衡量特征对分类结果的贡献大小。从不同数据库选取7个数据集进行测试,在训练时间和预测准确率2个方面将该方法与核支持向量机、线性支持向量机的其他改进算法进行比较。结果显示,随着数据集规模的扩大,训练时间降低一个数量级,预测准确率在一些数据集上取得与核支持向量机相接近的效果。结果表明:所提方法可以有效提高线性支持向量机的整体性能。  相似文献   

20.
为解决支持向量机在分类识别前需要利用已知训练集进行训练的问题,本文提出了一种基于k均值的对无标识数据进行分类的支持向量机分类算法。首先利用k均值算法将未知数据划分成某个数量的子集,然后对新数据进行支持向量机训练得到决策边界与支持矢量,最后对无标识数据进行分类。模拟结果表明:训练时消耗的CHU时间为1.8280秒,支持向量个数为60时,分类错误率小于2%。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号