首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 203 毫秒
1.
现有一类分类算法通常采用经典欧氏测度描述样本间相似关系,然而欧氏测度不能较好地反映一些数据集样本的内在分布结构,从而影响这些方法对数据的描述能力.提出一种用于改善一类分类器描述性能的高维空间一类数据距离测度学习算法,与已有距离测度学习算法相比,该算法只需提供目标类数据,通过引入样本先验分布正则化项和L1范数惩罚的距离测度稀疏性约束,能有效解决高维空间小样本情况下的一类数据距离测度学习问题,并通过采用分块协调下降算法高效的解决距离测度学习的优化问题.学习的距离测度能容易的嵌入到一类分类器中,仿真实验结果表明采用学习的距离测度能有效改善一类分类器的描述性能,特别能够改善SVDD的描述能力,从而使得一类分类器具有更强的推广能力.  相似文献   

2.
基于图的半监督分类方法近年来在模式识别和机器学习领域取得了广泛的关注.然而许多传统方法在构建邻域图时采用固定的邻域尺寸,且在模型训练过程中同等对待所有样本,忽略了样本间的差异性,从而影响了方法的效果.对此,文章提出一种基于自步学习和稀疏自表达的半监督分类方法,提取并保持数据的有判别信息的稀疏自表达结构,并基于自步学习机制提出一种新的自步学习项,将数据重要程度的软权重与硬权重相结合,来对样本进行学习.所提方法能够自适应建立数据间的关系,自动给出样本的重要程度并由易到难进行学习,且具有多类的显性非线性分类函数.几个标准数据集上的实验结果表明,所提算法具有较好的半监督分类效果.  相似文献   

3.
针对经典的流形学习算法Isomap在非线性数据稀疏时降维效果下降甚至失效的问题,提出改进的切近邻等距特征映射算法(Cut-Neighbors Isometric feature mapping,CN-Isomap).该算法在数据稀疏的情况下首先通过有效识别样本点的"流形邻居"来剔除近邻图上的"短路"边,然后再通过最短路径算法拟合测地线距离,使得拟合的测地线距离不会偏离流形区域,从而低维嵌入映射能够正确地反映高维输入空间样本点间的内在拓扑特征,很好地发现蕴含在高维空间里的低维流形,有效地对非线性稀疏数据进行降维.通过对Benchmark数据集的实验表明了算法的有效性.CN-Isomap算法是Isomap算法的推广,不仅能有效地对非线性稀疏数据进行降维,同样也适用于数据非稀疏的情况.  相似文献   

4.
油气田开发中有效储层和非有效储层的样本点存在混合带时,两类储层的划分是一个难点问题.从统计学上来看,其本质是一个含噪声的小样本二分类问题,可以采用机器学习方法,充分挖掘有试油成果的样本点的数据信息.分别利用线性判别分析、支持向量机、多层感知机神经网络建立储层分类模型,利用10次10折交叉验证法进行模型评估与优选,并利用全部样本点建立了有效的储层分类模型,最后将模型推广应用到样本分布的三种不同情形.结果表明,线性支持向量机模型具有最好的分类效果和很强的泛化能力,对于区分有效储层和非有效储层是有效的,可以在油气田开发中进行推广.  相似文献   

5.
图模式挖掘中的子图同构算法   总被引:1,自引:0,他引:1  
图模式挖掘问题在Web挖掘、生物信息学、社会关系等众多领域有广泛的应用,它涉及到子图的搜索以及子图的同构问题.这两个问题都具有相当高的计算复杂度,现有的子图同构问题大多采用最小编码算法,但对无标签图特别是对无标签无向图,该算法效率较底,从而子图的同构成为图模式挖掘问题的一个瓶颈.针对无标签图,以代数理论为基础,分别利用度序列和特征值构造了两种子图同构算法,用于对有向图和无向图的同构判别.最后对2个真实生物网络进行了仿真实验,结果表明,算法的效率优于现有算法.  相似文献   

6.
传统的机器学习方法无法捕捉到电力负荷需求的不确定性以及动态变化规律.本文将最新提出的隐马尔可夫模型在线学习算法应用于电力负荷预测研究,充分提取历史数据中的不确定性特征和动态变化规律,并结合分解算法,更精确利用数据中的动态变化特征,从而提高预测精度.算法基于隐马尔可夫概率预测模型,在获得新样本时对模型进行在线更新,适应最新数据;利用STL时序分解算法对负荷数据进行分解,使具有不同不确定性和动态变化规律的分量分离开,再分别使用在线学习算法对不同特征的分量进行预测,构造电力负荷预测组合算法.基于三个公开电力负荷数据集的测试结果表明,相比于单一的在线学习模型,本文提出的组合算法提高了预测精度,预测相对误差最高减少了27%.  相似文献   

7.
超像素级的高光谱图像分类是一类有代表性的谱-空分类方法.与像素级分类方法相比,超像素级的分类方法在分类精度和分类效率方面都有明显的优势.然而,超像素级分类算法的主要缺点是分类结果严重依赖于超像素的分割尺度.已有的工作表明,最优超像素分割尺度的获得往往是一个实验结果,很难预先确定.为了削弱这种依赖性,文章提出了一种基于超像素合并的超像素级高光谱分类算法.该方法首先采用局部模块度函数对所构造的稀疏加权超像素图进行合并;然后通过新定义的映射将每一个超像素块表示为一个样本点,使用流行的KNN方法对合并后的超像素图像进行超像素级分类.超像素的合并增强了空间信息在分类中的作用,有效地削弱了分类结果对超像素分割尺度的依赖性,并提高了分类精度.为了评价该方法的有效性,在4个公开的实际高光谱数据集上,将所提出的方法与一些竞争性的高光谱图像分类方法进行了实验和对比.实验结果和比较结果表明,该方法不仅有效削弱了超像素分割尺度对分类结果的影响,且在分类精度和计算效率方面都有十分明显的优势.  相似文献   

8.
为了进一步扩大因素空间中的因果分析法的应用领域,本文提出了多标准因果分析算法。因果分析是从多个条件因素到一个结果因素的分析,多标准因果分析则研究从多个条件因素到多个结果因素的因果分析。从应用领域的拓展来说,这一方法的应用可从多属性单体决策拓展到多属性群体决策,从单向归纳学习拓展到多向归纳学习,从单标签分类拓展到多标签分类.本文所建立的算法简捷,适于大数据的应用。  相似文献   

9.
基于蚁群算法的模糊分类系统设计   总被引:1,自引:0,他引:1  
提出了一种基于最大-最小蚁群算法的模糊分类系统设计方法.该方法通过两个阶段来实现:特征变量选择和模型参数优化.首先采用蚁群算法对特征变量进行选择,得到一组具有较高分辩性能的特征变量,提高模型的解释性;在模型结构确定后,蚁群算法从训练样本中提取信息对模型的参数进行优化,在保证模型精确性的前提下,构造具有较少变量数目及规则数目的模糊模型,实现了精确性与解释性的折衷.最后将本方法运用到Iris和Wine数据样本分类问题中,并将结果与其它方法进行比较,仿真结果证明了该方法的有效性.  相似文献   

10.
快速均值漂移图像分割算法研究   总被引:3,自引:0,他引:3  
Mean shift算法是一种搜索与样本点分布最接近模式的非参数统计方法.但它是一种迭代统计方法,要保证较高的数值计算精度需要较多的迭代次数,耗费较长的计算时间.为克服这一缺点,提出快速均值漂移图像分割算法.该算法在每次迭代时以前一次的聚类中心集合T动态地更新样本集S,并通过使用直方图缩小样本点的搜索范围进一步加快算法的收敛速度.实验结果表明该方法在保证图像分割质量的同时具有较快的收敛速度.  相似文献   

11.
为研究基因间的网络调控关系,通过贝叶斯网络方法将概率论知识与图论结合,有效构造了基因间的贝叶斯网络模型并进行了推理.针对一组白血病基因表达数据,首先进行数据标准化、离散化等预处理;其次使用决策树ID3算法求出基因间节点的顺序,并使用K2算法进行贝叶斯网络的结构学习,找出各基因间的网络拓扑结构;再次通过极大似然估计进行参数学习,求出网络中父节点与子节点间的概率依赖关系;最后对构建的贝叶斯网络模型进行了有效性验证,检验数据分析表明,贝叶斯网络对基因间调控关系的预测分析有较高精度.  相似文献   

12.
在多标签特征选择中,如果不考虑标签结构信息,只选取与单个标签相关的特征或只选取与整体标签集合相关的特征,则容易选取不重要特征,且也容易遗漏重要特征.为此,提出了一种基于标签组合的多标签特征选择算法——LG_MLFS.该算法的主要特点是:(1)考虑标签集合的组结构,并按照标签相关性进行分组.(2)利用标签的相关性结构信息...  相似文献   

13.
石子烨  梁恒  白峰杉 《计算数学》2014,36(3):325-334
数据分割研究的基本内容是数据的分类和聚类,是数据挖掘的核心问题之一,在实际问题中应用广泛.特别是针对有向网络数据的研究更是学科发展的前沿.但由于这类问题结构的非对称性,使得模型与算法的构建存在本质困难,因此相应的研究结果较少.本文借鉴分子动力学方法的思想,提出了一类新的网络数据半监督分类模型及算法.该算法不仅适用于关系对称的无向网络数据,而且适用于关系非对称的有向网络.最后针对期刊引用网络数据进行了数值实验,结果表明了模型及算法的可行性和有效性.  相似文献   

14.
基于稀疏重构的图像修复依赖于图像全局自相似性信息的利用和稀疏分解字典的选择,为此提出了基于分类学习字典全局稀疏表示模型的图像修复思路.该算法首先将图像未丢失信息聚类为具有相似几何结构的多个子区域,并分别对各个子区域用K-SVD字典学习方法得到与各子区域结构特征相适应的学习字典.然后根据图像自相似性特点构建能够描述图像块空间组织结构关系的全局稀疏最大期望值表示模型,迭代地使用该模型交替更新图像块的组织结构关系和损坏图像的估计直到修复结果趋于稳定.实验结果表明,方法对于图像的纹理细节、结构信息都能起到好的修复作用.  相似文献   

15.
随着机器学习和生物信息学的快速发展,癌症亚型分类成为当前研究热点之一.根据亚型的分类,可以指导癌症的治疗和预后.近年来,许多监督学习方法被用于癌症亚型分类.考虑到高维、样本数量少和数据不均衡等特点,本文首先利用LDA进行降维,其次利用SMOTE算法均衡数据,再利用Extra-Trees模型对癌症亚型进行分类,最后基于TCGA中9种癌症25种癌症亚型的3 296个样本来验证模型的有效性.实验结果表明,利用给出的模型进行癌症亚型分类具有很好的效果.  相似文献   

16.
针对目前较严重的雾霾污染,雾霾天气预报显得十分重要,通过将改进人工鱼群算法和分形学习相结合,提出了基于人工鱼群和分形学习的雾藕天气预报方法.首先对人工鱼群算法离散化改进,结合分形学习理论降维雾霾数据;其次运用支持向量机和5-折交叉验证技术分类分布可能不平坦的数据集;最后建立雾霾天气预报模型.实验结果表明,数据降维后更有利于提高分类器性能,与传统预报方法相比,预报性能更优,具有较高的稳定性和可信性.  相似文献   

17.
现有的子空间聚类方法以数据全局线性分布为前提,利用先验约束估计未标记数据点的低维子空间,并将其聚类到相应组中,对非线性结构的数据处理存在一定缺陷.受启发于深度学习以其强大的非线性学习表征能力在众多应用中取得巨大成功,文章在数据表示中加入成对约束,并运用流形正则化理论,采用k近邻构造全局相似度矩阵,通过与自编码器的联合学习,提出基于流形正则化与成对约束的深度半监督谱聚类算法(MPAE).该算法一方面在学习数据的低维表示时同时保留数据的可重构性和局部流形结构的全局特征,另一方面将已知样本间的成对约束信息融入目标优化设计,使学习到的低维特征更具有判别性,这在很大程度上提高了所得算法的聚类性能.实验结果表明文章算法能够取得理想的聚类结果.  相似文献   

18.
1 引 言 各种神经网络被广泛用来解决模式识别问题.进行模式识别时,常常要对模式进行分类从而达到识别的目的.线性可分模式的分类是其中最基本的一种.当前神经网络的一个热点问题集中在研究神经网络学习算法的理论基础,特别是学习算法的收敛性证明上.  相似文献   

19.
K-近邻算法(KNN)是模式识别众多算法中一个简单有效的分类方法,是最好的文本分类算法之一,在机器学习分类算法中占有相当大的地位,是最简单的机器学习算法之一,通过对数据空间结构局部的精细刻画,探寻对多种数据空间结构特点的泛化方法,提高算法的分类准确性.探索能够表征空间各向异性的方法,各向异性是不同属性维度上,类型变量随距离变化的变异程度.并采用标准数据集Banknote Dataset的数据空间结构进行分析,在分析其空间结构的基础上,进行改进K-近邻方法预测.改进后的KNN算法表现优异,很大程度上提高了算法预测的准确性.  相似文献   

20.
本文主要研究正态混合模型的贝叶斯分类方法.贝叶斯分类以后验概率最大为准则,后验概率需要估计相关的条件分布.对于连续型数据的分类,其数据由多个类别混合而成,仅用单一分布难以描述,此时混合模型是一个较好的选择,并且可由EM算法获得.模拟实验表明,基于正态混合模型的贝叶斯分类方法是可行有效的.对于特征较多的分类,不同特征对分类的影响不同,本文对每个特征应用基于正态混合模型的贝叶斯分类方法构建基本分类器,然后结合集成学习,用AdaBoost算法赋予每个分类器权重,再线性组合它们得到最终分类器.通过UCI数据库中实际的Wine Data Set验证表明,本文分类方法与集成学习的结合可以得到高准确率和稳定的分类.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号