共查询到19条相似文献,搜索用时 62 毫秒
1.
《系统科学与数学》2020,(8)
现有的子空间聚类方法以数据全局线性分布为前提,利用先验约束估计未标记数据点的低维子空间,并将其聚类到相应组中,对非线性结构的数据处理存在一定缺陷.受启发于深度学习以其强大的非线性学习表征能力在众多应用中取得巨大成功,文章在数据表示中加入成对约束,并运用流形正则化理论,采用k近邻构造全局相似度矩阵,通过与自编码器的联合学习,提出基于流形正则化与成对约束的深度半监督谱聚类算法(MPAE).该算法一方面在学习数据的低维表示时同时保留数据的可重构性和局部流形结构的全局特征,另一方面将已知样本间的成对约束信息融入目标优化设计,使学习到的低维特征更具有判别性,这在很大程度上提高了所得算法的聚类性能.实验结果表明文章算法能够取得理想的聚类结果. 相似文献
2.
主要针对几种典型数据的多流形结构分析问题进行了研究.综合分析多种谱聚类算法优缺点,以谱多流形聚类算法为主线,结合实验结果对多种谱聚类算法进行了分析,最后针对数据空间密度不均匀的情况对谱多流形聚类算法进行了一定的改进,提出了一种基于自适应近邻值的谱多流形聚类算法,并通过实验证明其达到了混合多流形聚类的目的. 相似文献
3.
4.
5.
《数学的实践与认识》2013,(23)
图像分割就是把感兴趣的区域从背景中分割、提取出来,为了使分割出来的图像特征信息完整,根据图像的灰度值和空间距离构造了一种相似度函数,得到基于图的灰度值的相似度矩阵,将图像分割转化为图论最小割问题,然后运用谱聚类算法进行分割.针对谱聚类算法运行所需的内存空间和运算量大的特点,提出一种考虑概率因素的随机抽样谱聚类算法.在具体实施时,为了减少背景噪声对分割结果的影响,对图像进行了滤波预处理.结果表明,算法稳定性好,相对现有算法,分割效果得到改善. 相似文献
6.
《数学的实践与认识》2013,(20)
针对传统的谱聚类算法不适合处理多尺度问题,引入一种新的相似性度量—密度敏感的相似性度量,该度量可以放大不同高密度区域内数据点间距离,缩短同一高密度区域内数据点间距离,最终有效描述数据的实际聚类分布.本文引入特征间隙的概念,给出一种自动确定聚类数目的方法.数值实验验证本文所提的算法的可行性和有效性. 相似文献
7.
流形学习是一种有效的数据处理工具.聚类问题种类繁多,目前没有一种可以同时解决多种聚类问题的方法.提出的谱多流形聚类方法可以弥补这一缺陷.方法从相似性矩阵的角度出发,充分利用流形采样点所内含的自然的局部几何结构信息来辅助构造合适的相似性矩阵并进而发现正确的流形聚类.最后通过大量算例说明方法可行. 相似文献
8.
传统的聚类方法由于无法提取样本和变量间的局部对应关系,并且当数据具有高维性和稀疏性时表现不佳,因此学者们提出了双向聚类,基于样本和变量间的局部关系,同时对样本和变量进行聚类,形成一系列子矩阵的聚类结果。近年来,双向聚类发展迅速,在基因分析、文本聚类、推荐系统等领域应用广泛。首先,对双向聚类方法进行梳理与归纳,重点阐述稀疏双向聚类、谱双向聚类和信息双向聚类三类方法,分析它们之间的区别和联系,并且介绍这三类方法在多源数据的整合分析、多层聚类、半监督学习以及集成学习上的发展现状和趋势;其次,重点介绍双向聚类在基因分析、文本聚类、推荐系统等领域的应用研究情况;最后,结合大数据时代的数据特征和双向聚类存在的问题,展望双向聚类未来的研究方向。 相似文献
9.
基于数据流形结构的聚类方法及其应用研究 总被引:1,自引:0,他引:1
随着信息社会的不断发展,人类已经进入了信息爆炸时代,海量的数据使数据处理变得繁琐复杂,因此如何对现有的高维数据降维、聚类,并在一定程度上消除高维数据中存在的噪声是解决该问题的关键.基于相关的理论知识采用先降维后聚类的步骤,把高维数据按照子空间结构和流形结构两种情况分类,运用稀疏子空间聚类、谱多流形聚类、K-manifolds方法进行建模求解,通过对各种方法的对比,得出谱多流形聚类方法运行速度快,聚类准确度高,是最具有一般性特征的模型. 相似文献
10.
《数学的实践与认识》2017,(17)
提出了一种利用空间信息的分层抽样方法.首先,利用多项式回归模型估计各坐标之间的空间相关系数,然后对空间相关系数矩阵进行谱聚类分析,最终依据上述结果对总体进行分层.通过与其他抽样方法的比较证明提出的基于网络聚类的空间分层方法具有比较优良的分层效果. 相似文献
11.
12.
本文用Fuzzy数学的观点探讨了Fuzzy聚类分析,并通过对脊髓灰质炎病毒抗体水平的Fuzzy聚类分析,获得了良好的聚类效果,为该项问题的研究提供了科学依据。 相似文献
13.
14.
为了有效提高深度学习模型在实际应用场景中的泛化能力,近年来工业界和学术界对神经网络训练阶段所采用的加噪技巧给予了高度关注.当网络模型架构中的待求参数固定时,修正方程的思想可以被用来刻画随机训练策略下数据特征的传播过程,从而看出在恰当位置添加剪枝层后的残差网络等价于随机微分方程的数值离散格式.建立这两者间的对应关系使得我们可以将残差网络的随机训练过程与求解倒向柯尔莫哥洛夫方程的最优控制问题联系起来.该发现不仅使得人们可以从微分方程及其最优控制的角度来研究加噪技巧所带来的正则化效应,同时也为构建可解释性强且有效的随机训练方法提供了科学依据.本文也以二分类问题作为简例来对上述观点做进一步的阐述和说明. 相似文献
15.
本文根据高校系资料室的实际工作情况,应用系统分析方法研究如何提高服务质量和管理水平,以充分发挥系资料室的作用。 相似文献
16.
A soliton hierarchy of multicomponent AKNS equations is generated from an arbitraryorder matrix spectral problem,along with its bi-Hamiltonian formulation.Adjoint symmetryconstraints are presented to manipulate binary nonlinearization for the associated arbitraryorder matrix spectral problem.The resulting spatial and temporal constrained fiows are shownto provide integrable decompositions of the multicomponent AKNS equations. 相似文献
17.
针对界约束二次规划的分枝定界法中出现的紧、松弛策略,结合聚类分析方法,给出了新的剖分边的选取原则,把球约束二次规划作为子问题,使得原问题整体最优值的上、下界能较快的达到. 相似文献
18.
Bradley S. Price Charles J. Geyer Adam J. Rothman 《Journal of computational and graphical statistics》2013,22(2):439-454
This article proposes a penalized likelihood method to jointly estimate multiple precision matrices for use in quadratic discriminant analysis (QDA) and model-based clustering. We use a ridge penalty and a ridge fusion penalty to introduce shrinkage and promote similarity between precision matrix estimates. We use blockwise coordinate descent for optimization, and validation likelihood is used for tuning parameter selection. Our method is applied in QDA and semi-supervised model-based clustering. 相似文献