共查询到20条相似文献,搜索用时 78 毫秒
1.
基于ICA的时间序列聚类方法及其股票数据分析中的应用 总被引:1,自引:0,他引:1
时间序列聚类分析是时间序列数据挖掘中的重要任务之一,通常由于时间序列数据的特殊结构,导致一般的聚类算法不能直接应用于时间序列数据.本文提出了一种基于独立成分分析与改进K-均值算法相结合的时间序列聚类算法,该算法首先利用独立成分分析对时间序列数据进行特征提取,然后利用改进K-均值聚类算法完成对时间序列特征数据的聚类分析,从而得到了一种新的基于特征的时间序列聚类方法.为了验证该方法的有效性和可行性,将其应用于实际的股票时间序列数据聚类分析中,取得了较好的数值结果. 相似文献
2.
为了发挥模糊理论在不确定性预测中的优势并保留模糊时间序列(FTS)预测模型的可解释性,本文针对目前应用广泛的模糊C均值聚类(FCM)算法进行改进,提出了一种基于布谷鸟搜索的FCM (CS-FCM)算法.将CS-FCM算法用于模糊时间序列模型的非均匀论域划分与数据的模糊化处理,建立一种基于CS-FCM算法的模糊时间序列预测模型.该算法可实现聚类中心的全局寻优,降低传统FCM算法易陷入局部极小值带来的误差,提高模型预测精度.实证分析结果表明, CS-FCM算法的适应度优于FCM算法,本文模型的预测误差小于经典模糊时间序列预测模型,验证了新预测模型的有效性. 相似文献
3.
4.
5.
6.
7.
针对时间序列数据的高维特性,在进行理论分析的基础上,利用主成分分析法提出了一种单变量时间序列数据降维的新方法,进而提出了基于主成分分析的单变量时间序列聚类方法。其主要思想是在线性空间中的同一组基下,用系数之间的相似性来刻画对应时间序列之间相似性,在理论分析过程中,首先对单变量时间序列数据集进行主成分分析,其次分析了单变量时间序列数据集、样本协方差矩阵的特征向量与主成分之间的关系,并证明了由主成分构成的向量组线性无关。为了进一步验证理论分析结果的正确性和所提算法的有效性,分别利用仿真数据和真实的股票数据进行了数值实验。 相似文献
8.
9.
《数学的实践与认识》2015,(13)
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响. 相似文献
10.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响. 相似文献
11.
12.
主成分方法用于聚类分析 总被引:4,自引:0,他引:4
本文提出一种新的聚类分析方法,它通过主成分分析简化数据,将原样品转化成单指标有序样品,然后利用有序样品的系统聚类法加以分类.其特点是计算量小,节省计算机内存.文中附有一个实例对算法进行说明. 相似文献
13.
土壤是一个多性状的连续体,其分类的首选方法是模糊聚类分析.但是模糊聚类分析中现有的基于模糊等价关系的动态聚类法和模糊c-均值法各有利弊,采用其中一种方法聚类肯定存在不足.为此集成两种聚类方法的优点,避其缺点,提出了用基于模糊等价关系的动态聚类方法和方差分析方法确定聚类数目和初始聚类中心,再用模糊c-均值法决定最终分类结果的集成算法,并将其应用到松花江流域土壤分类中,得到了较为切合实际的分类结果. 相似文献
14.
15.
16.
探讨基因表达数据的聚类分析方法,结合一种聚类结果的评判准则,应用于胎儿小脑基因表达数据,得到了最优的聚类结果,并做出了生物学解释.利用Matlab软件进行了仿真,利用模糊聚类Xie-Beni指数得到了最优聚类数,并把每一类对应的基因标号输出到txt文件,最后进行生物学解释.得到的小脑基因最优聚类数为3类,与生物学意义比较吻合,各类中的基因功能接近.基于FCM算法的基因模糊聚类是有效的,结果具有一定生物学意义,能对生物学基因聚类有一定指导作用. 相似文献
17.
模糊C均值算法的改进 总被引:13,自引:0,他引:13
模糊聚类分析方法具有较强的实用性,但传统的模糊C均值算法对数据集进行分类时有均分的趋势,对于数据集中各类样本数目相差较大的情况,其聚类结果不是很理想.因此,本文对FCM算法进行了改进,使之不但能够达到更好的分类效果,同时也更加适用于样本分类不均衡的聚类问题.文中还结合具体算例进行了聚类分析,得到了理想的分类效果. 相似文献
18.
基于福州市汽车路况数据,研究汽车行驶工况构建方法.用运动学片段分析法对GPS车速划分运动学片段,构建14个与速度相关的运动学特征.采用主成分分析和k均值聚类对运动学片段进行特征分析和分类.针对分类的运动学片段分别采用MH抽样算法,抽取新的速度时间序列,以划分新的运动学片段.基于短行程法对聚类的运动学片段和抽样的运动学片段分别构建工况,选取以平均速度为代表的10个特征的相对误差作为工况筛选标准,实验验证了基于原始运动学片段构建的工况和MH抽样运动学片段构建的工况与原数据误差均小于10%,其中7个特征误差小于5%,验证了MH抽样算法在构建工况时的有效性. 相似文献
19.
区间型符号数据是一种重要的符号数据类型,现有文献往往假设区间内的点数据服从均匀分布,导致其应用的局限性。本文基于一般分布的假设,给出了一般分布区间型符号数据的扩展的Hausdorff距离度量,基于此提出了一般分布的区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于本文提出的基于扩展的Hausdorff距离度量的SOM聚类算法的有效性优于基于传统Hausdorff距离度量的SOM聚类算法和基于μσ距离度量的SOM聚类算法。最后将文中方法应用于气象数据的聚类分析,示例文中方法的应用步骤与可操作性,并进一步评价文中方法在解决实际问题中的有效性。 相似文献
20.
针对一类具有不确定性区间数多指标信息的聚类分析问题,依据传统的基于数值信息的FCM聚类算法的思路,提出了一种新的聚类分析算法。章首先描述了具有区间数多指标信息的聚类分析问题;其次给出了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理;然后给出了基于区间数多指标信息的FCM聚类算法的计算步骤。该算法的特点是聚类中心的表现形式为精确的数值,给出的两个定理说明了该聚类算法的收敛性。最后,通过给出一个算例说明了本给出的聚类算法。 相似文献