首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
基于ICA的时间序列聚类方法及其股票数据分析中的应用   总被引:1,自引:0,他引:1  
时间序列聚类分析是时间序列数据挖掘中的重要任务之一,通常由于时间序列数据的特殊结构,导致一般的聚类算法不能直接应用于时间序列数据.本文提出了一种基于独立成分分析与改进K-均值算法相结合的时间序列聚类算法,该算法首先利用独立成分分析对时间序列数据进行特征提取,然后利用改进K-均值聚类算法完成对时间序列特征数据的聚类分析,从而得到了一种新的基于特征的时间序列聚类方法.为了验证该方法的有效性和可行性,将其应用于实际的股票时间序列数据聚类分析中,取得了较好的数值结果.  相似文献   

2.
为了发挥模糊理论在不确定性预测中的优势并保留模糊时间序列(FTS)预测模型的可解释性,本文针对目前应用广泛的模糊C均值聚类(FCM)算法进行改进,提出了一种基于布谷鸟搜索的FCM (CS-FCM)算法.将CS-FCM算法用于模糊时间序列模型的非均匀论域划分与数据的模糊化处理,建立一种基于CS-FCM算法的模糊时间序列预测模型.该算法可实现聚类中心的全局寻优,降低传统FCM算法易陷入局部极小值带来的误差,提高模型预测精度.实证分析结果表明, CS-FCM算法的适应度优于FCM算法,本文模型的预测误差小于经典模糊时间序列预测模型,验证了新预测模型的有效性.  相似文献   

3.
针对如何构建与股指期货联动性较好的现货组合问题,本文提出采用两阶段优化策略以提高组合的跟踪准确度。第一阶段,利用基于独立成分分析与模糊C均值算法相结合的时间序列聚类方法将沪深300股指期货对应的成分股进行聚类;第二阶段,对聚类之后的结果进行指数优化复制,以跟踪误差最小为目标,确定跟踪组合的成分股权重。实证研究表明,本文所提出的两阶段优化策略可以较好地改进指数跟踪效果。  相似文献   

4.
基于核函数的混合C均值聚类算法   总被引:2,自引:0,他引:2  
提出了一种基于核函数的混合C均值聚类算法.首先利用模糊C均值聚类算法和另一种类型的可能性C均值聚类算法的优点,设计出一种混合C均值聚类算法.然而鉴于该算法存在的不足,本文将Mercer核函数引入到该算法中,仿真实验结果证实了该方法的可行性和有效性.  相似文献   

5.
基于AFS拓扑和AFCM的模糊聚类分析   总被引:1,自引:0,他引:1  
在分析AFS方法和AFCM算法的基础上,设计了一个新的模糊聚类算法.它首先应用AFS拓扑理论计算得到数据的相对距离,然后将相对距离应用于改进后的AFCM算法中,并进行了聚类实验.实验结果证明这样的聚类算法优于传统的HCM、FCM聚类算法,而且该方法能应用于含有布尔值或模糊概念的聚类分析中.  相似文献   

6.
基于正交函数系和FCM算法,提出了一种新的时间序列聚类的方法.该方法首先通过一个非线性映射,将长度为n的时间序列映射到L_2空间,然后通过计算函数之间的距离得到时间序列之间的相似度.在此基础上,经过FCM算法实现时间序列的聚类.该方法克服了时间序列的高维数特征为时间序列聚类带来的计算困难.实验结果表明,对高维的时间序列,该方法在压缩率达到80%的情况下,依然具有良好的聚类效果.  相似文献   

7.
针对时间序列数据的高维特性,在进行理论分析的基础上,利用主成分分析法提出了一种单变量时间序列数据降维的新方法,进而提出了基于主成分分析的单变量时间序列聚类方法。其主要思想是在线性空间中的同一组基下,用系数之间的相似性来刻画对应时间序列之间相似性,在理论分析过程中,首先对单变量时间序列数据集进行主成分分析,其次分析了单变量时间序列数据集、样本协方差矩阵的特征向量与主成分之间的关系,并证明了由主成分构成的向量组线性无关。为了进一步验证理论分析结果的正确性和所提算法的有效性,分别利用仿真数据和真实的股票数据进行了数值实验。  相似文献   

8.
FCM聚类算法中模糊加权指数m的优选方法   总被引:23,自引:0,他引:23  
模糊c-均值(FCM)聚类算法是一种通过目标函数的极小化来获得数据集模糊划分的方法。其中,模糊加权指数m对FCM算法的分类性能有着重要的影响,而调用FCM算法进行模糊聚类分析时又必须给m赋值。因此,模糊加权指数m的优选研究就变得很有意义。基于模糊决策的方法本文给出了一种对m的优选方法,实验结果表明该方法是有效的。  相似文献   

9.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

10.
针对传统k-均值聚类算法事先必须获知类别数和难以确定初始聚类中心的缺点,建立了关于聚类中心和类别数k的双层规划模型,结合粒子群算法确定出聚类中心,通过在迭代过程中不断更新准则函数的方法搜索并确定出最佳类别数惫,基于所建模型,提出了一种改进的k-均值聚类算法,并将算法应用于冰脊表面形态分析中.结果表明,算法得到的聚类结果不但具有相邻类别边界清晰的优点,而且能够较好地反映出地理位置和生长环境对冰脊形成的影响.  相似文献   

11.
《数理统计与管理》2019,(3):450-459
时间序列数据的聚类是对面板数据或多维时间序列根据序列相似度进行分组。聚在同一组的时间序列具有相近的模型参数,尤其是当序列较短时聚类后能够得到更精确的参数估计。现存的时间序列聚类方法的距离度量大都基于时间序列的线性假设,但是现实中时间序列通常是非线性的。本文提出了一种基于Copula距离测度的非线性时间序列数据的聚类方法,它利用了Copula函数获取时间序列的非线性相依结构。作为一种非参数的距离度量,基于Copula函数的距离度量能够识别动态相关结构的相似性。大量的模拟实验和实证研究验证了我们所提方法的有效性。  相似文献   

12.
主成分方法用于聚类分析   总被引:4,自引:0,他引:4  
本文提出一种新的聚类分析方法,它通过主成分分析简化数据,将原样品转化成单指标有序样品,然后利用有序样品的系统聚类法加以分类.其特点是计算量小,节省计算机内存.文中附有一个实例对算法进行说明.  相似文献   

13.
土壤是一个多性状的连续体,其分类的首选方法是模糊聚类分析.但是模糊聚类分析中现有的基于模糊等价关系的动态聚类法和模糊c-均值法各有利弊,采用其中一种方法聚类肯定存在不足.为此集成两种聚类方法的优点,避其缺点,提出了用基于模糊等价关系的动态聚类方法和方差分析方法确定聚类数目和初始聚类中心,再用模糊c-均值法决定最终分类结果的集成算法,并将其应用到松花江流域土壤分类中,得到了较为切合实际的分类结果.  相似文献   

14.
聚类分析是数据挖掘的一个重要研究课题,模糊聚类是聚类分析的一个有效手段。本文在分析AFS方法和FCM算法的基础上,设计了一个基于AFS拓扑和FCM的模糊聚类算法,进行iris数据的聚类实验证明它聚类结果优于传统的FCM聚类算法,具有很好的推广性和实际应用价值。  相似文献   

15.
《数理统计与管理》2019,(6):986-995
基于距离的函数型聚类分析包含曲线拟合和聚类两个独立步骤,最优曲线拟合未必有利于类别信息的提取和保留。根据曲线拟合与聚类分析的计算过程,重新梳理了函数型聚类算法;基于距离度量,提出了同时考虑拟合和聚类效果的函数型聚类一步法;在交替方向乘子法(ADMM)框架下推导并给出了迭代求解算法。模拟试验结果显示,该函数型聚类算法有助于提高聚类精度;针对北京市空气质量监测站点二氧化氮(NO_2)污染物小时浓度数据的实例验证分析表明,该函数型聚类算法对不同类别空气质量监测点具有更好的区分度。  相似文献   

16.
探讨基因表达数据的聚类分析方法,结合一种聚类结果的评判准则,应用于胎儿小脑基因表达数据,得到了最优的聚类结果,并做出了生物学解释.利用Matlab软件进行了仿真,利用模糊聚类Xie-Beni指数得到了最优聚类数,并把每一类对应的基因标号输出到txt文件,最后进行生物学解释.得到的小脑基因最优聚类数为3类,与生物学意义比较吻合,各类中的基因功能接近.基于FCM算法的基因模糊聚类是有效的,结果具有一定生物学意义,能对生物学基因聚类有一定指导作用.  相似文献   

17.
模糊C均值算法的改进   总被引:13,自引:0,他引:13  
模糊聚类分析方法具有较强的实用性,但传统的模糊C均值算法对数据集进行分类时有均分的趋势,对于数据集中各类样本数目相差较大的情况,其聚类结果不是很理想.因此,本文对FCM算法进行了改进,使之不但能够达到更好的分类效果,同时也更加适用于样本分类不均衡的聚类问题.文中还结合具体算例进行了聚类分析,得到了理想的分类效果.  相似文献   

18.
基于福州市汽车路况数据,研究汽车行驶工况构建方法.用运动学片段分析法对GPS车速划分运动学片段,构建14个与速度相关的运动学特征.采用主成分分析和k均值聚类对运动学片段进行特征分析和分类.针对分类的运动学片段分别采用MH抽样算法,抽取新的速度时间序列,以划分新的运动学片段.基于短行程法对聚类的运动学片段和抽样的运动学片段分别构建工况,选取以平均速度为代表的10个特征的相对误差作为工况筛选标准,实验验证了基于原始运动学片段构建的工况和MH抽样运动学片段构建的工况与原数据误差均小于10%,其中7个特征误差小于5%,验证了MH抽样算法在构建工况时的有效性.  相似文献   

19.
区间型符号数据是一种重要的符号数据类型,现有文献往往假设区间内的点数据服从均匀分布,导致其应用的局限性。本文基于一般分布的假设,给出了一般分布区间型符号数据的扩展的Hausdorff距离度量,基于此提出了一般分布的区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于本文提出的基于扩展的Hausdorff距离度量的SOM聚类算法的有效性优于基于传统Hausdorff距离度量的SOM聚类算法和基于μσ距离度量的SOM聚类算法。最后将文中方法应用于气象数据的聚类分析,示例文中方法的应用步骤与可操作性,并进一步评价文中方法在解决实际问题中的有效性。  相似文献   

20.
针对一类具有不确定性区间数多指标信息的聚类分析问题,依据传统的基于数值信息的FCM聚类算法的思路,提出了一种新的聚类分析算法。章首先描述了具有区间数多指标信息的聚类分析问题;其次给出了基于区间数多指标信息的关于最优划分和最优聚类中心确定的两个定理;然后给出了基于区间数多指标信息的FCM聚类算法的计算步骤。该算法的特点是聚类中心的表现形式为精确的数值,给出的两个定理说明了该聚类算法的收敛性。最后,通过给出一个算例说明了本给出的聚类算法。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号