首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到18条相似文献,搜索用时 453 毫秒
1.
基于误差理论的区间主成分分析及其应用   总被引:1,自引:0,他引:1  
针对区间数样本,传统的主成分分析需进行拓展。首先讨论了区间样本数据的两种主要来源,即观测误差和符号数据分析。然后将区间数看作一个由中点和半径构成的具有一定误差的数,从误差理论出发,研究基于误差传递公式的区间主成分分析方法,并获得以区间数为表达形式的主成分。最后,结合我国2005年第四季度股票市场的数据进行了实证分析。结果表明,面对海量数据,区间PCA较传统PCA更容易从总体上把握样本的属性。  相似文献   

2.
《数理统计与管理》2014,(4):634-641
基于Hausdorff距离用于定义两个紧集之间距离的考虑,将区间数视为一个紧集,定义了区间数之间的距离,并研究了区间向量的距离,从而得到聚类分析中两个样品间的距离。进一步定义了两个类之间的Hausdorff距离。为消除量纲对聚类结果的影响,研究了区间数据的标准化。基于此,给出了区间数据系统聚类算法。采用随机模拟的方法,对文中方法进行有效性评价,结论表明,Hausdorff距离法的聚类有效性在所有设计的实验条件下都要优于传统的欧式距离法。最后,基于符号数据分析的思想构造区间数据,给出了对多种动物群体按其身高、体重等生理特征进行聚类分析的算例。  相似文献   

3.
区间型符号数据是一种重要的符号数据类型,现有文献往往假设区间内的点数据服从均匀分布,导致其应用的局限性。本文基于一般分布的假设,给出了一般分布区间型符号数据的扩展的Hausdorff距离度量,基于此提出了一般分布的区间型符号数据的SOM聚类算法。随机模拟试验的结果表明,基于本文提出的基于扩展的Hausdorff距离度量的SOM聚类算法的有效性优于基于传统Hausdorff距离度量的SOM聚类算法和基于μσ距离度量的SOM聚类算法。最后将文中方法应用于气象数据的聚类分析,示例文中方法的应用步骤与可操作性,并进一步评价文中方法在解决实际问题中的有效性。  相似文献   

4.
研究了基于数据的区间数智能决策分析,提出了一种基于区间数的支持向量域多分类软计算方法,该方法可以直接处理特征空间为区间数的多分类问题,拓展了支持向量域多分类算法应用的范围.  相似文献   

5.
武丹  李星野 《经济数学》2019,36(4):20-26
提出了一种将主成分分析与Fourier变换组合的资产投资组合方法.对于N个资产,首先利用主成分分析中第一主成分确定各资产的组合权重并建立投资组合,利用Fourier变换获得该组合残差的复合周期趋势,最后利用ARMA模型对趋势残差进行区间预测.为使资产保值,当组合股价达到最低点时,各资产以第一主成分对应权重进行组合建仓;当组合股价反向上升达到最高点时,则以第N主成分对应权重进行组合并调仓.在实证模拟方面,选取2016年1月4日-2018年6月8日全球股票主要指数的收盘价数据进行实证分析.模拟结果表明:基于主成分分析的投资组合在收益及资产保值方面表现更佳.  相似文献   

6.
对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。  相似文献   

7.
针对现实中经符号分析形成的区间函数型数据,提出时变距离函数概念,并将其应用于区间协方差计算.利用函数型主成分分析方法推导出相应的特征函数,提出了基于时变距离函数的多变量区间函数型主成分分析方法.通过实证证明:区间函数型主成分分析以区间化获取了更多信息,以函数化放松了假定,增加了可视化水平,能够有效解决区间函数型数据的特征提取和综合评价问题.  相似文献   

8.
《数理统计与管理》2013,(6):1071-1078
现有的区间型符号数据的研究大多假定个体在区间内服从均匀分布,实际上往往并非如此.针对该问题,研究了一般分布条件下区间型符号数据的系统聚类方法.阐述了一般分布区间型符号数据的定义,在一般分布的区间型符号数据的描述统计基础上,给出了基于Hausdorff距离的一般分布的区间型符号数据系统聚类算法,并通过随机模拟对聚类有效性进行评价。结果表明:与个体服从均匀分布的假设相比,一般分布的区间型符号数据的系统聚类分析有效性更好.最后将文中方法应用于电子商务客户价值的评价,进行了应用研究.  相似文献   

9.
针对时间序列数据的高维特性,在进行理论分析的基础上,利用主成分分析法提出了一种单变量时间序列数据降维的新方法,进而提出了基于主成分分析的单变量时间序列聚类方法。其主要思想是在线性空间中的同一组基下,用系数之间的相似性来刻画对应时间序列之间相似性,在理论分析过程中,首先对单变量时间序列数据集进行主成分分析,其次分析了单变量时间序列数据集、样本协方差矩阵的特征向量与主成分之间的关系,并证明了由主成分构成的向量组线性无关。为了进一步验证理论分析结果的正确性和所提算法的有效性,分别利用仿真数据和真实的股票数据进行了数值实验。  相似文献   

10.
运用在线理论研究多支股票算法交易策略。在El-Yaniv等人研究基础上,构造了单支股票买入问题的在线策略,证明该策略为最优在线策略;将构造的单支股票交易策略应用到多支股票交易策略问题中,设计了多支股票交易策略算法,并以每支股票收益加权进行投资组合;最后选择上证A股二十支股票从2009年到2012年的交易时间价格数据验证本文所提策略有效性。将20支股票随机抽取10支组成一组,选4组分别进行验证,结果表明本文所给策略对于任意选择的多支股票有较好收益。对交易周期分别选取10个偶数长度进行验证,发现交易周期为18天时平均收益最大,平均收益率为5.2%。  相似文献   

11.
This article proposes a new approach to principal component analysis (PCA) for interval-valued data. Unlike classical observations, which are represented by single points in p-dimensional space ?p, interval-valued observations are represented by hyper-rectangles in ?p, and as such, have an internal structure that does not exist in classical observations. As a consequence, statistical methods for classical data must be modified to account for the structure of the hyper-rectangles before they can be applied to interval-valued data. This article extends the classical PCA method to interval-valued data by using the so-called symbolic covariance to determine the principal component (PC) space to reflect the total variation of interval-valued data. The article also provides a new approach to constructing the observations in a PC space for better visualization. This new representation of the observations reflects their true structure in the PC space. Supplementary materials for this article are available online.  相似文献   

12.
汪漂 《运筹与管理》2021,30(10):159-164
鉴于传统预测方法一直基于“点”来衡量时间序列数据,然而现实生活中在给定的时间段内许多变量是有区间限制的,点值预测会损失波动性信息。因此,本文提出了一种基于混合区间多尺度分解的组合预测方法。首先,建立区间离散小波分解方法(IDWT)、区间经验模态分解方法(IEMD)和区间奇异普分析方法(ISSA)。其次,用本文构建的IDWT、IEMD和ISSA对区间时间序列进行多尺度分解,从而得到区间趋势序列和残差序列。然后,用霍尔特指数平滑方法(Holt's)、支持向量回归(SVR)和BP神经网络对区间趋势序列和残差序列进行组合预测得到三种分解方法下的区间时间序列预测值。最后,用BP神经网络对各预测结果进行集成得到区间时间序列最终预测值。同时,为证明模型的有效性进行了AQI空气质量的实证预测分析,结果表明,本文所提出基于混合区间多尺度分解的组合预测方法具有较高的预测精度和良好的适用性。  相似文献   

13.
The focus of this paper is to propose an approach to construct histogram values for the principal components of interval-valued observations. Le-Rademacher and Billard (J Comput Graph Stat 21:413–432, 2012) show that for a principal component analysis on interval-valued observations, the resulting observations in principal component space are polytopes formed by the convex hulls of linearly transformed vertices of the observed hyper-rectangles. In this paper, we propose an algorithm to translate these polytopes into histogram-valued data to provide numerical values for the principal components to be used as input in further analysis. Other existing methods of principal component analysis for interval-valued data construct the principal components, themselves, as intervals which implicitly assume that all values within an observation are uniformly distributed along the principal components axes. However, this assumption is only true in special cases where the variables in the dataset are mutually uncorrelated. Representation of the principal components as histogram values proposed herein more accurately reflects the variation in the internal structure of the observations in a principal component space. As a consequence, subsequent analyses using histogram-valued principal components as input result in improved accuracy.  相似文献   

14.
主成分分析是多元统计分析中一种非常经典的降维技术。然而,经典主成分分析却是对离群值非常敏感的,常因离群值的存在导致结果与实际不相符。另一方面,当主成分分析用于综合评价时,主成分的含义常因载荷间绝对值大小不分明而含糊不清,从而导致综合评价难以展开。本文通过使用稳健稀疏主成分分析法进行模拟实验和实证分析,结果表明:该方法不仅能很好地抵抗离群值的影响,而且还能准确地识别出离群样本。通过该方法得出的主成分的含义也较经典主成分分析和稳健主成分分析更加地明确和贴近实际。  相似文献   

15.
This paper is an adaptation of symbolic interval Principal Component Analysis (PCA) to histogram data. We proposed two methodologies. The first one involved three steps: the coding of bins of histogram, the ordinary PCA of means of variables and the representation of dispersion of symbolic observations we call concepts. For the representation of dispersion of these concepts we proposed the transformation of histograms into intervals. Then, we suggest the projection of the hypercubes or the interval lengths associated to each concept on the principal axes of the ordinary PCA of means. In the second methodology, we proposed the use of the three previous steps with the angular transformation.  相似文献   

16.
In this paper, an ensemble technique combining the principal component analysis (PCA) with scale-dependent Lyapunov exponent (SDLE) is used to characterize complexity of precipitation dynamical system. The spatial–temporal precipitation data is decomposed by employing PCA method and then the SDLE for the first few principal components (PCs) time series are computed. The first few PCs time series are found to exhibit the different scaling laws on different time scales. The study illustrate that the spatial–temporal precipitation data is chaotic and the precipitation system is truly multiscaled and complex.  相似文献   

17.
将一种基于特征提取的ε-不灵敏支持向量机方法用于非线性系统辨识.对输入输出数据首先进行核主元特征提取,将特征提取后的数据作为支持向量机的训练数据.将该方法与基于主元特征提取的方法和直接应用ε-不灵敏支持向量机的方法进行含噪和不含噪情况下的仿真比较,结果表明,方法的拟合性能和抗干扰能力优于其他两种方法.  相似文献   

18.
郭燊  周石鹏 《经济数学》2019,36(4):14-19
在传统主成分分析的基础上,复数希尔伯特主成分分析通过将希尔伯特变换与随机矩阵理论相结合获取滤噪经济数据的频域信息,为揭示股票市场与货币市场波动的超前滞后关系提供了途径.实证研究结果显示,在样本区间内,中国股票市场指标相对于货币市场指标来说大部分呈现出超前的变化,而在货币市场中,数量型指标波动较为靠前,价格型指标的反应则较为滞后.此外,股票价格与货币供应量的波动之间存在反馈效应.探索两市场间这样一种动态关系能为政府对金融市场的监管工作提供相应的政策建议.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号