共查询到20条相似文献,搜索用时 15 毫秒
1.
时间序列自回归AR模型在建模过程中易受离群值的影响,导致计算结果与实际不相符.针对这一现象,将Hampel权函数运用于自相关函数中,从而构建出自回归AR模型的稳健估计算法,以克服离群值的影响.并对此方法进行了模拟和实证分析,模拟和实证分析均表明:当时序数据中不存在离群值时,传统估计方法与稳健估计方法得到的结果基本保持一致;当数据中存在离群值时,运用传统估计方法得到的结果出现较大变化,而运用稳健估计方法得到的结果基本不变.这说明相对于传统估计方法,稳健估计方法能有效抵抗离群值的影响,具有良好的抗干扰性和高抗差性. 相似文献
2.
主成分分析是多元统计分析中一种非常经典的降维技术。然而,经典主成分分析却是对离群值非常敏感的,常因离群值的存在导致结果与实际不相符。另一方面,当主成分分析用于综合评价时,主成分的含义常因载荷间绝对值大小不分明而含糊不清,从而导致综合评价难以展开。本文通过使用稳健稀疏主成分分析法进行模拟实验和实证分析,结果表明:该方法不仅能很好地抵抗离群值的影响,而且还能准确地识别出离群样本。通过该方法得出的主成分的含义也较经典主成分分析和稳健主成分分析更加地明确和贴近实际。 相似文献
3.
稳健统计(Ⅱ) 总被引:2,自引:1,他引:1
1.6容忍量和破坏点 俗话说,“一颗老鼠屎坏了一锅汤”.分析者知道,单个失误造成的一个离群值,就可以使样本均值的值很不合理.样本量为n的一元样本中,最大值X(x),设想为离群值,且越来越坏──远离数据的主体部分──对一元情况就是越来越大,样本均值也就随之越来越大.这就是说:如果X(n)趋向正无穷,则X也随之趋向正无穷.因此,我们说一个离群值就可以破坏X估计,或者说样本均值不能容忍离群值,不能抵抗离群值的破坏作用.而对于样本中位数,只要样本量大于2,不论X(n)怎么变,样本中位数值至多变动一个次序统计量,不会成为不合理的值,因此样本中位… 相似文献
4.
主成分分析是多元统计分析中经典降维方法之一。它有两个固有弊端:一是当样本中存在离群样本时,经典主成分法所得载荷向量、得分往往不符合实际;二是在现实中各主成分载荷往往都会不等于零,甚至经常还会出现次要变量与主要变量的载荷绝对值大小接近的情况,导致主成分可解释性被大幅削弱。另外,传统的稳健主成分法通过删除离群样本后计算载荷向量达到稳健效果,这对于那些只有少数几个变量的观测值离群的离群样本来说是一种欠妥的方法。针对上述几点,本文以DDC (Detecting Deviating Cell)算法为主要的稳健方法,提出一种稳健稀疏主成分法DDCSPCA。模拟实验和实证分析结果表明:DDCSPCA在处理有离群样本的数据时能达到稳健与(载荷向量)稀疏双重效果。而且,其对格离群数据有着以往稳健主成分法所远远不及的稳健性。 相似文献
5.
《数理统计与管理》2015,(6):989-1006
本文关注于流量三角形中的离群值问题,阐述了链梯法评估的索赔准备金对离群值具有高度依赖性。为了解决这一问题,考虑了一种稳健链梯法,包括计算进展因子的稳健方法和诊断并调整离群值的方法,并应用经典数据和比利时非寿险业务的真实数据进行了实证分析。数值结果表明,稳健链梯法具有优良性能,无论原始数据中存在单个或多个离群值,稳健链梯法都能有效识别并调整这些离群值,以减少离群值对索赔准备金估计的影响。在非寿险精算实务中,异常赔款额是完全有可能出现的,通过比较链梯法和稳健链梯法的评估结果,非寿险精算人员可以进一步分析导致异常赔款额背后的原因,并根据具体情况,采取合理的处理方法调整或保留异常赔款额,提高索赔准备金估计的准确性。 相似文献
6.
7.
线性回归模型的误差项不服从正态分布或存在多个离群点时,可以将残差秩次的某些函数作为权重引入估计模型来减少离群点的不良影响。本文从参数估计、稳健性质、回归诊断等方面对基于残差秩次的一类稳健回归方法进行介绍.通过模拟研究和实例分析表明,R和GR估计是一种估计效率较高的稳健回归方法,其中GR估计可同时避免X与Y空间离群点,而高失效点HBR估计可通过控制某个参数在稳健性与估计效率之间进行折衷. 相似文献
8.
GARCH(1,1)模型的稳健估计比较及应用 总被引:1,自引:0,他引:1
首先阐述了GARCH(1,1)模型稳健估计的构造方法,然后在模型有无异常值扩散效应约束和异常值比例不同的情况下,比较了传统QMLE估计和多种稳健M估计的表现,结果表明:在数据无异常值下,QMLE估计较优;随着异常值比例增加,稳健Andrew估计表现更好;模型施加异常值扩散效应约束对估计有一定改善但不显著.最后选取波动程度不同的两个阶段沪深300指数的收益率,用模型拟合进行了实例比较,在波动程度较大时,Andrew估计效果较优,在波动相对平稳时,LAD估计较优. 相似文献
9.
10.
线性模型参数的稳健化有偏估计 总被引:1,自引:1,他引:0
本文讨论复共线性和粗差同时存在时线性模型的参数估计问题,基于等价权原理提出了一个稳健有偏估计类(稳健压缩估计),并且建立了稳健压缩估计的计算方法,为了满足实际问题的需要,构造了许多很有意义的稳健有偏估计,例如稳健岭估计、稳健主成分估计,稳健组合主成估计、稳健单参数主成分估计、稳健根方估计等等,最后通过一个算例表明,本文提出的稳健有偏估计具有既可克服复共线性影响又可抵抗粗差干扰的良好性质。 相似文献
11.
基因识别是生物信息学研究的一个分支.多元统计中的判别分析方法模型简单、便于解释,处理剪切位点的识别问题效果良好,但极易受到异常值的影响.对于传统判别分析方法,使用稳健统计量进行优化,得到较好的效果,并通过加权方法进一步提高了判别分析方法的稳健性,取得了更好的识别效果.加权稳健判别分析方法稳健性高、受离群值影响小,对其他分类判别问题具有很好的实际意义和参考价值. 相似文献
12.
13.
回归系数的稳健主成分估计 总被引:5,自引:0,他引:5
自变量间多元共线关系的存在以及数据集中离群值的存在,对回归系数最小二乘估计产生较大的影响。主成分估计用以抗多元共线,稳健M-估计具有抗离群值的特性。本文探讨了离群值对主成分估计的影响和多元共线对M-估计的影响。在此基础上提出了回归系数稳健主成分估计(RPC),RPC是主成分估计与M-估计的有机结合,它能同时抗离群值和多元共线并保留主成分估计与M-估计的优点。本文应用Monte-Carlo方法,考证了在多元共线与离群值同时存在时,RPC优于Ls估计、主成分估计和M-估计,说明RPC具有一定的实用价值。 相似文献
14.
《应用概率统计》2021,(4)
回归模型一般采取传统的最小二乘估计(LSE)方法,然而当数据包含非正态特征或异常值时该估计方法会导致不稳健的参数估计.与LSE方法相比,即使出现非正态误差或异常数据,复合分位回归(CQR)方法也能提供更稳健的估计结果.基于复合反对称拉普拉斯分布(CALD),本文提出了贝叶斯框架下的加权复合分量回归(WCQR)方法.正则化方法已经被验证可以有效处理高维稀疏回归模型,它可以同时进行变量选择和参数估计.本文结合贝叶斯LASSO正则化方法和WCQR方法来拟合线性回归模型,建立了 WCQR的贝叶斯LASSO正则化分层模型,并导出了所有参数的条件后验分布以进行统计推断.最后,通过蒙特卡罗模拟和实际数据分析演示了所提出方法. 相似文献
15.
稳健统计(Ⅰ) 总被引:6,自引:1,他引:5
稳健统计是60年代兴起、80年代初初步定型的.笔者首次标触它时,很难理解它的统计思想.本讲座介绍稳健统计,不求理论上的系统性,只希望有助于理解稳健统计的基本概念及基本方法的统计思想. 全文分为三个部分:一是讲稳健统计的基本概念,分为第一、第二篇;二是介绍稳健回归;三是介绍多元分析中的稳健方法,主要是位置向量和协方差阵的稳健估计,以及稳健主成分分析.总共四篇.这里不涉及时间序列的稳健性问题 1.1关于基本假定 统计分析是在一定的基本假定下进行的.我们最熟悉的统计方法,诸如,样本均值估计总体均值μ,样本方差S~2=((X_1-X)~2+…+… 相似文献
16.
17.
18.
严建渊 《纯粹数学与应用数学》1990,6(2):43-49
§1 引言稳健性是估计量的优良性质的描述。当原来的估计量具有稳健性时,自然希望对应的Bootstrap估计也保持这一性质。郑忠国[1]提出关于估计序列的稳健性定义,给出了估计序列稳健渐近正态的定义,简称稳健正态序列(RNS)。本文§2依照Hampel的属性稳健性定义,对郑忠国提出的稳健正态性进行了讨论。并且给出了随机加权的稳健条件。指出对一类L—估计,随机加权法具有稳健性。§3讨论了BootstrappingM—估计的稳健性。 相似文献
19.
对模型精度与稳健性的要求使得异常值检测与稳健估计在模型构建中变得日益重要.本文首先利用基于边际相关系数构造的高维影响度量指标(HIM)与基于距离相关系数构造的高维数据异常值判别方法(HDC)分别对数据中的异常值进行初步检测,将数据集中的点分为正常点与异常点两类,然后在初始正常点集的基础上利用稳健的参数估计方法和残差空间... 相似文献
20.
针对ARMA模型建模过程中模型识别和参数估计易受观测值异常点影响问题,构建了同时考虑加性异常点和更新性异常点的ARMA模型.运用基于Gibbs抽样的Markov Chain Monte Carlo贝叶斯方法,估计稳健ARMA模型参数,同步确定观测值中异常点的位置,辨别异常点类型.并利用我国人口自然增长数据进行仿真分析,研究结果表明:贝叶斯方法能够有效地识别ARMA序列的异常点. 相似文献