共查询到10条相似文献,搜索用时 20 毫秒
1.
基因识别是生物信息学研究的一个分支.多元统计中的判别分析方法模型简单、便于解释,处理剪切位点的识别问题效果良好,但极易受到异常值的影响.对于传统判别分析方法,使用稳健统计量进行优化,得到较好的效果,并通过加权方法进一步提高了判别分析方法的稳健性,取得了更好的识别效果.加权稳健判别分析方法稳健性高、受离群值影响小,对其他分类判别问题具有很好的实际意义和参考价值. 相似文献
2.
线性回归模型的误差项不服从正态分布或存在多个离群点时,可以将残差秩次的某些函数作为权重引入估计模型来减少离群点的不良影响。本文从参数估计、稳健性质、回归诊断等方面对基于残差秩次的一类稳健回归方法进行介绍.通过模拟研究和实例分析表明,R和GR估计是一种估计效率较高的稳健回归方法,其中GR估计可同时避免X与Y空间离群点,而高失效点HBR估计可通过控制某个参数在稳健性与估计效率之间进行折衷. 相似文献
3.
干线网络的选址问题研究 总被引:1,自引:0,他引:1
考虑平面上和三维空间中同时确定多条干线的干线网络选址问题.对于平面上情形,通过最小化每个点到离它最近干线的加权距离之和,给出了一种有限步终止算法和基于k-means聚类分析、加权全最小一乘和重抽样方法的线性类算法;对于空间情形,给出了线性聚类算法.通过计算机仿真说明以上算法可以有效地确定平面和空间中干线网络位置. 相似文献
4.
主成分分析是多元统计分析中经典降维方法之一。它有两个固有弊端:一是当样本中存在离群样本时,经典主成分法所得载荷向量、得分往往不符合实际;二是在现实中各主成分载荷往往都会不等于零,甚至经常还会出现次要变量与主要变量的载荷绝对值大小接近的情况,导致主成分可解释性被大幅削弱。另外,传统的稳健主成分法通过删除离群样本后计算载荷向量达到稳健效果,这对于那些只有少数几个变量的观测值离群的离群样本来说是一种欠妥的方法。针对上述几点,本文以DDC (Detecting Deviating Cell)算法为主要的稳健方法,提出一种稳健稀疏主成分法DDCSPCA。模拟实验和实证分析结果表明:DDCSPCA在处理有离群样本的数据时能达到稳健与(载荷向量)稀疏双重效果。而且,其对格离群数据有着以往稳健主成分法所远远不及的稳健性。 相似文献
5.
线性回归模型多个离群点的向前逐步诊断方法 总被引:3,自引:0,他引:3
当线性回归模型中存在多个离群点时,经典的诊断方法常常因掩盖和淹没现象而失效,导致模型误用。针对此问题,本文在回顾有关文献的基础上,将稳健回归技术与经典诊断量相结合,提出一种向前逐步诊断方法。通过对模拟数据的分析,说明该法可有效地识别回归数据中潜在的离群点,并作正式的统计检验。 相似文献
6.
7.
《数理统计与管理》2015,(6):989-1006
本文关注于流量三角形中的离群值问题,阐述了链梯法评估的索赔准备金对离群值具有高度依赖性。为了解决这一问题,考虑了一种稳健链梯法,包括计算进展因子的稳健方法和诊断并调整离群值的方法,并应用经典数据和比利时非寿险业务的真实数据进行了实证分析。数值结果表明,稳健链梯法具有优良性能,无论原始数据中存在单个或多个离群值,稳健链梯法都能有效识别并调整这些离群值,以减少离群值对索赔准备金估计的影响。在非寿险精算实务中,异常赔款额是完全有可能出现的,通过比较链梯法和稳健链梯法的评估结果,非寿险精算人员可以进一步分析导致异常赔款额背后的原因,并根据具体情况,采取合理的处理方法调整或保留异常赔款额,提高索赔准备金估计的准确性。 相似文献
8.
9.
第三部份仅简要地阐述多元离群值检测、多元中心位置向量和散布阵的稳健估计,以及稳健主成分分析. 3.1多元离群值 设有n个个体,每个测量p个变量,得到n×p的数据阵[X=xij]=[x1,x2,…,xn]T=[x1,…,xp].如果仅从复制数据失误角度看,观测数据点xi的某个变量复制错,较比常见;对p个变量,每个作一元离群值检测,可望发现这种离群点;而颠倒两个变量值的次序,造成的离群点,在两变量的散点图上也许能看出;错测了其它总体的样本点,这两种技术都看不出的,需要检测诊断多元离群点的技术. 不问进一步的分析是什么,泛指的多元离群点,是认为大多数观测数据点… 相似文献
10.
证明了关于独立同分布随机变量序列的加权U-统计量的一个重对数律,类似于献「3」证明了一个加权U-统计量的解耦不等式。 相似文献