首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 312 毫秒
1.
基于距离度量的函数型数据聚类是目前函数型聚类分析方法的主要研究方向之一,而该方法主要是基于数值距离或曲线形态的单一角度来衡量函数型数据的相似性.为了解决这种单一性,提出一种同时兼顾函数型数据的数值距离和曲线形态的相似性度量方法—基于极值点偏差补偿的相似性度量,并给出实证分析,结果显示该方法比较有效.进一步提出一种多元函数型聚类分析方法—函数型熵权法,丰富了函数型聚类分析方法.  相似文献   

2.
为了更好地拟合偏态数据,充分提取偏态数据的信息,针对偏正态数据建立了众数回归模型,并基于Pena距离统计量对众数回归模型进行统计断研究,得到了众数回归模型的Pena距离表达式以及高杠杆异常点的诊断方法.利用EM算法与梯度下降法给出了众数回归模型参数的极大似然估计,根据数据删除模型计算似然距离、Cook距离和Pena距离统计量,绘制诊断统计图.通过Monte Carlo模拟试验和实例分析比较,说明文章提出的方法行之有效,并在一定条件下Pena距离对异常点或强影响点的诊断优于似然距离和Cook距离.  相似文献   

3.
Pena距离是研究偏态数据的一种有用工具.本文利用Pena距离研究了偏正态数据下位置回归模型的统计诊断问题,得到了位置回归模型下Pena距离的表达式,对其性质进行讨论,从而得到高杠杆异常点的判别方法. Pena距离与Cook距离、似然距离进行比较,得到在一定的条件下Pena距离优于Cook、似然距离.通过随机模拟试验研究和实例分析,表明本文提出的理论和方法是科学合理的.  相似文献   

4.
本文对多元线性回归模型定义了AP统计量和距离影响函数;将它们分解为两项之积,指出强影响点、异常点、高杠杆点间的内在联系;讨论了上述三种点的探查方法.最后,给出与距离影响函数有关的一个定理.  相似文献   

5.
线性混合模型在纵向数据分析中有广泛应用,应用点删除法研究纵向数据线性混合模型影响分析问题.采用的影响度量是基于似然函数构造的广义Cook距离,推导出两种广义Cook距离并用于实际数据分析和统计模拟分析,实际数据分析和统计模拟分析结果都说明该方法是行之有效的.  相似文献   

6.
EBT(Energy Bagging Tree)模型是基于能量距离的多元bagging,模型中的不纯度函数采用广义基尼均值差,分裂函数是样本落入分裂的两个子节点的概率和能量距离的乘积.新的变量选择方法基于EBT模型中分裂变量的频率,通过变量重要性的计算,为变量选择提供了依据.模拟分析显示,新方法和已有的多元随机森林算法在变量重要性排序的比较中具有优势.在建筑行业的混凝土实际数据上的表现进一步评估了新方法的性能.  相似文献   

7.
针对确定输入、模糊输出的模糊线性回归分析模型,采用最小二乘法,讨论了模糊线性回归模型的数据删除模型的参数估计,将建立在确定性数据基础上的线性回归模型统计诊断量Cook距离推广到模糊线性回归分析模型中,构造了统计诊断量—模糊Cook距离,通过数值模拟和对实际例子的研究,识别出其中的强影响点,得出与其它方法相同的结论,表明本文构造的统计诊断量是有效的,且应用比其它方法更方便.  相似文献   

8.
《数理统计与管理》2019,(3):450-459
时间序列数据的聚类是对面板数据或多维时间序列根据序列相似度进行分组。聚在同一组的时间序列具有相近的模型参数,尤其是当序列较短时聚类后能够得到更精确的参数估计。现存的时间序列聚类方法的距离度量大都基于时间序列的线性假设,但是现实中时间序列通常是非线性的。本文提出了一种基于Copula距离测度的非线性时间序列数据的聚类方法,它利用了Copula函数获取时间序列的非线性相依结构。作为一种非参数的距离度量,基于Copula函数的距离度量能够识别动态相关结构的相似性。大量的模拟实验和实证研究验证了我们所提方法的有效性。  相似文献   

9.
本文对非线性测量误差模型给出了统一的诊断方法,并证明了数据删除模型与均值漂移模型的等价性,由此出发得到了Cook距离、残差、杠杆值等诊断统计量.本文还讨论了非线性测量误差模型的局部影响分析,并给出了一个具体应用实例.推广了Zhao & Lee(1995)的结果.  相似文献   

10.
半参数广义线性随机效应模型的影响分析   总被引:1,自引:0,他引:1       下载免费PDF全文
该文系统研究了半参数广义线性随机效应模型的统计诊断与影响分析方法, 证明了数据删除模型和均值漂移模型的等价性定理, 给出了广义Cook距离等诊断统计量及异常点的Score检验统计量并研究了该模型的局部影响分析,分别对加权扰动模型, 响应变量扰动模型得到了影响距阵的计算公式, 最后通过一个实例验证了文中给出诊断方法的有效性.  相似文献   

11.
胡江 《工科数学》2012,(5):80-85
基于pena距离统计量对非线性回归模型的影响分析进行了讨论,得到了非线性回归模型的pena距离公式,并对公式的分析性质以及其对高杠异常点的检测作用做出了相应的结论,得出了在一定条件下pena距离对异常点的检测优于Cook距离的结论,特别是对高杠杆异常点的检验,pena距离的效果更加明显,给出了实际数据检验结果,对方法的有效性进行了验证。  相似文献   

12.
统计诊断就是对统计推断方法解决问题的全过程进行诊断,而影响分析是统计诊断中十分重要的分支.本文针对半参数广义线性模型,证明了数据删除模型和均值漂移模型的等价性定理,给出了诸如广义Cook距离等诊断统计量并研究了异常点的Score检验统计量,最后通过实例验证了本文给出的诊断方法的有效性。  相似文献   

13.
INFLUENCE ANALYSIS ON EXPONENTIAL NONLINEAR MODELS WITH RANDOM EFFECTS   总被引:5,自引:0,他引:5  
This paper presents a unified diagnostic method for exponential nonlinearmodels with random effects based upon the joint likelihood given by Robinson in 1991.The authors show that the case deletion model is equivalent to mean shift outlier model.From this point of view, several diagnostic measures, such as Cook distance, score statistics  相似文献   

14.
带随机效应非线性模型的影响分析   总被引:3,自引:0,他引:3  
Abstract. In this paper,a unified diagnostic method for the nonlinear models with random ef-fects based upon the joint likelihood given by Robinson in 1991 is presented. It is shown that thecase deletion model is equivalent to the mean shift outlier model. From this point of view ,sever-al diagnostic measures, such as Cook distance, score statistics are derived. The local influencemeasure of Cook is also presented. A numerical example illustrates that the method is avail-able  相似文献   

15.
空间变系数模型的统计诊断   总被引:1,自引:0,他引:1  
空间变系数模型作为一类有效的空间数据分析方法已经得到了广泛的应用.本文主要研究该模型的统计诊断与影响分析方法。首先我们基于数据删除模型定义了Cook统计量,其次我们基于均值漂移模型讨论了异常点的检验问题。  相似文献   

16.
不同时期数据对因变量的影响权重不同,若不考虑数据的时间特性而构建回归模型,可能不一定得到最佳的回归模型.针对经济领域中数据时间跨度大,样本少以及可能存在异常点的特点,提出基于可调权重距离的最小一乘回归方法.建立了可调权重距离的权重系数确定方法,并给出基于MATLAB的模型求解方法.通过某船舶使用费用预测的应用,表明通过方法构建的模型具有更高的精度,值得借鉴.  相似文献   

17.
This paper deals with the minimum disparity estimation in linear regression models. The estimators are defined as statistical quantities which minimize the blended weight Hellinger distance between a weighted kernel density estimator of errors and a smoothed model density of errors. It is shown that the estimators of the regression parameters are asymptotic normally distributed and efficient at the model if the weights of the density estimators are appropriately chosen.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号