首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到17条相似文献,搜索用时 109 毫秒
1.
本文研究偏正态数据下联合位置与尺度模型,考虑基于数据删除模型的参数估计和统计诊断,比较删除模型与未删除模型相应统计量之间的差异.首次提出基于联合位置与尺度模型的诊断统计量和局部影响分析.通过模拟研究和实例分析,给出不同的诊断统计量来判别异常点或强影响点,研究结果表明本文提出的理论和方法是有用和有效的.  相似文献   

2.
本文主要研究双重广义线性模型,考虑基于数据删除模型的参数估计和统计诊断,比较删除模型与未删除模型相应的诊断统计量之间的变化.首次提出基于双重广义线性模型下的Pena距离.通过一些模拟研究以及实例分析,比较不同诊断统计量判别异常点或强影响点的差异,研究结果表明本文提出的理论和方法是行之有效的.  相似文献   

3.
统计诊断的主要任务就是通过诊断统计量检测已知观测数据在用既定模型拟合时的合理性,主要是找出数据当中的异常点或强影响点。本文主要研究Logostic回归模型的诊断统计量和诊断统计图。用牛顿迭代法给出Logistic回归模型的极大似然估计值,根据扰动模型得到传统的诊断统计量,结合残差、杠杆值和系数变化三者构造新的诊断统计量,绘制新的诊断统计图,通过模拟研究说明新的诊断统计量的有效性,最后用一个实际案例说明新的诊断方法的应用并进一步验证其优越性。  相似文献   

4.
为了更好地拟合偏态数据,充分提取偏态数据的信息,针对偏正态数据建立了众数回归模型,并基于Pena距离统计量对众数回归模型进行统计断研究,得到了众数回归模型的Pena距离表达式以及高杠杆异常点的诊断方法.利用EM算法与梯度下降法给出了众数回归模型参数的极大似然估计,根据数据删除模型计算似然距离、Cook距离和Pena距离统计量,绘制诊断统计图.通过Monte Carlo模拟试验和实例分析比较,说明文章提出的方法行之有效,并在一定条件下Pena距离对异常点或强影响点的诊断优于似然距离和Cook距离.  相似文献   

5.
针对确定输入、模糊输出的模糊线性回归分析模型,采用最小二乘法,讨论了模糊线性回归模型的数据删除模型的参数估计,将建立在确定性数据基础上的线性回归模型统计诊断量Cook距离推广到模糊线性回归分析模型中,构造了统计诊断量—模糊Cook距离,通过数值模拟和对实际例子的研究,识别出其中的强影响点,得出与其它方法相同的结论,表明本文构造的统计诊断量是有效的,且应用比其它方法更方便.  相似文献   

6.
为探究杭州市PM2.5含量与其他指标之间的关系,搜集杭州市2019年的AQI指数和AQI 6项指标进行分析.首先通过相关分析揭示PM2.5与其余5项指标的相关性,发现各指标与PM2.5均呈线性关系,又因为其余5项指标之间存在显著的线性相关性,故自变量之间存在多重共线性.为了消除多重共线性的影响,对这5项指标提取主成分,再基于主成分分析做回归分析.最后对模型进行统计诊断,按照一定标准筛选出原始数据中的强影响点,删除强影响点后得到最终模型.  相似文献   

7.
回归诊断中几种影响诊断量的比较   总被引:2,自引:0,他引:2  
在回归诊断的实际应用中,人们越来越认识到强影响点对回归模型的影响重要性。但由于影响评价的方法越来越多。使应用者不知采用何种方法为好。本文对一些较为常用的诊断量作了比较,并通过实例考虑它们的应用情况。  相似文献   

8.
基于改进的Cholesky分解,研究分析了纵向数据下半参数联合均值协方差模型的贝叶斯估计和贝叶斯统计诊断,其中非参数部分采用B样条逼近.主要通过应用Gibbs抽样和Metropolis-Hastings算法相结合的混合算法获得模型中未知参数的贝叶斯估计和贝叶斯数据删除影响诊断统计量.并利用诊断统计量的大小来识别数据的异常点.模拟研究和实例分析都表明提出的贝叶斯估计和诊断方法是可行有效的.  相似文献   

9.
线性回归模型多个离群点的向前逐步诊断方法   总被引:3,自引:0,他引:3  
当线性回归模型中存在多个离群点时,经典的诊断方法常常因掩盖和淹没现象而失效,导致模型误用。针对此问题,本文在回顾有关文献的基础上,将稳健回归技术与经典诊断量相结合,提出一种向前逐步诊断方法。通过对模拟数据的分析,说明该法可有效地识别回归数据中潜在的离群点,并作正式的统计检验。  相似文献   

10.
本将随机效应当作是缺失数据,基于Q函数和EM算法并利用P-样条拟合非参数部分,得到了纵向数据半参数Beta回归模型估计方法.基于数据删除模型,我们得到了模型参数部分的广义Cook距离以及非参数部分的广义DFIT.此外,本文还研究了在四种不同扰动情形下模型的局部影响分析,得到了相应的影响矩阵.最后,我们通过两个数值实例验证了所得诊断统计量的有效性.  相似文献   

11.
含有不等式约束的回归问题的影响分析   总被引:1,自引:0,他引:1  
影响分析是回归问题中非常重要的一环,对于含有不等式约束的回归问题同样如此.对于有约束的回归问题,我们必须考虑两类影响点以及各种不同情况下的距离定义.本文将针对两类影响点给出判断强影响点的方法.  相似文献   

12.
In this article, we propose and explore a multivariate logistic regression model for analyzing multiple binary outcomes with incomplete covariate data where auxiliary information is available. The auxiliary data are extraneous to the regression model of interest but predictive of the covariate with missing data. Horton and Laird [N.J. Horton, N.M. Laird, Maximum likelihood analysis of logistic regression models with incomplete covariate data and auxiliary information, Biometrics 57 (2001) 34–42] describe how the auxiliary information can be incorporated into a regression model for a single binary outcome with missing covariates, and hence the efficiency of the regression estimators can be improved. We consider extending the method of [9] to the case of a multivariate logistic regression model for multiple correlated outcomes, and with missing covariates and completely observed auxiliary information. We demonstrate that in the case of moderate to strong associations among the multiple outcomes, one can achieve considerable gains in efficiency from estimators in a multivariate model as compared to the marginal estimators of the same parameters.  相似文献   

13.
提出了具有高斯过程误差的函数型回归模型的几种诊断方法.在此模型中,首先,在样条基的基础上,推导了回归系数函数的估计.随后,证明了数据删失模型和均值漂移模型的等价性.然后,研究了三种诊断方法,即残差分析、Cook距离和似然距离来诊断异常和强影响数据.最后,通过一个模拟例子和一个实例来阐述方法的有效性.  相似文献   

14.
L1正则化Logistic回归在财务预警中的应用   总被引:1,自引:0,他引:1  
刘遵雄  郑淑娟  秦宾  张恒 《经济数学》2012,29(2):106-110
线性模型和广义线性模型已广泛地用于社会经济、生产实践和科学研究中的数据分析和数据挖掘等领域,如公司财务预警,引入L1范数惩罚技术的模型在估计模型系数的同时能实现变量选择的功能,本文将L1范数正则化Logistic回归模型用于上市公司财务危机预报,结合沪深股市制造业ST公司和正常公司的T-2年财务数据开展实证研究,舛比Logistic回归和L2正则化Logistic回归模型进行对比分析.实验结果表明L1正则化Logistic回归模型的有效性,其在保证模型预测精度的同时提高模型的解释性.  相似文献   

15.
Least squares method based on Euclidean distance and Lebesgue distance between fuzzy data is used to study parameter estimation of fuzzy linear regression model based on case deletion respectively. And the parameter estimations on two kinds of distance are compared. The input of the above model is real data and output is fuzzy data. The statistical diagnosis --- estimation standard error of regression equations is constructed to test highly influential point or outlier in observation data. At last through identifying highly influential point or outlier in actual data, it shows that the statistic constructed in this paper is effective.  相似文献   

16.
Robust techniques for multivariate statistical methods—such as principal component analysis, canonical correlation analysis, and factor analysis—have been recently constructed. In contrast to the classical approach, these robust techniques are able to resist the effect of outliers. However, there does not yet exist a graphical tool to identify in a comprehensive way the data points that do not obey the model assumptions. Our goal is to construct such graphics based on empirical influence functions. These graphics not only detect the influential points but also classify the observations according to their robust distances. In this way the observations are divided into four different classes which are regular points, nonoutlying influential points, influential outliers, and noninfluential outliers. We thus gain additional insight in the data by detecting different types of deviating observations. Some real data examples will be given to show how these plots can be used in practice.  相似文献   

17.
空间变系数模型的统计诊断   总被引:1,自引:0,他引:1  
空间变系数模型作为一类有效的空间数据分析方法已经得到了广泛的应用.本文主要研究该模型的统计诊断与影响分析方法。首先我们基于数据删除模型定义了Cook统计量,其次我们基于均值漂移模型讨论了异常点的检验问题。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号