首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
胡跃清 《应用数学》1996,9(3):351-357
本文从修正的似然入手,得到了回归模型中自变量影响的一种有效度量,它的表达式简洁易在常见的统计软件上实现.这种影响度量可帮助我们建立一个合适的回归模型,作为特例,它可用来检测回归模型中的异常点或强影响点.利用局部影响分析的思想,我们还研究了这种影响度量的灵敏度,据此可成功地发现对选模有较大影响的观察数据.最后我们给出了一个应用实例.  相似文献   

2.
Logistic回归模型的影响分析   总被引:2,自引:0,他引:2  
Logistic回归模型的影响分析是Logistic回归诊断研究中的重要内容。常用的分析方法都是轮换地删除数据点后的逐步判断,而这个判断的过程主要体现在模型的诊断图上。鉴于此,通过构造诊断统计量来有效地开发诊断图成为影响分析的核心内容,并由此能较为准确地探寻出模型的强影响点。本文通过对Logistic回归模型帽子矩阵的分解以及对轮换地删除数据点后的系数估计的相对变化量进行加权,得出Logistic回归模型诊断图使其能比传统的诊断图更准确地判断出模型的强影响点。  相似文献   

3.
线性回归模型多个离群点的向前逐步诊断方法   总被引:3,自引:0,他引:3  
当线性回归模型中存在多个离群点时,经典的诊断方法常常因掩盖和淹没现象而失效,导致模型误用。针对此问题,本文在回顾有关文献的基础上,将稳健回归技术与经典诊断量相结合,提出一种向前逐步诊断方法。通过对模拟数据的分析,说明该法可有效地识别回归数据中潜在的离群点,并作正式的统计检验。  相似文献   

4.
《数理统计与管理》2019,(2):235-246
零膨胀计数数据是当今数据分析的热点问题之一,该类数据的特点是零点过多,目前对这类数据的研究已经比较全面。另外还有些计数数据不仅会出现零点过多的现象,也会同时存在零、一点都过多的情形,如果再用零膨胀计数数据的统计方法去研究,产生的误差较大。目前国内外对零和一都膨胀的数据的研究还比较少,针对这种现象,本文引入零一膨胀泊松回归模型,并用局部多项式核回归法这种非参数统计分析方法对零一膨胀泊松回归模型进行参数估计,这是本文的创新点也是难点,并在求解参数的过程中引进了EM算法和Newton-Raphson迭代对参数近似求解。通过模拟结果可以得出此方法的可行性,最后通过对糖尿病患者数据的实例分析,可以验证此方法的有效性。  相似文献   

5.
为了更好地拟合偏态数据,充分提取偏态数据的信息,针对偏正态数据建立了众数回归模型,并基于Pena距离统计量对众数回归模型进行统计断研究,得到了众数回归模型的Pena距离表达式以及高杠杆异常点的诊断方法.利用EM算法与梯度下降法给出了众数回归模型参数的极大似然估计,根据数据删除模型计算似然距离、Cook距离和Pena距离统计量,绘制诊断统计图.通过Monte Carlo模拟试验和实例分析比较,说明文章提出的方法行之有效,并在一定条件下Pena距离对异常点或强影响点的诊断优于似然距离和Cook距离.  相似文献   

6.
不同时期数据对因变量的影响权重不同,若不考虑数据的时间特性而构建回归模型,可能不一定得到最佳的回归模型.针对经济领域中数据时间跨度大,样本少以及可能存在异常点的特点,提出基于可调权重距离的最小一乘回归方法.建立了可调权重距离的权重系数确定方法,并给出基于MATLAB的模型求解方法.通过某船舶使用费用预测的应用,表明通过方法构建的模型具有更高的精度,值得借鉴.  相似文献   

7.
介绍了求非线性回归模型参数的基本理论,并且以海南人口增长数据为例,对比_分析了利用Malthus模型和Logistic回归模型的模拟结果.利用Mathematica软件绘制了海南人口增长数据的点图.最后给出海南人口增长数据的拟合曲线和置信域的图形.  相似文献   

8.
很多应用领域中的实验结果都表达成连续比例型数据,这类数据通常度量成为百分比、比率或比例,并取值于单位区间.为了采用弥散模型中的单纯形分布来模拟此类实验结果,本文首先研究单纯形分布的部分重要性质,在回归分析中参数估计和统计推断需要运用这些性质.模拟研究表明,当所研究情形不满足分布假设时,单纯形回归模型比Beta回归和分对数-正态回归模型更为稳健.通过对体外造血干细胞移植技术的真实数据分析,本文阐释这种方法和它针对异常值的稳健性.在R软件中,单纯形回归可以由程序包"simplexreg"实现,读者可以自行下载这个程序包,地址为http://my.zju.edu.cn/share/2466293(验证码:7919).  相似文献   

9.
针对确定输入、模糊输出的模糊线性回归分析模型,采用最小二乘法,讨论了模糊线性回归模型的数据删除模型的参数估计,将建立在确定性数据基础上的线性回归模型统计诊断量Cook距离推广到模糊线性回归分析模型中,构造了统计诊断量—模糊Cook距离,通过数值模拟和对实际例子的研究,识别出其中的强影响点,得出与其它方法相同的结论,表明本文构造的统计诊断量是有效的,且应用比其它方法更方便.  相似文献   

10.
现有对回归模型的研究大多仅限于直接观测的解释变量,忽略数据的测量误差将增加模型参数的估计偏差.目前关于测量误差模型的研究主要集中在回归误差服从正态分布的假设,这种假设不适用于研究非对称的数据.对于偏斜数据,众数的代表性优于均值和中位数.本文基于测量误差数据介绍了偏正态众数回归模型,并通过EM算法估计了模型的参数.模拟研究的结果表明,协变量带测量误差下的众数回归比均值回归有更好的表现.通过实例分析进一步表明了所提出模型和方法的有效性.  相似文献   

11.
基于主成分回归模型的经济增长因素分析   总被引:1,自引:0,他引:1  
在经济增长因素分析中,常用多元回归分析方法,但有时建立的回归模型拟合效果不好或不合理。为此本文给出建立主成分回归分析的方法。本文对经济增长给出两种回归分析方法,即建立主成分线性回归模型,分析经济增长的边际效应,建立主成分非线性回归模型,分析经济增长的弹性效应,实例表明效果很好。  相似文献   

12.
针对现实生活中大量数据存在偏斜的情况,构建偏正态数据下的众数回归模型.又加之数据的缺失常有发生,采用插补方法处理缺失数据集,为比较插补效果,考虑对响应变量随机缺失情形进行统计推断研究.利用高斯牛顿迭代法给出众数回归模型参数的极大似然估计,比较该模型在均值插补,回归插补,众数插补三种插补条件下的插补效果.随机模拟和实例分...  相似文献   

13.
L1正则化Logistic回归在财务预警中的应用   总被引:1,自引:0,他引:1  
刘遵雄  郑淑娟  秦宾  张恒 《经济数学》2012,29(2):106-110
线性模型和广义线性模型已广泛地用于社会经济、生产实践和科学研究中的数据分析和数据挖掘等领域,如公司财务预警,引入L1范数惩罚技术的模型在估计模型系数的同时能实现变量选择的功能,本文将L1范数正则化Logistic回归模型用于上市公司财务危机预报,结合沪深股市制造业ST公司和正常公司的T-2年财务数据开展实证研究,舛比Logistic回归和L2正则化Logistic回归模型进行对比分析.实验结果表明L1正则化Logistic回归模型的有效性,其在保证模型预测精度的同时提高模型的解释性.  相似文献   

14.
碳市场价格呈现非线性、非平稳的复杂特性,准确预测具有较大的挑战。基于“分而治之”的思想,提出了一种基于局部回归的多尺度碳市场价格预测模型。提出的模型利用集成经验模态分解(EEMD)对碳市场价格时间序列进行分解。启发于EEMD局部特征分解的特点,对分解后的分量采用局部回归方法进行预测,然后将分量预测结果进行集成。采用的局部回归方法包括局部线性回归(LLP)、局部多项式回归、局部岭回归、局部主成分回归、局部偏最小二乘回归和局部套索回归。实验结果表明基于局部回归的多尺度预测模型具有优异的预测性能。在提出的模型中,EEMD-LLP结构简单且性能更为突出,进一步对EEMD-LLP参数的适应性进行探讨。与新近提出模型的对比结果表明了EEMD-LLP在碳市场价格预测中的有效性。  相似文献   

15.
This article presents a method for the construction of a simultaneous confidence band for the normal-error multiple linear regression model. The confidence bands considered have their width proportional to the standard error of the estimated regression function, and the predictor variables are allowed to be constrained in intervals. Past articles in this area gave exact bands only for the simple regression model. When there is more than one predictor variable, only conservative bands are proposed in the statistics literature. This article advances this methodology by providing simulation-based confidence bands for regression models with any number of predictor variables. Additionally, a criterion is proposed to assess the sensitivity of a simultaneous confidence band. This criterion is defined to be the probability that a false linear regression model is excluded from the band at least at one point and hence this false linear regression model is correctly declared as a false model by the band. Finally, the article considers and compares several computational algorithms for obtaining the confidence band.  相似文献   

16.
One or few observations can be highly influential on estimates of regression coefficients in the linear regression model. In this paper we derive influence diagnostics for the varying coefficients model with longitudinal data. We note that diagnostics in this context is quite different from the classical regression model in the sense that regression coefficients vary as time varies. A version of Cook’s distance is suggested to reflect this specific aspect of varying coefficient model. An algorithm to present some guidelines to determine influential observations deserving special attention is developed. An illustrative example based on the AIDS data is also given.  相似文献   

17.
为了确定多重线性回归模型中回归系数矩阵的秩, 本文提出了一个基于M估计的模型选择程序, 且在较弱的条件下建立了回归系数矩阵的秩的估计的强相合性。  相似文献   

18.
In this paper, we propose new interval regression analysis based on the regression quantile techniques. To analyze a phenomenon in a fuzzy environment, we propose two interval approximation models. Without using all data, we first identify the main trend from the designated proportion of the given data. To select the main part of data to be analyzed, we introduce the regression quantile techniques. The obtained model is not influenced by extreme points since it is formulated from the center-located main proportion of the given data. After that, the interval regression model including all data can be identified based on the acquired main trend. The obtained interval regression model by the main proportion of the given data is called the lower approximation model, while interval regression model by all data is called the upper approximation model for the given phenomenon. Also it is shown that, from the lower approximation model (main trend) and the upper approximation model, we can construct a trapezoidal fuzzy model. The membership function of this fuzzy model is useful to obtain the locational information for each observation. The characteristic of our approach can be described as obtaining the upper and lower approximation models and combining them to be a fuzzy model for representing the given phenomenon in a fuzzy environment.  相似文献   

19.
一类不分明时间序列的回归预测   总被引:6,自引:0,他引:6  
研究了一类不分明时间序列的线性回归预测问题,通过模糊数空间中的距离,建立了模糊环境中最小二乘回归模型,证明了回归模型解的存在性和唯一性,并给出了确定模型的模糊参数及检验模型拟合度的计算公式。  相似文献   

20.
Modal regression based on nonparametric quantile estimator is given. Unlike the traditional mean and median regression, modal regression uses mode but not mean or median to represent the center of a conditional distribution, which helps the model to be more robust for outliers, asymmetric or heavy-taileddistribution. Most of solutions for modal regression are based on kernel estimation of density. This paper studies a new solution for modal regression by means of nonparametric quantile estimator. This method builds on the fact that the distribution function is the inverse of the quantile function, then the flexibility of nonparametric quantile estimator is utilized to improve the estimation of modal function. The simulations and application show that the new model outperforms the modal regression model via linear quantile function estimation.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号