首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
回归模型一般采取传统的最小二乘估计(LSE)方法,然而当数据包含非正态特征或异常值时该估计方法会导致不稳健的参数估计.与LSE方法相比,即使出现非正态误差或异常数据,复合分位回归(CQR)方法也能提供更稳健的估计结果.基于复合反对称拉普拉斯分布(CALD),本文提出了贝叶斯框架下的加权复合分量回归(WCQR)方法.正则化方法已经被验证可以有效处理高维稀疏回归模型,它可以同时进行变量选择和参数估计.本文结合贝叶斯LASSO正则化方法和WCQR方法来拟合线性回归模型,建立了 WCQR的贝叶斯LASSO正则化分层模型,并导出了所有参数的条件后验分布以进行统计推断.最后,通过蒙特卡罗模拟和实际数据分析演示了所提出方法.  相似文献   

2.
复合分位数回归(composite quantile regression)具有稳健性好和估计效率高的优势,所以其经常被用来替代均值回归.众所周知,纵向数据具有组内相关的特点,如果估计过程中能正确地利用组内相关性,则可以显著地提高估计效率.因此,探讨纵向数据复合分位数回归中如何使用相关性是一个有意义的问题.本文首先利用copula函数方法构建纵向数据复合分位数回归的组内协方差矩阵,进而基于构建的协方差矩阵,提出一个无偏且有效的基于copula函数的复合分位数回归估计方程;进一步,为了进行变量选择,利用基于copula函数的估计方程,提出一个光滑门限(smooth-threshold)的复合分位数回归估计方程方法.本文提出的方法具有很高的灵活性,而且提高了估计的效率.理论结果以及数值模拟和实际数据分析都验证了本文的方法.  相似文献   

3.
在对统计数据的建模和分析中,数据的波动性和扰动性是人们越来越关注的一个问题.于是如何对其进行有效地识别和刻画并精确地估计出来就变得尤为重要.文章考虑一个线性异方差模型,主要的目标是将未知的刻度函数稳健地恢复出来.在传统的刻度参数的估计中,四分位距是一个稳健的估计量.文章在此基础上进一步提出"极小四分位距"及"最优分位距"两个新的稳健估计量,欲将任意分布F中的刻度参数有效地估计出来.进而为了对异方差模型中的刻度函数进行估计,将该思想推广到条件分布中,并利用分位回归技术,这样刻度函数就得以稳健的恢复出来.值得说明的是在估计过程中无需知道均值函数的任何信息,使得该方法更具优势.此外文章研究了估计量的渐近性质并与传统的四分位距方法进行比较.结果表明,不论误差分布是对称的还是非对称的,所提出的估计量都有显著的优越性.最后,为了检测所提出估计量的性能,进行了一些模拟研究,得到的结果与理论是相符的.  相似文献   

4.
空间变系数回归模型是空间线性回归模型的重要推广,在实际中有广泛的应用.然而,这个模型的变量选择问题还没有解决.本文通过一般的M型损失函数将均值回归、中位数回归、分位数回归和稳健均值回归纳入同一框架下,然后基于B样条近似,提出一个能够同时进行变量选择和函数系数估计的自适应组内(adaptive group)L_r(r≥1)范数惩罚的M型估计量.新方法有几个显著的特点:(1)对异常点和重尾分布稳健;(2)能够兼容异方差性,允许显著变量集合随所考虑的分位点不同而变化;(3)兼顾了估计量的有效性和稳健性.在较弱假设条件下,建立了变量选择的oracle性质.随机模拟和实例分析验证了所提方法在有限样本时的表现.  相似文献   

5.
在非参数回归模型中,传统的Nadaraya-Watson核估计和局部多项式估计常常因为误差为重尾情况而变得不稳健,Kai等人(2010)提出的复合分位数回归方法能弥补这一缺陷.文章在删失指标随机缺失的情况下,研究了误差具有异方差结构的非参数删失回归模型,利用局部多项式方法构造了回归函数的复合分位数回归估计,并得到了该估计的渐近正态性结果,把Kai等人(2010)的结果推广到删失指标随机缺失的右删失数据下.最后通过模拟发现,尤其是当误差为重尾分布时,该估计方法比Wang和Zheng (2014)提出的核估计方法更好.  相似文献   

6.
《数理统计与管理》2015,(4):707-718
高维数据分析是当前研究的热点话题,而在对其进行分析时,非参数方法由于其灵活,无需对模型进行假定,得到了广泛的发展和认可。其中可加模型不仅能够有效地对变量进行降维,避免"维数灾难"的发生;而且能够得到各个变量的边际效应,具有很好的解释性。为了得到更加稳健的估计量,本文考虑利用分位回归方法对可加模型进行估计。分位回归方法由于其能够全面地刻画因变量在各个分位点上的变化趋势,并不受误差分布的限制,使得该方法具有更广泛的应用性。本文综合考虑以上优势,提出局部线性最小化检验函数估计方法和局部线性双核估计方法对可加模型进行估计。并且该方法能够有效地避免可加模型分位回归曲线的交叉问题.蒙特卡洛结果显示,与传统的均值估计法相比,不论误差分布的形式,我们提出的方法更具有优越性。用北京市二手房房价数据进行实证分析,进一步验证了本文提出的估计方法。  相似文献   

7.
本文提出一种针对纵向数据回归模型下的均值和协方差矩阵同时进行的有效稳健估计.基于对协方差矩阵的Cholesky分解和对模型的改写,我们提出一个加权最小二乘估计,其中权重是通过广义经验似然方法估计出来的.所提估计的有效性得益于经验似然方法的优势,稳健性则是通过限制残差平方和的上界来达到.模拟研究表明,和已有的针对纵向数据的稳健估计相比,所提估计具有更高的效率和可比的稳健性.最后,我们把所提估计方法用来分析一组实际数据.  相似文献   

8.
本文研究了含有个体固定效应的面板数据空间误差模型,基于工具变量法给出了估计模型未知参数的分位回归方法.随机模拟结果显示,工具变量分位回归估计是处理空间面板数据的有效手段,且明显优于均值回归方法.  相似文献   

9.
数据缺失在实际应用中普遍存在,数据缺失会降低研究效率,导致参数估计有偏.在协变量随机缺失(MAR)的假定下,本文基于众数回归和逆概率加权估计方法对线性模型进行参数估计.该方法结合参数Logistic回归和非参数Nadaraya-Watson估计两种倾向得分估计方法,分别构建IPWM-L估计量和IPWM-NW估计量.模拟研究和实例分析表明,众数回归模型比均值回归模型更具稳健性,逆概率加权众数(IPWM)估计方法在缺失数据下表现出了更好的拟合效果,与IPWM-L估计量相比, IPWM-NW估计量更稳健.  相似文献   

10.
部分线性混合效应模型中方差分量是我们感兴趣的参数, 文献中已经给出许多估计方法. 但是其中很多方法都可以归结为广义估计方程方法(GEE), 如: 最大似然估计(MLE), 约束最大似然估计(REMLE)等, 而GEE方法对异常点很敏感. 本文提出一组关于部分线性混合效应模型(PLMM)中均值和方差分量的稳健估计方程, 对均值和方差分量同时进行稳健估计; 并进行了随机模拟考察所提出稳健估计的有效性, 最后通过两个实例, 说明了所提方法的可行性.  相似文献   

11.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

12.
本文首先讨论了在均方误最小意义下学生氏tn分布代表点,利用方开泰、贺曙东的算法找出代表点,证明了当n≥3时,t_n分布总体下算法的收敛性,代表点的存在性及其唯一性,并从t_n分布角度研究了代表点在统计模拟方面的应用。传统的蒙特卡罗方法和自助法及重抽样方法对随机样本进行抽样,是统计模拟方法的基础.Fang,Zhou,Wang讨论了一元正态分布的代表点在统计模拟中的应用并且首次提出用代表点代替独立同分布的随机样本,构造一个离散的近似总体,通过对近似总体重复抽样来进行统计推断.这是—个新思想.本文继续探讨这个问题,文中统计推断主要有两部分:经典估计和稳健估计.经典估计主要集中考虑参数点估计(均值、方差、偏度和峰度);稳健估计主要考虑简单的位置参数(中位数和均值)和尺度参数(中位数绝对偏差和四分位距).我们的结果再次验证,代表点方法可以明显地提高统计估计量的精确度以及收敛速度.  相似文献   

13.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

14.
稳健统计(Ⅲ)   总被引:1,自引:1,他引:0  
1.10稳健化和M估计 我们看到正态方法(最小二乘法)不能抵抗(阻尼)离群值的破坏性大影响,它的破坏点为0,影响函数是无界的,总之,它是不稳健的.它可以被改造成稳健方法,这种修正的过程称为稳健化;或者找到另一种代用的稳健方法,称为稳健代用品. 由主观判断识别出离群值;或者用离群值检验诊断的办法,识别出离群值,然后剔除离群值,对于剩余样本用传统的正态方法。这样,实际上已实现了稳健化.L估计中有许多稳健方法,例如,样本中位数、切尾均值都是稳健位置估计.另外,可以从非参数统计中找到稳健代用品。例如R估计就是由(不依赖于总体分布的)秩…  相似文献   

15.
本文考虑纵向数据下线性回归模型的稳健估计问题.通过结合模态回归(modal regression)方法和二次推断函数(quadratic inference functions)技术,提出了一种基于模态回归的估计过程.证明了回归系数的估计是相合的,并给出了其渐近分布.数据模拟结果表明所提出的估计方法具有较好的稳健性和有效性.  相似文献   

16.
传统的面板数据是从均值角度进行研究,但这会受经典假设条件的约束.而考虑面板数据的分位回归模型,可以更加全面地描述响应变量条件分布的全貌.文章引入自适应惩罚函数构造了自适应惩罚的分位回归面板数据方法,并证明所提出的估计量具有大样本性质.蒙特卡洛模拟结果显示该方法相对于均值回归更具优势,是处理面板数据的有效手段.文章最后对我国居民交通通讯消费进行案例分析,得到了有利于决策的参考信息.  相似文献   

17.
已有针对平滑转换自回归模型(STAR)的研究多是将转换函数设定为Logistic函数或指数函数形式,并在均值回归框架下获得模型的估计、检验及预测结果.文章基于重心权有理插值和分位数回归方法,构建一类新的半参数平滑转换分位数自回归模型,其主要特点表现在:第一,基于重心权有理插值方法构造的平滑转换函数,形式更加灵活自由,有效减少了模型误设的风险.第二,在分位数回归框架下,利用遗传算法获得新模型在不同分位点处的平滑转换自回归系数估计,比单纯的均值回归得到的信息更为丰富.数值模拟结果显示,新模型的平滑转换自回归系数估计在无偏性、有效性和一致性方面均具有较好表现.最后,将新模型应用于上证综指日收益率的动态趋势及预测研究,细致揭示了收益率序列在不同阶段、不同分位点处的非线性和异质性变化特征.  相似文献   

18.
病例对照研究被广泛应用于流行病学等领域,通过其获得的病例对照数据不但可以用于寻找疾病的风险因素,还能够用于次级分析,即探究与疾病相关的风险因素之间的关系.文献中已有的方法多集中于研究次级分析中的均值回归和分位回归,而众数作为数据中最有可能出现的值,既是描述数据中心位置的重要参数,更是对均值和分位数的重要补充.因此文章结合病例对照数据的特征,提出了一种基于估计方程的众数回归方法用于次级分析,同时探讨了估计量的渐近性质.蒙特卡洛数值模拟结果表明文章的估计方法相比于其他方法有更好的有效性和适用性.最后利用一个乳腺癌数据集说明了文章所提方法的表现性能.  相似文献   

19.
考虑含测量误差的线性回归模型,采用模拟外推(SIMEX)方法并结合复合分位数回归构造了回归系数的估计.所得回归系数估计不仅消除了测量误差对估计造成的偏差,而且保留了复合分位数回归估计的优点.在一些正则条件下,证明了估计的渐近性质.模拟研究了所提出方法的有限样本性质,并进行了实例分析.  相似文献   

20.
部分线性单指标模型的复合分位数回归及变量选择   总被引:1,自引:0,他引:1       下载免费PDF全文
本文提出复合最小化平均分位数损失估计方法 (composite minimizing average check loss estimation,CMACLE)用于实现部分线性单指标模型(partial linear single-index models,PLSIM)的复合分位数回归(composite quantile regression,CQR).首先基于高维核函数构造参数部分的复合分位数回归意义下的相合估计,在此相合估计的基础上,通过采用指标核函数进一步得到参数和非参数函数的可达最优收敛速度的估计,并建立所得估计的渐近正态性,比较PLSIM的CQR估计和最小平均方差估计(MAVE)的相对渐近效率.进一步地,本文提出CQR框架下PLSIM的变量选择方法,证明所提变量选择方法的oracle性质.随机模拟和实例分析验证了所提方法在有限样本时的表现,证实了所提方法的优良性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号