首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
何晓霞  徐伟  李缓  吴传菊 《数学杂志》2017,37(5):1101-1110
本文研究了基于面板数据的分位数回归模型的变量选择问题.通过增加改进的自适应Lasso惩罚项,同时实现了固定效应面板数据的分位数回归和变量选择,得到了模型中参数的选择相合性和渐近正态性.随机模拟验证了该方法的有效性.推广了文献[14]的结论.  相似文献   

2.
分位数变系数模型是一种稳健的非参数建模方法.使用变系数模型分析数据时,一个自然的问题是如何同时选择重要变量和从重要变量中识别常数效应变量.本文基于分位数方法研究具有稳健和有效性的估计和变量选择程序.利用局部光滑和自适应组变量选择方法,并对分位数损失函数施加双惩罚,我们获得了惩罚估计.通过BIC准则合适地选择调节参数,提出的变量选择方法具有oracle理论性质,并通过模拟研究和脂肪实例数据分析来说明新方法的有用性.数值结果表明,在不需要知道关于变量和误差分布的任何信息前提下,本文提出的方法能够识别不重要变量同时能区分出常数效应变量.  相似文献   

3.
本文结合复合分位数回归和自适应LASSO惩罚方法为固定效应面板数据模型提供了一种稳健变量选择过程。先通过正向正交偏差变换消除固定效应,再利用自适应LASSO构造惩罚复合分位数回归目标函数,进而同时进行回归系数的估计和变量选择。在一些正则条件下,证明了所提出的估计具有Orcale性质。该方法不仅消除了固定效应对估计的影响,而且具有稳健性。模拟研究了所提出方法的有限样本性质并将其应用于实际数据分析。  相似文献   

4.
多元非参数分位数回归常常是难于估计的, 为了降低维数同时保持非参数估计的灵活性, 人们常常用单指标的方法模拟响应变量的条件分位数. 本文主要研究单指标分位数回归的变量选择. 以最小化平均损失估计为基础, 我们通过最小化具有SCAD惩罚项的平均损失进行变量选择和参数估计. 在正则条件下, 得到了单指标分位数回归SCAD变量选择的Oracle性质, 给出了SCAD变量选择的计算方法, 并通过模拟研究说明了本文所提方法变量选择的样本性质.  相似文献   

5.
刘宣  陈建宝 《数学学报》2023,(3):405-424
本文研究了固定效应空间自回归分位数模型的变量选择问题.通过惩罚压缩相关参数,达到了同时识别空间效应、估计未知参数和选择解释变量的目的.此外,给出了变量选择的实现算法并证明了惩罚估计量的大样本性质.数值模拟和实例分析均表明了所提方法的优良表现.  相似文献   

6.
为解决大规模数据在进行回归分析时存在的计算内存不足和运行时间较长的问题,提出两个新的回归分析方法:先筛选后抽样的大规模数据L1惩罚分位数回归方法(FSSLQR)和先抽样后筛选的大规模数据L1惩罚分位数回归方法(SFSLQR),其数值模拟和实际应用结果表明:FSSLQR和SFSLQR方法不仅能够显著降低计算内存和运行时间,而且其估计预测和变量选择的结果与全量L1惩罚分位数回归基本一致。此外,与Xu等(2018)提出的大规模数据的L1惩罚分位数回归方法(SLQR)相比,FSSLQR和SFSLQR方法在估计预测、变量选择和运行时间等方面都更具优势。  相似文献   

7.
来源于不同总体的数据异质性较大,数据“零取值”较多且离散度大,可利用零膨胀泊松(ZIP)混合回归模型建模分析,然而混合模型中自变量较多.为了筛选出重要变量,本文利用自适应LASSO对ZIP混合回归模型进行变量选择,即在似然函数中加入惩罚项,再利用EM算法估计参数.通过模拟,验证了该方法在变量选择和参数估计中的有效性.同时,将ZIP混合回归模型应用于预测借贷失败次数的实际数据分析,筛选出对借贷失败有重要影响的因素.最后,通过比较各模型的预测效果,得到ZIP混合回归模型优于泊松(Poisson),负二项(NB)和ZIP回归模型.  相似文献   

8.
车辆保险产品的定价一般会考虑保单持有人的索赔概率和期望索赔额等两个因素,零调整逆高斯回归模型作为解决这类问题的一个有力工具,由于变量分布的限定,从而具有一定的局限性.针对该问题,本文基于零调整逆高斯回归模型和分位数回归模型的思想,提出零调整分位数回归模型,并结合实际数据进行了拟合分析.与零调整逆高斯回归模型拟合的结果比较表明,零调整分位数回归模型可以作为研究车辆保险中索赔额的一个有力工具.  相似文献   

9.
两部分潜变量模型是一种被广泛用于探索半连续数据中不可观测异质性的统计方法.文章对两部分潜变量建立变分贝叶斯推断程序.相比于马尔可夫链蒙特卡洛(MCMC)抽样方法,变分贝叶斯方法具有计算速度快、可提供确定性解等优点.利用Logistic模型一个随机表示,构造了一个适当的变分分布族来近似后验.变分分布通过坐标上升变分算法获得;给出了变分参数的更新计划,建立了变量选择和模型评价贝叶斯程序.经验结果展示了该方法的有效性和实用价值.  相似文献   

10.
考虑了删失分位数变系数回归模型的FIC准则,并基于FIC准则给出了兴趣参数的模型选择和平均估计.为了全面反映响应变量的分布信息,克服异常值和重尾模型误差,文章对响应变量的不同分位数水平进行建模,因此与普通最小二乘方法相比更为稳健.在较为一般的条件下,证明了所提估计的渐近性质,通过模拟实验研究了估计的有限样本性质,用所提方法分析了手机用户的游戏时间数据.  相似文献   

11.
在带有罚函数的变量选择中,调节参数的选择是一个关键性问题,但遗憾的是,在大多数文献中,调节参数选择的方法较为模糊,多凭经验,缺乏系统的理论方法.本文基于含随机效应的面板数据模型,提出分位回归中适应性LASSO调节参数的选择标准惩罚交叉验证准则(PCV),并讨论比较了该准则与其他选择调节参数的准则的效果.通过对不同分位点进行模拟,我们发现当残差E来自尖峰分布和厚尾分布时,该准则能更好地估计模型参数,尤其对于高分位点和低分位点而言.选取其他分位点时,PCV的效果虽稍逊色于Schwarz信息准则,但明显优于A1kaike 信息准则和交叉验证准则.且在选择变量的准确性方面,该准则比Schwarz信息准则、Akaike信息准则等更加有效.文章最后对我国各地区多个宏观经济指标的面板数据进行建模分析,展示了惩罚交叉验证准则的性能,得到了在不同分位点处宏观经济指标之间的回归关系.  相似文献   

12.
单位根模型是经济学和金融学中用于非平稳时间序列数据建模的一个重要模型.对于该模型,假设模型误差的方差可能不存在,然后采用复合分位数方法估计该模型的自回归系数,建立了估计量的收敛速度和极限分布.然后,通过Monte Carlo模拟评估估计量在有限样本情形下的表现发现,当模型误差不是高斯分布时,单位根模型的复合分位数自回归估计在估计偏差和有效性方面要优于最小二乘估计和分位数自回归估计.此外,文中给出了一个相关的实证分析,该实证分析表明:对于该经济数据,用复合分位数方法进行统计推断是合适且具有一定优势的.最后,把单位根模型推广到了增广的Dickey-Fuller模型,并研究了该模型中的复合分位数自回归估计的渐近理论.  相似文献   

13.
含有协变量缺失的数据缺失问题是现代统计分析中的热点之一.当缺失数据中同时存在厚尾,偏斜和异方差问题时则更加难以处理.为此,本文提出一种逆概率加权分位回归估计来研究响应和协变量之间的关系.与经典估计方法相比具有明显优势,一方面,该估计量使用了所有可用的数据,并且允许缺失的协变量与响应高度相关;另一方面,该估计量在所有分位数水平上满足一致性和渐近正态性.通过模拟验证了该方法的在有限样本下的有效性,进一步将该方法推广到线性多元回归模型和非参数回归模型.  相似文献   

14.
空间变系数回归模型是空间线性回归模型的重要推广,在实际中有广泛的应用.然而,这个模型的变量选择问题还没有解决.本文通过一般的M型损失函数将均值回归、中位数回归、分位数回归和稳健均值回归纳入同一框架下,然后基于B样条近似,提出一个能够同时进行变量选择和函数系数估计的自适应组内(adaptive group)L_r(r≥1)范数惩罚的M型估计量.新方法有几个显著的特点:(1)对异常点和重尾分布稳健;(2)能够兼容异方差性,允许显著变量集合随所考虑的分位点不同而变化;(3)兼顾了估计量的有效性和稳健性.在较弱假设条件下,建立了变量选择的oracle性质.随机模拟和实例分析验证了所提方法在有限样本时的表现.  相似文献   

15.
针对含有内生变量的面板数据回归模型,提出基于工具变量的分位数回归估计方法.首先,通过引入工具变量解决协变量的内生性问题,然后利用分位数回归的方法对回归系数进行估计.在一些正则条件下,证明所提出估计的大样本性质,通过模拟研究证实该方法的有限样本性质.  相似文献   

16.
在惩罚样条回归模型中,根据截断幂基函数系数的直观意义,以结点两边数据点极差的线性递减函数作为局部惩罚权重,构造了一种新的局部惩罚样条回归模型.不同于整体惩罚样条,该方法使得当数据点集在局部具有较大的波动性时,能给予拟合曲线较小的惩罚,从而能更好地控制曲线在拟合优度与光滑度之间的平衡.模拟结果显示,当数据具有空间异质性时,采用该方法的回归模型相比整体惩罚模型有更好的信息准则得分.  相似文献   

17.
基于分位数回归及其变量选择模型,利用2011年中国健康与营养调查数据(CHNS)实证分析了医疗消费的影响因素.通过Lasso方法从多个影响因素中选取出了对医疗消费影响较大的因素,发现个人收入、年龄、受教育程度、患病程度和地区变量对医疗消费的影响较大,通过分位数回归模型,对影响医疗消费诸因素的作用方式与程度进行了研究.  相似文献   

18.
本文在多种复杂数据下, 研究一类半参数变系数部分线性模型的统计推断理论和方法. 首先在纵向数据和测量误差数据等复杂数据下, 研究半参数变系数部分线性模型的经验似然推断问题, 分别提出分组的和纠偏的经验似然方法. 该方法可以有效地处理纵向数据的组内相关性给构造经验似然比函数所带来的困难. 其次在测量误差数据和缺失数据等复杂数据下, 研究模型的变量选择问题, 分别提出一个“纠偏” 的和基于借补值的变量选择方法. 该变量选择方法可以同时选择参数分量及非参数分量中的重要变量, 并且变量选择与回归系数的估计同时进行. 通过选择适当的惩罚参数, 证明该变量选择方法可以相合地识别出真实模型, 并且所得的正则估计具有oracle 性质.  相似文献   

19.
潜变量模型在刻画因子间的相互关系以及因子与观测变量间的关联性方面具有重要作用.在实际应用中,观测数据往往呈现出重尾和极端值等特性.将经典的潜变量模型延伸到齐次隐马尔可夫模型,并建立了基于多元t-分布的极大似然统计分析程序.经验结果展示所建立的统计程序对消除异常点的影响是有效的.  相似文献   

20.
本文将工具变量分位数回归模型(IVQR)应用到面板数据中,结合Canay对面板分位数回归的两步估计法以及Chernozhukov对IVQR模型的估计方法,提出了两步面板分位数工具变量估计法(2S-IVFEQR),并给出相应的参数估计。本文提出的方法较已有的方法计算复杂度低,蒙特卡洛模拟结果显示在数据量不大或者处理长面板数据时,2S-IVFEQR方法要优于传统的IVFEQR方法,且运算时间短。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号