共查询到20条相似文献,搜索用时 31 毫秒
1.
2.
《数学的实践与认识》2017,(18)
基于分位数回归及其变量选择模型,利用2011年中国健康与营养调查数据(CHNS)实证分析了医疗消费的影响因素.通过Lasso方法从多个影响因素中选取出了对医疗消费影响较大的因素,发现个人收入、年龄、受教育程度、患病程度和地区变量对医疗消费的影响较大,通过分位数回归模型,对影响医疗消费诸因素的作用方式与程度进行了研究. 相似文献
3.
为解决大规模数据在进行回归分析时存在的计算内存不足和运行时间较长的问题,提出两个新的回归分析方法:先筛选后抽样的大规模数据L1惩罚分位数回归方法(FSSLQR)和先抽样后筛选的大规模数据L1惩罚分位数回归方法(SFSLQR),其数值模拟和实际应用结果表明:FSSLQR和SFSLQR方法不仅能够显著降低计算内存和运行时间,而且其估计预测和变量选择的结果与全量L1惩罚分位数回归基本一致。此外,与Xu等(2018)提出的大规模数据的L1惩罚分位数回归方法(SLQR)相比,FSSLQR和SFSLQR方法在估计预测、变量选择和运行时间等方面都更具优势。 相似文献
4.
本文应用最优化理论,对固定效应的面板数据分位数回归模型,提出一种模式搜索方法,此方法可以同时估计出所有分位点处的解释变量系数和所有个体的固定效应值。进一步利用蒙特卡洛模拟比较现有文献中涉及的面板数据分位数回归方法,结果显示无论误差项是否满足经典假设,模式搜索分位数回归法较之其他分位数回归估计方法更为有效. 相似文献
5.
6.
针对存在缺失数据的超高维可加分位回归模型,本文提出一种有效的变量筛选方法.具体而言,将典型相关分析的思想引入到最优变换的最大相关系数,通过协变量和模型残差最优变换后的最大相关系数重要变量的边际贡献进行排序,从而进行变量筛选.然后,在筛选的基础上,利用稀疏光滑惩罚进一步做变量选择.所提变量筛选方法有三点优势:(1)基于最优变换的最大相关可以更全面的反映响应变量对协变量的非线性依赖结构;(2)在迭代过程中利用残差可以获取模型的相关信息,从而提高变量筛选的准确度;(3)变量筛选过程和模型估计分开,可以避免对冗余协变量的回归.在适当的条件下,证明了变量筛选方法的确定性独立筛选性质以及稀疏光滑惩罚下估计量的稀疏性和相合性.同时,通过蒙特卡罗模拟给出了所提方法的表现并通过一组小鼠基因数据说明了所提方法的有效性. 相似文献
7.
《中国科学:数学》2020,(8)
复合分位数回归(composite quantile regression)具有稳健性好和估计效率高的优势,所以其经常被用来替代均值回归.众所周知,纵向数据具有组内相关的特点,如果估计过程中能正确地利用组内相关性,则可以显著地提高估计效率.因此,探讨纵向数据复合分位数回归中如何使用相关性是一个有意义的问题.本文首先利用copula函数方法构建纵向数据复合分位数回归的组内协方差矩阵,进而基于构建的协方差矩阵,提出一个无偏且有效的基于copula函数的复合分位数回归估计方程;进一步,为了进行变量选择,利用基于copula函数的估计方程,提出一个光滑门限(smooth-threshold)的复合分位数回归估计方程方法.本文提出的方法具有很高的灵活性,而且提高了估计的效率.理论结果以及数值模拟和实际数据分析都验证了本文的方法. 相似文献
8.
9.
本文结合分位数回归技术,基于删失回归模型,把Claeskens和Hjort的传统兴趣信息准侧(focused information criterion,FIC)扩展到兴趣向量的情形,提出扩展的兴趣信息准则(extended focused information criterion,E-FIC),有效解决了同时针对多个兴趣参数的平均估计问题,并且对删失响应变量的不同水平分位数进行建模,以全面反映响应变量分布特征,有效克服异常值和厚尾模型误差的影响.基于扩展的兴趣信息准则给出参数的平均估计方法,证明估计的渐近性质.通过Monte Carlo随机模拟试验比较所提估计方法和最小二乘方法在有限样本量下的表现,用所提方法对原发性胆汁性肝硬化数据集进行数据分析. 相似文献
10.
11.
设两个样本数据不完全的线性模型,其中协变量的观测值不缺失,响应变量的观测值随机缺失。采用随机回归插补法对响应变量的缺失值进行补足,得到两个线性回归模型的"完全"样本数据,在一定条件下得到两响应变量分位数差异的对数经验似然比统计量的极限分布为加权x_1~2,并利用此结果构造分位数差异的经验似然置信区间。模拟结果表明在随机插补下得到的置信区间具有较高的覆盖精度。 相似文献
12.
13.
含有协变量缺失的数据缺失问题是现代统计分析中的热点之一.当缺失数据中同时存在厚尾,偏斜和异方差问题时则更加难以处理.为此,本文提出一种逆概率加权分位回归估计来研究响应和协变量之间的关系.与经典估计方法相比具有明显优势,一方面,该估计量使用了所有可用的数据,并且允许缺失的协变量与响应高度相关;另一方面,该估计量在所有分位数水平上满足一致性和渐近正态性.通过模拟验证了该方法的在有限样本下的有效性,进一步将该方法推广到线性多元回归模型和非参数回归模型. 相似文献
14.
最近几年,函数型数据分析的理论和应用飞速发展.在许多实际应用里,响应变量往往存在随机右删失的情况.考虑利用函数型部分线性分位数回归模型来刻画函数型和标量预测量与右删失响应变量之间的关系.基于函数型主成分基函数来逼近未知的斜率函数,通过极小化逆概率加权分位数损失函数得到未知系数的估计量.文章的估计方法容易通过加权分位数回归程序实现.在一定的假设条件下,给出了有限维参数估计量的渐近正态性与斜率函数估计量的收敛速度.最后,通过模拟计算与应用实例证明了所提方法的有效性. 相似文献
15.
在介绍分位数回归方法的基础上,讨论了分位数回归模型在研究影响大学生成绩变化因素方面的应用,与最小二乘回归模型对比,分位数回归能有效地描述数据尾端的分布情况. 相似文献
16.
《数学的实践与认识》2013,(20)
车辆保险产品的定价一般会考虑保单持有人的索赔概率和期望索赔额等两个因素,零调整逆高斯回归模型作为解决这类问题的一个有力工具,由于变量分布的限定,从而具有一定的局限性.针对该问题,本文基于零调整逆高斯回归模型和分位数回归模型的思想,提出零调整分位数回归模型,并结合实际数据进行了拟合分析.与零调整逆高斯回归模型拟合的结果比较表明,零调整分位数回归模型可以作为研究车辆保险中索赔额的一个有力工具. 相似文献
17.
由于分位回归具有很多优点, 近年来它逐渐成了线性和非线性响应模型综合性的统计分析方法,但是它却不能有效地处理具有分层结构的实际数据. 然而,在现实生活中具有这种结构的数据是一种普遍现象.忽略数据的这种结构会冒很大的风险, 甚至让传统意义下的统计分析方法失效; 另一方面, 尽管分层模型考虑到了数据的这种结构, 但它实际上就是均值回归, 所以不可能全面刻画给定高维解释变量条件下的响应变量的条件分布问题. 另外, 它估计出来的系数向量(边际效应)对于响应变量中的离群点很敏感. 本文基于Gauss-Seidel 迭代法, 提出了一种新的算法, 该算法充分利用了分位回归和分层模型二者的优点, 创造性地解决了前面所提出的问题.在理论方面, 我们还考虑了新方法的渐近性质, 得出了简单条件下n1/2收敛速度和渐近正态性. 最后, 将我们的新方法用到一个典型的具有分层结构的实际教育数据上去, 并且介绍如何解释所得的结果. 相似文献
18.
19.
20.
目前国内对于线性分位数回归模型的研究及其应用正在火热进行中,而非参数计量方法由于其优越性也受到越来越多人的重视,但对于两种方法结合应用的相关研究才刚刚开始.对于目前国内外已有的以及正在发展中的非参数方法估计分位数回归模型做了一个综述,包括理论综述及实证应用综述,其中重点介绍了此方面研究的前沿理论:Li and Racine关于非参数估计条件累积分布函数(CDF)和分位函数的研究.通过介绍,希望对于我国非参数估计分位数回归模型方法的研究和应用有所裨益. 相似文献