首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 46 毫秒
1.
文章研究了响应变量为现状数据的情况下,加速失效时间模型的Jackknife模型平均方法.首先对数据进行合理的无偏变换,进而得到回归参数的最小二乘估计.然后引入删一交叉验证准则来选取候选模型的权重,并在一定正则性条件下,建立对应模型平均估计量的渐近最优性.此外,数值模拟表明,与现有的其他模型平均和模型选择方法相比,本文所提出的方法在预测上表现更佳.最后将所提方法应用于尼日利亚儿童死亡率的数据进行实证研究,进一步验证了所提方法的优良性质.  相似文献   

2.
面板数据经常出现在许多研究领域, 比如纵向跟踪研究. 在很多情况下, 纵向反应变量与观察 时间和删失时间都有关系. 本文在有偏抽样下, 针对这些相关性存在的情况, 利用一个不能观察的潜在 变量, 提出了一个联合建模方法来刻画纵向反应变量与观察时间和删失时间的相关性, 获得了模型中 回归参数的估计方程以及估计的渐近性质, 并通过数值模拟验证了这些估计在小样本下也是有效的, 同时把该估计方法用于一组实际的膀胱癌数据分析中.  相似文献   

3.
统计机器学习中评判模型好坏的准则,必须权衡模型的复杂度与训练数据的拟合优度.常用于评价模型好坏的方法包括AIC,BIC,Cp准则,交叉验证等.而在预测误差的估计中,使用最简单且最广泛的方法是交叉验证方法.考虑最广泛使用的标准K折交叉验证的两种选择方式:投票和平均.实验对照了模型选择中这两种不同的选择方式的差异,为将来人们在进行这两种方式的选择时作参考.  相似文献   

4.
提出了变系数模型条件分位估计的一种新方法.变系数模型已经成为经济学、流行病学、纵向数据和医学领域处理高维数据的有力工具.该模型有助于探测数据的动态特征、降低模型偏差、避免高维灾难,同时便于解释.尽管关于变系数模型条件均值的估计已经有很多文章,但关于变系数模型条件分位的估计方面的文章相对较少.文中提出了一种有效的适应性分位回归方法来诊断出齐性邻域,进行局部自适应窗宽选择和局部线性逼近,同时给出了估计量的风险界和最优窗宽的自动选择准则.模拟研究说明了所提出估计方法的效果.  相似文献   

5.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

6.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

7.
在生物医学研究中,研究个体的失效时间往往存在删失,Cox比例风险模型是经常被用来处理此类删失数据的模型.对于带有删失的高维数据,如何从众多协变量中挑选出少数的致病因素是研究者的兴趣所在.本文针对高维删失数据利用SELO惩罚函数考虑了基于Cox比例风险模型框架下的变量选择及参数估计问题.在允许协变量维数发散的条件下,本文给出SELO惩罚估计量的相合性以及oracle性质.计算方面若采用传统方法计算惩罚估计解,当协变量维数较高时计算Hesse阵的逆矩阵需要花费大量的时间,且SELO惩罚函数在原点的不光滑性也给计算SELO惩罚估计带来很大难度.为此,本文利用光滑化技术对SELO惩罚函数进行近似,并利用DFP公式去代替Hesse阵的逆矩阵,进而提出了MSQN算法.模拟计算的结果表明,SELO惩罚方法比已有常用的惩罚方法表现更好,而且本文提出的新算法与常用的坐标下降算法相比表现更优.在真实数据部分,本文还分析了乳腺癌数据,并利用留一交叉验证法来评估预测的好坏.  相似文献   

8.
考虑了删失分位数变系数回归模型的FIC准则,并基于FIC准则给出了兴趣参数的模型选择和平均估计.为了全面反映响应变量的分布信息,克服异常值和重尾模型误差,文章对响应变量的不同分位数水平进行建模,因此与普通最小二乘方法相比更为稳健.在较为一般的条件下,证明了所提估计的渐近性质,通过模拟实验研究了估计的有限样本性质,用所提方法分析了手机用户的游戏时间数据.  相似文献   

9.
在多元非参数模型中带宽和阶的选择对局部多项式估计量的表现十分重要。本文基于交叉验证准则提出一个自适应贝叶斯带宽选择方法。在给定的误差密度函数下,该方法可推导出对应的似然函数,并构造带宽参数的后验密度函数。随后,通过带宽的后验期望可同时获得阶和带宽的估计。数值模拟的结果表明,该方法不仅比大拇指准则方法精确,且比交叉验证方法耗时更少。与此同时,与Nadaraya-Watson估计相比,所提带宽选择方法对多元非参数模型的适应性要更好。最后,本文通过一组实际数据说明有限样本下所提贝叶斯带宽选择的表现很好。  相似文献   

10.
对医疗费用的建模分析与合理预测是医疗保险费用厘定的基础与根本.医疗费用中的高维附加信息在长期预测中具有重要作用.然而,传统的统计建模方法不适用于处理高维纵向数据下的医疗费用.本文提出部分线性多指标可加模型,对具有高维特征的纵向医疗费用数据进行拟合与预测,并且使用两种不同的降维估计方法进行模型估计,并将该模型应用于一组含...  相似文献   

11.
在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一种可以处理超高维Ⅱ型区间删失数据且不依赖于任何模型假设的变量筛选方法.此方法的适用范围很广,可以有效地处理各种生存模型下的超高维Ⅱ型区间删失数据,而且可以处理离散型,连续型等多种类型的协变量.在估计生存函数时,本文采用EM-ICM算法,极大地提高了计算效率.大量的数值模拟实验验证了此方法在有限样本下的有效性.  相似文献   

12.
频率模型平均估计近年来受到较多关注,但目前文献对有测量误差数据的模型平均估计方法研究较少.文章考虑异方差线性测量误差模型平均估计方法,基于Mallows权重选择准则提出了新的模型平均估计,并在理论上证明了其渐近最优性.模拟结果表明,新方法相较于一些常用的模型平均(如SAIC,SBIC)与模型选择方法(如AIC,BIC)具有较大优势.  相似文献   

13.
本文给出了响应变量随机右删失情况下线性模型的FIC (focused information criterion) 模型选择方法和光滑FIC 模型平均估计方法, 证明了兴趣参数的FIC 模型选择估计和光滑FIC 模型平均估计的渐近正态性, 通过随机模拟研究了估计的有限样本性质, 模拟结果显示, 从均方误差和一定置信水平置信区间的经验覆盖概率看, 兴趣参数的光滑FIC 模型平均估计均优于FIC, AIC (Akaikeinformation criterion) 和BIC (Bayesian information citerion) 等模型选择估计; 而FIC 模型选择估计与AIC 和BIC 等模型选择估计相比, 也表现出了一定的优越性. 通过分析原发性胆汁性肝硬化数据集, 说明了本文方法在实际问题中的应用.  相似文献   

14.
本文研究广义部分线性单指标模型(generalized partially linear single-index models, GPLSIMs)的模型平均问题.在实际应用中, GPLSIMs由于其灵活性和易解释性受到广泛关注.然而, GPLSIMs在应用中存在两类不确定性:变量的不确定性和单指标连接函数光滑度的不确定性.为了解决该不确定性问题,本文提出一种GPLSIMs的最优模型平均方法,该方法通过最大交叉验证准则得到数据驱动的权重.在模型误设定假设和发散模型空间的框架下,本文证明在最小化Kullback-Leibler (KL)损失准则下,所提出的模型平均估计渐近最优.同时,当候选模型集中存在伪真模型时,本文证明基于交叉验证准则得到的权重渐近地集中在伪真模型上.此外,基于提出的模型平均方法,本文为GPLSIMs构建了一种变量重要性度量,并证明该度量可以渐近识别所有真实模型中的变量.模拟研究和两个实际数据分析均展示了本文提出的方法相对于几种现有方法的优势.  相似文献   

15.
高维协方差矩阵在经济、金融、生物等众多领域中有着广泛应用.基于收缩估计模型,构造样本协方差矩阵与因子模型协方差矩阵的凸线性组合,通过对因子模型的改进来提高模型估计精度.在构造因子模型时,引入因子选择准则(pcp3(k))来确定因子个数:在确定最优权重α时,使用基于MSE(S)分解的思想求解.通过数据验证发现,相较于传统方法,提升了协方差矩阵估计精确性;在构造投资组合模型时,也可以有效降低投资风险.  相似文献   

16.
在响应变量带有单调缺失的情形下考虑高维纵向线性回归模型的变量选择.主要基于逆概率加权广义估计方程提出了一种自动的变量选择方法,该方法不使用现有的惩罚函数,不涉及惩罚函数非凸最优化的问题,并且可以自动地剔除零回归系数,同时得到非零回归系数的估计.在一定正则条件下,证明了该变量选择方法具有Oracle性质.最后,通过模拟研究验证了所提出方法的有限样本性质.  相似文献   

17.
本文结合分位数回归技术,基于删失回归模型,把Claeskens和Hjort的传统兴趣信息准侧(focused information criterion,FIC)扩展到兴趣向量的情形,提出扩展的兴趣信息准则(extended focused information criterion,E-FIC),有效解决了同时针对多个兴趣参数的平均估计问题,并且对删失响应变量的不同水平分位数进行建模,以全面反映响应变量分布特征,有效克服异常值和厚尾模型误差的影响.基于扩展的兴趣信息准则给出参数的平均估计方法,证明估计的渐近性质.通过Monte Carlo随机模拟试验比较所提估计方法和最小二乘方法在有限样本量下的表现,用所提方法对原发性胆汁性肝硬化数据集进行数据分析.  相似文献   

18.
《数理统计与管理》2014,(3):423-433
本文考虑了纵向数据下变系数混合效应模型的一种有效的压缩估计。结合考虑纵向数据的组内相关性,本文提出的统一正则估计方法可以同时选择和估计系数函数的参数效应分量和非参数效应的函数分量。本文还建立了估计量的渐近理论性质,且在Monte Carlo模拟和实际数据分析进行了充分的验证。  相似文献   

19.
在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量.为了估计模型中的系数矩阵,本文提出一个两阶段方法,先对数据进行逆概率删失加权(IPCW),再用SESS算法求解一个稀疏降秩回归问题.本文通过数值模拟,验证了所提方法的有效性.最后将该方法应用于一个关于白血病患者骨髓移植的临床数据集.  相似文献   

20.
变量选择是统计建模中重要的问题。当试验数据维数很高时,传统变量选择方法的应用受到了很多制约。本文以高维混料试验为基础,比较了AIC准则和LASSO在变量选择问题上的优良性。通过实例验证,LASSO可以快速且准确地对高维混料模型中的变量进行筛选,从而得出最优模型,达到降低成本、提高利益的目的。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号