首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

2.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

3.
在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一种可以处理超高维Ⅱ型区间删失数据且不依赖于任何模型假设的变量筛选方法.此方法的适用范围很广,可以有效地处理各种生存模型下的超高维Ⅱ型区间删失数据,而且可以处理离散型,连续型等多种类型的协变量.在估计生存函数时,本文采用EM-ICM算法,极大地提高了计算效率.大量的数值模拟实验验证了此方法在有限样本下的有效性.  相似文献   

4.
本文考虑超高维部分线性模型,其中线性部分的维数p大于样本量n,且维数p随着样本量n呈指数阶增长.首先,利用半参数回归的profile方法,把超高维部分线性模型转化成超高维线性模型.其次,为了对高维线性分量进行有效的变量筛选,考虑到协变量之间的相关性,结合贪婪算法和向前回归变量筛选方法,针对部分线性模型,提出了profile贪婪向前回归(PGFR)变量筛选方法.在一定正则条件下,证明了所提PGFR方法具有筛选相合性.为了确定所选模型是否能够依概率趋于1包含真实模型,进一步提出了BIC准则.最后,通过模拟研究和实例分析验证了PGFR方法在有限样本下的完成情况.  相似文献   

5.
孙桂萍  赵目  周勇 《数学学报》2022,(4):607-624
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好.  相似文献   

6.
本文首先建立左截断右删失数据下的一般分位数回归方法.当截断变量服从均匀分布时,左截断右删失数据变成长度偏差右删失数据.长度偏差数据因其特殊性,提供了更多的信息.当把适用于左截断右删失数据的一般方法用到长度偏差右删失数据时,得到的估计量并不有效,这是因为它们没有利用该数据的特殊结构.为了提高效率,本文提出复合估计方程方法来解决长度偏差右删失数据下的分位数回归问题,这种方法并不需要估计删失变量的分布.所提出的估计方程可以通过一个求L_1型凸函数最小值的简单算法来求解.本文用经验过程和随机积分的技巧建立了所提出估计量的一致相合性和弱收敛性.随机模拟验证了所提出方法在有限样本时的表现,并且给出了实例分析.  相似文献   

7.
最近几年,函数型数据分析的理论和应用飞速发展.在许多实际应用里,响应变量往往存在随机右删失的情况.考虑利用函数型部分线性分位数回归模型来刻画函数型和标量预测量与右删失响应变量之间的关系.基于函数型主成分基函数来逼近未知的斜率函数,通过极小化逆概率加权分位数损失函数得到未知系数的估计量.文章的估计方法容易通过加权分位数回归程序实现.在一定的假设条件下,给出了有限维参数估计量的渐近正态性与斜率函数估计量的收敛速度.最后,通过模拟计算与应用实例证明了所提方法的有效性.  相似文献   

8.
本文研究长度偏差数据下剩余寿命分位数模型的估计方法,充分考虑有偏抽样机制对模型估计的影响.如果忽略这种有偏性会导致估计产生严重偏差甚至错误的结果.本文首先针对长度偏差右删失数据的剩余寿命分位数提出了对数形式的线性回归模型,对删失变量与协变量独立和不独立的两种情况利用估计方程给出了模型参数的估计.其次,通过经验过程和弱收敛理论给出了参数估计的相合性和渐近正态性.最后,本文对提出的估计方法进行了数值模拟并用该方法对奥斯卡奖数据进行分析.  相似文献   

9.
本文考虑了长度偏差右删失数据下均值剩余寿命模型的统计推断.当截断变量满足平稳性假设时,长度偏差右删失数据比左截断右删失数据具有更多的信息.为了提高参数估计的效率,我们在估计方程构造中添加了额外信息,通过组合方法获得了新的估计.模拟研究的结果也表明,组合估计方程的方法比仅考虑左截断右删失数据的方法更有效,结果表现更好.  相似文献   

10.
厉诚博  胡淑兰  周勇 《数学学报》2018,61(5):865-880
本文考虑了长度偏差右删失数据下均值剩余寿命模型的统计推断.当截断变量满足平稳性假设时,长度偏差右删失数据比左截断右删失数据具有更多的信息.为了提高参数估计的效率,我们在估计方程构造中添加了额外信息,通过组合方法获得了新的估计.模拟研究的结果也表明,组合估计方程的方法比仅考虑左截断右删失数据的方法更有效,结果表现更好.  相似文献   

11.
零膨胀Poisson回归(ZIP)是处理零频数过多计数资料的有效模型,而计数数据一般含有删失或不精密的特点.本文将删失数据引入到ZIP模型中来,分别建立含右删失数据的固定效应ZIP模型,随机效应ZIP模型,通过极大边际似然函数估计法对模型进行参数估计.最后,利用实例分析验证了上述模型的可行性.  相似文献   

12.
在生存分析中,可加可乘风险率模型常用来研究协变量对初始事件和终止事件之间持续时间的影响效应。在本文中,我们考虑了在初始事件存在部分区间删失,同时终止事件存在左截断右删失的情形下,持续时间的可加可乘风险率模型的估计问题。我们提出了一个两阶段估计过程来估计模型的回归参数。并通过模拟分析验证了估计的大样本性质。最后利用该方法分析了恶性黑色素瘤手术治疗数据。  相似文献   

13.
在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量.为了估计模型中的系数矩阵,本文提出一个两阶段方法,先对数据进行逆概率删失加权(IPCW),再用SESS算法求解一个稀疏降秩回归问题.本文通过数值模拟,验证了所提方法的有效性.最后将该方法应用于一个关于白血病患者骨髓移植的临床数据集.  相似文献   

14.
在生物医学研究中,研究个体的失效时间往往存在删失,Cox比例风险模型是经常被用来处理此类删失数据的模型.对于带有删失的高维数据,如何从众多协变量中挑选出少数的致病因素是研究者的兴趣所在.本文针对高维删失数据利用SELO惩罚函数考虑了基于Cox比例风险模型框架下的变量选择及参数估计问题.在允许协变量维数发散的条件下,本文给出SELO惩罚估计量的相合性以及oracle性质.计算方面若采用传统方法计算惩罚估计解,当协变量维数较高时计算Hesse阵的逆矩阵需要花费大量的时间,且SELO惩罚函数在原点的不光滑性也给计算SELO惩罚估计带来很大难度.为此,本文利用光滑化技术对SELO惩罚函数进行近似,并利用DFP公式去代替Hesse阵的逆矩阵,进而提出了MSQN算法.模拟计算的结果表明,SELO惩罚方法比已有常用的惩罚方法表现更好,而且本文提出的新算法与常用的坐标下降算法相比表现更优.在真实数据部分,本文还分析了乳腺癌数据,并利用留一交叉验证法来评估预测的好坏.  相似文献   

15.
为了分析删失数据,该文考虑变系数部分线性模型,此模型允许协变量对响应变量存在非线性影响.响应变量与协变量之间关系的统计模型通过线性结构来拟合是非常重要而且有益.对于删失数据,常用的统计方法不能直接应用于此模型.该文首先提出一类数据变换用以建立无偏条件期望.然后利用profile最小二乘方法,给出了模型中参数分量和非参数分量的profile最小二乘估计,并建立了这些估计的渐近正态性.最后通过数值例子来说明该文所提出的方法的有效性.  相似文献   

16.
文章基于可加风险模型假设,采用偏最小二乘回归和有监督的主成分回归两种投影降维方法,研究了高维协变量情况下现状数据的降维问题。通过深入地模拟试验,对比两种降维方法在高维相关现状数据的生存预测方面的表现,最后将两种降维方法结合实际数据集进行实证分析。模拟和实证结果表明这两种降维方法能很好地处理具有高维、强相关协变量的小样本数据集,比如基因微阵列数据。在后续的研究中,有望将现状数据扩展至其它更一般的区间删失数据。  相似文献   

17.
医药临床试验,生存分析,可靠性统计等研究领域,由于考虑到时间和费用问题,研究往往有一定期限.因为研究到期的被迫结束或者某些病人中途退出试验,最后得到的试验结果往往是删失数据.对于删失数据,采用无偏转换的方法处理,方法的最大优点是得到的估计量为显式解.首先讨论了在纵向右删失数据下线性回归模型回归系数估计的均方相合性,并且把结论推广到了污染线性模型,得到了污染系数、回归系数的强相合估计.  相似文献   

18.
长度偏差右删失数据是一类复杂的数据,观察到的数据分布与总体分布有所改变且其删失是有信息删失,通常的统计分析方法并不能直接应用到长度偏差数据中.本文将在长度偏差右删失数据下研究均值剩余寿命函数,提出其非参数估计方法,在估计中通过加入长度偏差右删失数据辅助信息,即截断变量和进入试验后的剩余存活时间同分布的辅助信息来提高估计的效率.虽然极大似然方法是有效估计,但是其构造复杂且计算需要迭代来实现,计算量大.为此,本文考虑通过简单的加入辅助信息的方法来构造估计量,并给出估计量的相合性及渐近正态性.本文提出的加入辅助信息估计方法与以往类似方法相比具有较简单的显式表达式,计算方便.  相似文献   

19.
当真实的潜在模型具有稀疏表示时通常需要使用变量选择方法,确定模型中的重要预测因子可提高被拟合模型的预测性能,许多文献研究了这类问题,其中张和吕[1]针对右删失数据开发了一种基于比例风险模型的变量选择方法.本文研究了基于当前状态数据的加法风险模型的变量选择问题.在文献[1]的启发下,我们提出一种自适应Lasso方法来解决...  相似文献   

20.
在数据收集过程中,由于各种原因可能造成数据不完整的情况,并将严重影响数据挖掘的质量和结果的稳健性.本文基于EM算法,在SPSS软件的环境下,有效解决了一元线性模型下删失数据带来的参数估计问题,并将此方法实证推广到多元线性回归的模型中.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号