首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 31 毫秒
1.
在生存分析研究中,多数文章假定感兴趣的失效时间和删失时间是独立的,但这一假设在实际情况中未必合理。如果忽略失效时间与删失时间的相依性,可能会导致错误的结论。所以本文考虑在带有信息的K型区间删失数据下,采用基于两步估计的极大似然估计方法对误差项服从标准正态分布的加速失效时间模型(accelerated failure time model,AFT)进行参数估计。同时还进行了数值模拟以验证提出方法的有效性。最后,应用所提出的方法分析艾滋病的临床试验数据。  相似文献   

2.
带有治愈亚组的区间删失数据常见于周期性随访或检查的医学研究中,此时研究总体中有一部分个体不会发生所感兴趣的事件,而对于每个发生所感兴趣事件的个体,其事件的发生时间落入某一时间区间内而非被精确地观测到。此外,在实际问题中,我们时常会遇到协变量维数较高的情形,而如何进行变量选择以识别出对疾病发生有重要影响的因素十分重要。本文研究带有治愈亚组的区间删失数据的变量选择问题,我们采用最小近似信息准则方法并提出一种惩罚期望极大化算法来同时实现变量选择和参数估计,所提出方法的一个重要优点是在变量选择过程中无须选择最优调节参数。通过数值模拟,我们比较所提出方法与一般的正则化方法如LASSO,ALASSO,以及SCAD在有限样本下的表现。结果表明,所提出方法有很高的变量选择准确率且在计算上比LASSO,ALASSO和SCAD更加快速、高效。最后,我们将所提出方法应用到一组有关于尼日利亚新生儿童死亡率的区间删失数据中。  相似文献   

3.
在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量.为了估计模型中的系数矩阵,本文提出一个两阶段方法,先对数据进行逆概率删失加权(IPCW),再用SESS算法求解一个稀疏降秩回归问题.本文通过数值模拟,验证了所提方法的有效性.最后将该方法应用于一个关于白血病患者骨髓移植的临床数据集.  相似文献   

4.
为了避免经典方法中Fisher信息矩阵的繁琐计算,并考虑两个或更多应力因子对加速寿命试验的影响,提出了基于区间删失数据的I最优加速寿命试验方案并进行了相应的灵敏度分析.将产品的正常使用条件考虑为一个应力水平组合的区域,I最优准则使得在这个区域上产品寿命的平均预测方差最小.假定失效时间分布服从Cox比例风险模型(Proportional Hazard Model),继而对区间删失数据使用广义线性模型(Generalized Linear Model)方法以得到I最优准则下的加速寿命试验方案,最后从模型参数、检测区间数、样本量、试验时间等角度进行了试验方案的灵敏度分析,验证了试验方案的稳健性,并讨论了如何利用这些因素来降低试验敏感性.  相似文献   

5.
在临床数据的收集中,由于竞争性风险或者病人的退出可能导致数据删失.删失数据的统计分析大多是基于独立删失的假定进行的.而实际情况中,数据的删失往往是非独立的,即删失变量和失效时间变量是相关的.相依删失使得原本复杂的删失数据处理变得更加困难.在本文中,假定删失变量和失效时间变量的联合分布可以用它们边际分布的连接函数函数表示,在给定连接函数下,得到了比例风险模型的极大似然估计.模拟计算显示,如果删失假定成立,本文所采用方法比独立删失假定下的估计方法更准确.  相似文献   

6.
聚类区间删失失效时间常出现于医学研究中研究对象来自同一个类中的情形.此外,失效时间可能与类的大小相关.由于缺乏直接分析所需的推演过程,因此常见的简单方式就是简化区间删失数据.鉴于此,本文提出了类内重抽样方法来考虑加法风险模型下的Ⅱ型区间删失问题.类内重抽样的方法简单但需要大量计算,这一方法的主要优势在于在类的大小相关时,估计变量易于实现.渐近性质和部分模拟结果的讨论验证了该方法的有效性.  相似文献   

7.
可加风险模型是生存分析中一类重要的回归模型,许多学者对该模型进行过研究.但是针对相依Ⅰ型区间删失数据的研究却非常少,且已有的研究都假设删失时间与寿命之间的关联系数已知.显然,该假设在实际中未必成立.针对此问题,本文放松这一假设,提出一种新的基于Copula的方法对可加风险模型下相依Ⅰ型区间删失数据进行回归分析,给出参数部分估计量的渐近性质,通过数值模拟检验所提方法在有限样本下的表现,并进行实例分析.  相似文献   

8.
在生存分析中,对右删失数据问题的研究常假设删失时间与失效时间相互独立.然而研究者经常要面对非独立删失的问题,即删失时间与失效时间可能相互关联并彼此影响,尤其表现在临床试验中.如果不考虑这种相关性,便无法得到生存函数的有效估计.针对这种相依结构已有很多处理方法,其中连接函数因结构简单而尤为受到关注.本文主要对信息右删失数据下比例风险模型的相关估计问题进行了研究.利用阿基米德连接函数对删失时间和失效时间的联合分布函数进行假定,在连接函数参数的可识别条件下,得到了连接函数的参数、比例风险模型参数以及基准累积风险函数的极大似然估计,并通过模拟计算的方法验证了估计方法的可行性以及估计量的有效性.  相似文献   

9.
在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一种可以处理超高维Ⅱ型区间删失数据且不依赖于任何模型假设的变量筛选方法.此方法的适用范围很广,可以有效地处理各种生存模型下的超高维Ⅱ型区间删失数据,而且可以处理离散型,连续型等多种类型的协变量.在估计生存函数时,本文采用EM-ICM算法,极大地提高了计算效率.大量的数值模拟实验验证了此方法在有限样本下的有效性.  相似文献   

10.
在生物医学研究中,研究个体的失效时间往往存在删失,Cox比例风险模型是经常被用来处理此类删失数据的模型.对于带有删失的高维数据,如何从众多协变量中挑选出少数的致病因素是研究者的兴趣所在.本文针对高维删失数据利用SELO惩罚函数考虑了基于Cox比例风险模型框架下的变量选择及参数估计问题.在允许协变量维数发散的条件下,本文给出SELO惩罚估计量的相合性以及oracle性质.计算方面若采用传统方法计算惩罚估计解,当协变量维数较高时计算Hesse阵的逆矩阵需要花费大量的时间,且SELO惩罚函数在原点的不光滑性也给计算SELO惩罚估计带来很大难度.为此,本文利用光滑化技术对SELO惩罚函数进行近似,并利用DFP公式去代替Hesse阵的逆矩阵,进而提出了MSQN算法.模拟计算的结果表明,SELO惩罚方法比已有常用的惩罚方法表现更好,而且本文提出的新算法与常用的坐标下降算法相比表现更优.在真实数据部分,本文还分析了乳腺癌数据,并利用留一交叉验证法来评估预测的好坏.  相似文献   

11.
在生存分析中,可加可乘风险率模型常用来研究协变量对初始事件和终止事件之间持续时间的影响效应。在本文中,我们考虑了在初始事件存在部分区间删失,同时终止事件存在左截断右删失的情形下,持续时间的可加可乘风险率模型的估计问题。我们提出了一个两阶段估计过程来估计模型的回归参数。并通过模拟分析验证了估计的大样本性质。最后利用该方法分析了恶性黑色素瘤手术治疗数据。  相似文献   

12.
在生存分析中,加速失效模型(AFT模型)是研究失效时问与协变量之间关系的一类重要模型.在AFT模型框架下,通过在广义M估计的目标函数中使用广义Kaplan-Meier权,本文提出了含相依删失数据的AFT模型回归系数及刻度参数的加权广义M估计.渐近性质方面,得到了广义M估计的相合性和渐近正态性;关于估计量的有限样本性质,通过模拟研究验证了该估计量在有限样本情形下效果良好.  相似文献   

13.
本文研究了加法风险率模型下聚类的当前状态数据(Ⅰ型区间删失数据)的回归分析问题.在相关的失效时间数据与簇类的规模有关的情形下,本文提出了一个簇内再抽样方法,并在一些正则条件下给出了相应估计量的极限分布理论.最后通过模拟实验验证了估计量的有限样本行为.  相似文献   

14.
带有治愈亚组和错误分类的当前状态数据常出现在流行病学调查和医学临床试验等科学领域中。这类数据通常具有三个复杂特点,首先,我们对每个研究个体只检测一次以确定感兴趣事件的发生状态,对于感兴趣事件的发生时间,只知道其大于或小于检测时间,而非被精确观测到;其次,用于确定感兴趣事件发生状态的检测仪器通常具有一定的检测错误,由此产生带有错误分类的数据;此外,研究中有一部分个体可能永远不会发生感兴趣的事件,因此研究总体中可能存在治愈亚组。本文主要讨论带有治愈亚组和错误分类的当前状态数据的回归分析问题。特别地,我们假定感兴趣事件的发生时间服从一类半参数转移非混合治愈模型,提出一种期望极大化(EM)算法来极大化具有复杂形式的观测数据似然函数以得到参数估计。数值模拟结果表明所提出的估计方法在有限样本下具有良好的表现,并且优于忽略错误分类的naive方法。我们还将所提出的方法应用到一组有关于衣原体感染的实际数据中。  相似文献   

15.
孙桂萍  赵目  周勇 《数学学报》2022,(4):607-624
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好.  相似文献   

16.
本文研究了失效时间服从广义指数分布,且风险率函数为比例风险模型时,II型区间删失数据的贝叶斯估计。假定参数的先验分布为无信息先验,建立贝叶斯层次模型从而得到后验密度函数。通过MH算法得到参数估计值,数值模拟结果验证了所提方法的有效性。最后将所提方法应用到乳腺癌患者和血友病患者这两个实际数据中进行分析。  相似文献   

17.
张婧  刘妍岩 《数学学报》2024,(3):582-598
在医学、遗传学、经济学等领域的研究中,线性回归模型常被用来研究变量间的回归关系,以进行分析和预测.而在很多实际问题中,仅仅考虑主效应的影响是远远不够的,变量之间的交互效应也会对因变量产生重要影响,同时考虑主效应和交互效应的交互模型能更全面地刻画变量之间的关系.在高维数据中,变量的个数p比较大,二阶交互项的个数(p(p+1))/2更大,此时对交互模型的统计分析存在很大的困难和挑战.如何从众多交互效应中挑选出对感兴趣事件有显著影响的重要交互效应是一个非常重要的问题.目前对此问题的研究主要集中在线性模型框架下的完全数据,本文将研究超高维右删失生存数据中重要交互效应的选取.基于距离相关系数和两步分析法的原理,本文提出了一种不依赖于任何模型假设的交互效应变量筛选方法.此方法可以同时实现重要主效应和重要交互效应的选取,且可以处理p很大的超高维数据.本文通过大量的数值模拟试验评估了该方法在有限样本下的表现,结果显示此方法能有效地处理超高维右删失数据中交互效应的选取问题.最后本文把它应用到弥漫性大b细胞淋巴瘤(DLBCL)数据的实例分析中.  相似文献   

18.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

19.
零膨胀Poisson回归(ZIP)是处理零频数过多计数资料的有效模型,而计数数据一般含有删失或不精密的特点.本文将删失数据引入到ZIP模型中来,分别建立含右删失数据的固定效应ZIP模型,随机效应ZIP模型,通过极大边际似然函数估计法对模型进行参数估计.最后,利用实例分析验证了上述模型的可行性.  相似文献   

20.
广义逐步混合删失方案作为一种新的可靠性试验方案,它可以保证试验结束前得到一定数量的失效样本以提高试验效率.基于寿命数据分析中广泛使用的广义指数分布,本文考虑了其在广义逐步混合删失方案下的参数推断问题.EM算法被用来给出模型的参数估计.模拟研究和一组实际数据分析展示了所提方法的有限样本表现.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号