首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一种可以处理超高维Ⅱ型区间删失数据且不依赖于任何模型假设的变量筛选方法.此方法的适用范围很广,可以有效地处理各种生存模型下的超高维Ⅱ型区间删失数据,而且可以处理离散型,连续型等多种类型的协变量.在估计生存函数时,本文采用EM-ICM算法,极大地提高了计算效率.大量的数值模拟实验验证了此方法在有限样本下的有效性.  相似文献   

2.
在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量.为了估计模型中的系数矩阵,本文提出一个两阶段方法,先对数据进行逆概率删失加权(IPCW),再用SESS算法求解一个稀疏降秩回归问题.本文通过数值模拟,验证了所提方法的有效性.最后将该方法应用于一个关于白血病患者骨髓移植的临床数据集.  相似文献   

3.
本文考虑高维线性模型中的变量选择和参数估计.提出了一种广义的SELO方法求解惩罚最小二乘问题.一种坐标下降算法结合调节参数的一种连续化策略和高维BIC被用来计算相应的GSELO-PLS估计.模拟研究和实际数据分析显示了提出方法的良好表现.  相似文献   

4.
本文在竞争风险数据下提出一种灵活的含变系数的可加可乘的子分布风险率模型.通过对删失时间的风险函数建立Cox比例风险模型,得到调整后的与协变量相依的权重,在新权重下建立估计方程来估计模型参数,并获得了估计的大样本性质,同时提出了模型中协变量的时变效应的检验方法.通过数值模拟验证了所提方法的有限样本性质,结果表明所提方法可以大大降低估计偏差.最后,分析了一组淋巴滤泡细胞的竞争风险数据集来展示所提方法的实际应用效果.  相似文献   

5.
在临床数据的收集中,由于竞争性风险或者病人的退出可能导致数据删失.删失数据的统计分析大多是基于独立删失的假定进行的.而实际情况中,数据的删失往往是非独立的,即删失变量和失效时间变量是相关的.相依删失使得原本复杂的删失数据处理变得更加困难.在本文中,假定删失变量和失效时间变量的联合分布可以用它们边际分布的连接函数函数表示,在给定连接函数下,得到了比例风险模型的极大似然估计.模拟计算显示,如果删失假定成立,本文所采用方法比独立删失假定下的估计方法更准确.  相似文献   

6.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

7.
孙桂萍  赵目  周勇 《数学学报》2022,(4):607-624
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好.  相似文献   

8.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果.  相似文献   

9.
为了分析删失数据,该文考虑变系数部分线性模型,此模型允许协变量对响应变量存在非线性影响.响应变量与协变量之间关系的统计模型通过线性结构来拟合是非常重要而且有益.对于删失数据,常用的统计方法不能直接应用于此模型.该文首先提出一类数据变换用以建立无偏条件期望.然后利用profile最小二乘方法,给出了模型中参数分量和非参数分量的profile最小二乘估计,并建立了这些估计的渐近正态性.最后通过数值例子来说明该文所提出的方法的有效性.  相似文献   

10.
在临床医学及流行病学等研究中,研究人员经常会关心患者经过某种治疗后的平均寿命.由于删失的存在,使得生存函数的尾部估计偏差较大,在实际问题中通常考虑限定平均寿命作为衡量处理功效的指标.本文针对非随机化分组的治疗功效差异问题,考虑生存时间同时存在独立和相依两种删失情形下的限定平均寿命差异推断问题.本文利用两种模型分别解释两种类型的混杂因子,建立比例风险模型用以解释基准协变量,建立加性风险模型用以解释依时协变量,利用逆概率删失权方法给出模型参数的估计并讨论估计量的大样本性质.通过随机模拟给出估计方法在偏度和精度方面的表现.最后,将本文给出的方法用于肝硬化患者两种治疗方法的功效差异分析.  相似文献   

11.
生存数据经过未知的单调变换后等于协变量的线性函数加上随机误差, 随机误差的分布函数已知或是带未知参数的已知函数\bd 本文先给出未知单调变换的一个相合估计, 再对删失数据做变换, 在此基础上给出了协变量系数的最小二乘估计, 并讨论它的大样本性质.  相似文献   

12.
在生存分析中,对右删失数据问题的研究常假设删失时间与失效时间相互独立.然而研究者经常要面对非独立删失的问题,即删失时间与失效时间可能相互关联并彼此影响,尤其表现在临床试验中.如果不考虑这种相关性,便无法得到生存函数的有效估计.针对这种相依结构已有很多处理方法,其中连接函数因结构简单而尤为受到关注.本文主要对信息右删失数据下比例风险模型的相关估计问题进行了研究.利用阿基米德连接函数对删失时间和失效时间的联合分布函数进行假定,在连接函数参数的可识别条件下,得到了连接函数的参数、比例风险模型参数以及基准累积风险函数的极大似然估计,并通过模拟计算的方法验证了估计方法的可行性以及估计量的有效性.  相似文献   

13.
提供一种求解Cox模型的新方法:基于Cox模型的基本特征构造虚拟响应变量,在此基础上利用最小二乘迭代算法得到基准生存函数和回归系数的估计,并进一步将该算法推广到广义Cox模型,利用局部多项式方法拟合虚拟响应变量,解决了协变量作用形式为非参的情形.  相似文献   

14.
本文研究长度偏差数据下剩余寿命分位数模型的估计方法,充分考虑有偏抽样机制对模型估计的影响.如果忽略这种有偏性会导致估计产生严重偏差甚至错误的结果.本文首先针对长度偏差右删失数据的剩余寿命分位数提出了对数形式的线性回归模型,对删失变量与协变量独立和不独立的两种情况利用估计方程给出了模型参数的估计.其次,通过经验过程和弱收敛理论给出了参数估计的相合性和渐近正态性.最后,本文对提出的估计方法进行了数值模拟并用该方法对奥斯卡奖数据进行分析.  相似文献   

15.
高维数据背景下,数据维度和噪声的影响使得传统的GARCH模型不再适用.针对对角GARCH(goGARCH)模型的不足,将高维稀疏建模法应用到其估计过程中,提出了高维稀疏对角GARCH(HDS-goGARCH)模型.HDS-goGARCH模型通过引入惩罚函数,将一些不重要变量的回归系数压缩为零,来精简模型,达到降维的目的.通过模拟和实证研究发现:较传统的goGARCH模型而言,HDS-goGARCH模型明显提高了高维协方差阵的估计和预测效率;并且将其应用在投资组合时:在收益一定的情况下,由HDS-goGARCH模型所构造的投资组合的风险更小.  相似文献   

16.
文章基于可加风险模型假设,采用偏最小二乘回归和有监督的主成分回归两种投影降维方法,研究了高维协变量情况下现状数据的降维问题。通过深入地模拟试验,对比两种降维方法在高维相关现状数据的生存预测方面的表现,最后将两种降维方法结合实际数据集进行实证分析。模拟和实证结果表明这两种降维方法能很好地处理具有高维、强相关协变量的小样本数据集,比如基因微阵列数据。在后续的研究中,有望将现状数据扩展至其它更一般的区间删失数据。  相似文献   

17.
最近几年,函数型数据分析的理论和应用飞速发展.在许多实际应用里,响应变量往往存在随机右删失的情况.考虑利用函数型部分线性分位数回归模型来刻画函数型和标量预测量与右删失响应变量之间的关系.基于函数型主成分基函数来逼近未知的斜率函数,通过极小化逆概率加权分位数损失函数得到未知系数的估计量.文章的估计方法容易通过加权分位数回归程序实现.在一定的假设条件下,给出了有限维参数估计量的渐近正态性与斜率函数估计量的收敛速度.最后,通过模拟计算与应用实例证明了所提方法的有效性.  相似文献   

18.
广义部分线性模型是广义线性模型和部分线性模型的推广,是一种应用广泛的半参数模型.本文讨论的是该模型在线性协变量和响应变量均存在非随机缺失数据情形下参数的Bayes估计和基于Bayes因子的模型选择问题,在分析过程中,采用了惩罚样条来估计模型中的非参数成分,并建立了Bayes层次模型;为了解决Gibbs抽样过程中因参数高度相关带来的混合性差以及因维数增加导致出现不稳定性的问题,引入了潜变量做为添加数据并应用了压缩Gibbs抽样方法,改进了收敛性;同时,为了避免计算多重积分,利用了M-H算法估计边缘密度函数后计算Bayes因子,为模型的选择比较提供了一种准则.最后,通过模拟和实例验证了所给方法的有效性.  相似文献   

19.
在回归分析中往往对条件均值,条件方差及高阶条件矩特别感兴趣.本文我们将关注中心k阶条件矩子空间在高维相依自变量情形的估计问题.为此,我们首先引入中心k阶条件矩子空间的概念,并研究该子空间的基本性质.针对高维相依自变量的复杂数据,为了避免预测变量协方差阵的逆矩阵的计算,本文提出用偏最小二乘方法来估计中心k阶条件矩子空间....  相似文献   

20.
通过添加部分缺失寿命变量数据,得到了删失截断情形下失效率变点模型相对简单的似然函数.讨论了所添加缺失数据变量的概率分布和随机抽样方法.利用Monte Carlo EM算法对未知参数进行了迭代.结合Metropolis-Hastings算法对参数的满条件分布进行了Gibbs抽样,基于Gibbs样本对参数进行估计,详细介绍了MCMC方法的实施步骤.随机模拟试验的结果表明各参数Bayes估计的精度较高.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号