共查询到20条相似文献,搜索用时 15 毫秒
1.
在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一种可以处理超高维Ⅱ型区间删失数据且不依赖于任何模型假设的变量筛选方法.此方法的适用范围很广,可以有效地处理各种生存模型下的超高维Ⅱ型区间删失数据,而且可以处理离散型,连续型等多种类型的协变量.在估计生存函数时,本文采用EM-ICM算法,极大地提高了计算效率.大量的数值模拟实验验证了此方法在有限样本下的有效性. 相似文献
2.
在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量.为了估计模型中的系数矩阵,本文提出一个两阶段方法,先对数据进行逆概率删失加权(IPCW),再用SESS算法求解一个稀疏降秩回归问题.本文通过数值模拟,验证了所提方法的有效性.最后将该方法应用于一个关于白血病患者骨髓移植的临床数据集. 相似文献
3.
4.
5.
6.
7.
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好. 相似文献
8.
纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果. 相似文献
9.
为了分析删失数据,该文考虑变系数部分线性模型,此模型允许协变量对响应变量存在非线性影响.响应变量与协变量之间关系的统计模型通过线性结构来拟合是非常重要而且有益.对于删失数据,常用的统计方法不能直接应用于此模型.该文首先提出一类数据变换用以建立无偏条件期望.然后利用profile最小二乘方法,给出了模型中参数分量和非参数分量的profile最小二乘估计,并建立了这些估计的渐近正态性.最后通过数值例子来说明该文所提出的方法的有效性. 相似文献
10.
《中国科学:数学》2020,(3)
在临床医学及流行病学等研究中,研究人员经常会关心患者经过某种治疗后的平均寿命.由于删失的存在,使得生存函数的尾部估计偏差较大,在实际问题中通常考虑限定平均寿命作为衡量处理功效的指标.本文针对非随机化分组的治疗功效差异问题,考虑生存时间同时存在独立和相依两种删失情形下的限定平均寿命差异推断问题.本文利用两种模型分别解释两种类型的混杂因子,建立比例风险模型用以解释基准协变量,建立加性风险模型用以解释依时协变量,利用逆概率删失权方法给出模型参数的估计并讨论估计量的大样本性质.通过随机模拟给出估计方法在偏度和精度方面的表现.最后,将本文给出的方法用于肝硬化患者两种治疗方法的功效差异分析. 相似文献
11.
生存数据经过未知的单调变换后等于协变量的线性函数加上随机误差, 随机误差的分布函数已知或是带未知参数的已知函数\bd 本文先给出未知单调变换的一个相合估计, 再对删失数据做变换, 在此基础上给出了协变量系数的最小二乘估计, 并讨论它的大样本性质. 相似文献
12.
《应用概率统计》2016,(4)
在生存分析中,对右删失数据问题的研究常假设删失时间与失效时间相互独立.然而研究者经常要面对非独立删失的问题,即删失时间与失效时间可能相互关联并彼此影响,尤其表现在临床试验中.如果不考虑这种相关性,便无法得到生存函数的有效估计.针对这种相依结构已有很多处理方法,其中连接函数因结构简单而尤为受到关注.本文主要对信息右删失数据下比例风险模型的相关估计问题进行了研究.利用阿基米德连接函数对删失时间和失效时间的联合分布函数进行假定,在连接函数参数的可识别条件下,得到了连接函数的参数、比例风险模型参数以及基准累积风险函数的极大似然估计,并通过模拟计算的方法验证了估计方法的可行性以及估计量的有效性. 相似文献
13.
14.
15.
刘丽萍 《数学的实践与认识》2017,(11):171-177
高维数据背景下,数据维度和噪声的影响使得传统的GARCH模型不再适用.针对对角GARCH(goGARCH)模型的不足,将高维稀疏建模法应用到其估计过程中,提出了高维稀疏对角GARCH(HDS-goGARCH)模型.HDS-goGARCH模型通过引入惩罚函数,将一些不重要变量的回归系数压缩为零,来精简模型,达到降维的目的.通过模拟和实证研究发现:较传统的goGARCH模型而言,HDS-goGARCH模型明显提高了高维协方差阵的估计和预测效率;并且将其应用在投资组合时:在收益一定的情况下,由HDS-goGARCH模型所构造的投资组合的风险更小. 相似文献
16.
文章基于可加风险模型假设,采用偏最小二乘回归和有监督的主成分回归两种投影降维方法,研究了高维协变量情况下现状数据的降维问题。通过深入地模拟试验,对比两种降维方法在高维相关现状数据的生存预测方面的表现,最后将两种降维方法结合实际数据集进行实证分析。模拟和实证结果表明这两种降维方法能很好地处理具有高维、强相关协变量的小样本数据集,比如基因微阵列数据。在后续的研究中,有望将现状数据扩展至其它更一般的区间删失数据。 相似文献
17.
最近几年,函数型数据分析的理论和应用飞速发展.在许多实际应用里,响应变量往往存在随机右删失的情况.考虑利用函数型部分线性分位数回归模型来刻画函数型和标量预测量与右删失响应变量之间的关系.基于函数型主成分基函数来逼近未知的斜率函数,通过极小化逆概率加权分位数损失函数得到未知系数的估计量.文章的估计方法容易通过加权分位数回归程序实现.在一定的假设条件下,给出了有限维参数估计量的渐近正态性与斜率函数估计量的收敛速度.最后,通过模拟计算与应用实例证明了所提方法的有效性. 相似文献
18.
广义部分线性模型是广义线性模型和部分线性模型的推广,是一种应用广泛的半参数模型.本文讨论的是该模型在线性协变量和响应变量均存在非随机缺失数据情形下参数的Bayes估计和基于Bayes因子的模型选择问题,在分析过程中,采用了惩罚样条来估计模型中的非参数成分,并建立了Bayes层次模型;为了解决Gibbs抽样过程中因参数高度相关带来的混合性差以及因维数增加导致出现不稳定性的问题,引入了潜变量做为添加数据并应用了压缩Gibbs抽样方法,改进了收敛性;同时,为了避免计算多重积分,利用了M-H算法估计边缘密度函数后计算Bayes因子,为模型的选择比较提供了一种准则.最后,通过模拟和实例验证了所给方法的有效性. 相似文献
19.
在回归分析中往往对条件均值,条件方差及高阶条件矩特别感兴趣.本文我们将关注中心k阶条件矩子空间在高维相依自变量情形的估计问题.为此,我们首先引入中心k阶条件矩子空间的概念,并研究该子空间的基本性质.针对高维相依自变量的复杂数据,为了避免预测变量协方差阵的逆矩阵的计算,本文提出用偏最小二乘方法来估计中心k阶条件矩子空间.... 相似文献
20.
何朝兵 《高校应用数学学报(A辑)》2016,(4):413-427
通过添加部分缺失寿命变量数据,得到了删失截断情形下失效率变点模型相对简单的似然函数.讨论了所添加缺失数据变量的概率分布和随机抽样方法.利用Monte Carlo EM算法对未知参数进行了迭代.结合Metropolis-Hastings算法对参数的满条件分布进行了Gibbs抽样,基于Gibbs样本对参数进行估计,详细介绍了MCMC方法的实施步骤.随机模拟试验的结果表明各参数Bayes估计的精度较高. 相似文献