首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 312 毫秒
1.
许多大型队列研究的主要预算和成本通常来自昂贵的关键协变量的采集与测量.在有限的预算或者时间下,观测大型队列中所有研究对象的昂贵协变量往往是不可行和低效的.因此,研究人员一直致力于寻找和使用能节约成本并能达到预设效率的抽样设计方法.对于生存数据,病例队列设计正是这样一种具有成本效益的有偏抽样机制.进一步,在病例队列研究中,为了利用更多的数据先验信息来提高研究的效率,可以在统计建模过程中对模型参数进行合理的假设和约束.本文研究病例队列设计下带约束的Cox模型中参数的估计方法.我们提出了一种加权约束估计的方法,并建立了所提出估计的渐近理论.发展了一种新的约束MM算法来实现所提出的加权约束估计的数值计算.通过统计模拟研究评估了所提出方法在有限样本量下的表现.分析了一个肾母细胞瘤的实际数据来展示所提出方法的实际应用价值.  相似文献   

2.
基于病例队列数据的比例风险模型的诊断   总被引:1,自引:0,他引:1  
余吉昌  曹永秀 《数学学报》2020,63(2):137-148
病例队列设计是一种在生存分析中广泛应用的可以降低成本又能提高效率的抽样方法.对于病例队列数据,已经有很多统计方法基于比例风险模型来估计协变量对生存时间的影响.然而,很少有工作基于病例队列数据来检验模型的假设是否成立.在这篇文章中,我们基于渐近的零均的值随机过程提出了一类检验统计量,这类检验统计量可以基于病例队列数据来检验比例风险模型的假设是否成立.我们通过重抽样的方法来逼近上述检验统计量的渐近分布,通过数值模拟来研究所提方法在有限样本下的表现,最后将所提出的方法应用于一个国家肾母细胞瘤研究的真实数据集上.  相似文献   

3.
对于大型队列研究或观察型研究,基于生存数据的病例队列设计是一种能有效节约成本和提高效率的抽样机制.这种抽样设计仅对一个随机抽取的子队列以及子队列之外所有经历了感兴趣事件的病例个体进行关键协变量的测量,具有显著的成本效益.本文研究如何应用比例风险模型拟合病例队列研究数据.探讨逆概率加权和与时间相关加权这两种基于加权估计方程的统计推断方法和其渐近性质等理论结果.通过一系列的统计模拟研究展示了病例队列设计的优良性以及相较于传统简单随机抽样设计的高效性.进一步,应用这两种推断方法分析了两个实际数据,展示了其在实际中的应用价值和前景.  相似文献   

4.
Liu等人在聚类抽样的情形下基于贝塔二项分布模型讨论了风险比的区间估计问题.本文以他们的研究为背景,建立了一类聚类抽样样本的广义线性模型,并采用拟似然方法导出相应的广义估计方程,从而获得风险比的直接估计.这种方法不需要假定分布的具体形式,因而比Liu等人的方法具有更好的适用性.最后在一定正则条件下证明了估计的相合性和渐近正态性质.  相似文献   

5.
在大型队列研究中,病例-队列设计是一种可以有效节约成本的试验设计方法.本文研究了在病例-队列设计下,基于长度偏差数据的比例均值剩余寿命模型的统计推断问题,提出了一种带有时间相依权重的加权混合估计方程方法来估计模型中的回归系数,并证明了在适当条件下,所得到的估计量具有相合性与渐近正态性.模拟结果表明本文所提出的方法在有限样本下的表现不错.最后,我们将所提出的方法应用到了一组实际数据中.  相似文献   

6.
病例队列设计因为具有成本效益而被广泛应用于流行病学和生物医学的研究中.对于病例队列设计,现有的统计方法主要集中在如何得到回归参数的相合及有效的估计上,然而很少有工作估计非随机化处理的因果效应.本文基于病例队列设计数据提出了一种有效的估计平均处理效应的方法,建立了所提估计量的相合性和渐近正态性,并通过仿真研究考察了其在有限样本下的表现.最后,我们将所提方法应用于真实数据的分析中.  相似文献   

7.
为了估计疾病暴露因素之间的交互作用,提出了一种分析疾病暴露因素的交互作用的有效方法.该方法建立一个广义线性模型,通过估计模型中的参数及方差、协方差,定量的分析交互作用的大小和类型,不仅适用于队列研究资料,同时也适用用于病例-对照研究资料.  相似文献   

8.
孙桂萍  赵目  周勇 《数学学报》2022,(4):607-624
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好.  相似文献   

9.
利用最大似然估计和广义区间估计方法,研究了元件的强度和承受的应力均服从指数分布时系统应力强度模型可靠度的估计问题,导出了可靠度的最大似然估计和广义区间估计.同时也讨论了模型的拟合检验问题.利用模拟方法研究了提出的广义置信区间的覆盖率和拟合检验的功效,模拟结果表明提出的广义置信区间的覆盖率与名义置信系数是一致的,提出的拟合检验的功效是好的.最后用一个例子说明提出的方法.  相似文献   

10.
《数理统计与管理》2019,(6):996-1004
在抽样调查领域中,关于抽样方案设计的研究应用较为充分和完整,但关于抽样估计的研究应用却较为缺乏和滞后。本文首先总结了国外相关研究成果,研究了基于广义加权回归的抽样估计方法,同时证明其满足渐近设计无偏和最小化渐近期望方差的理论条件。同时,本文以各类常见的抽样设计为基础,通过模型组和模型水平将现有的超总体回归模型进行扩展,基于复杂的多阶连续抽样调查,建立各种类型的超总体回归模型进行模型辅助的广义加权回归抽样估计,给出了具体的回归估计步骤和结果,最终形成一套关于广义加权回归抽样估计的理论方法体系,为抽样估计方法在我国政府统计部门中的有效应用奠定理论基础。  相似文献   

11.
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽样算法是Wang等(2018)[1]提出的基于L-最优和A-最优的思想,确定每个抽样单元的入样概率。本文在此基础上,定义多目标抽样的各单元的入样概率,并推导模型参数估计量的渐近性质,最后用模拟数据和实际例子对均值两步子抽样算法和多目标两步子抽样方法进行比较。结果表明,在样本量相同时,A-最优准则下均值两步子抽样算法在估计精度上优于基于两步子抽样算法的MPPS抽样和L-最优准则下均值多目标两步子抽样算法。在计算效率上也较全样本估计有显著的提高,节约了计算时间。  相似文献   

12.
本文讨论了广义加权保费原理下的信度估计,并把结论推广到多合同模型.通过概率分布的变换,本文得到了多合同模型下广义加权保费的非齐次和齐次信度估计.并且讨论了这些估计的统计性质.最后,运用重抽样方法讨论了信度因子中未知结构参数的估计.数值模拟表明,非齐次信度估计能运用于保险实际.  相似文献   

13.
半参数再生散度模型是再生散度模型和半参数回归模型的推广,包括了半参数广义线性模型和广义部分线性模型等特殊类型.讨论的是该模型在响应变量和协变量均存在非随机缺失数据情形下参数的Bayes估计和基于Bayes因子的模型选择问题.在分析中,采用了惩罚样条来估计模型中的非参数成分,并建立了Bayes层次模型;为了解决Gibbs抽样过程中因参数高度相关带来的混合性差以及因维数增加导致出现不稳定性的问题,引入了潜变量做为添加数据并应用了压缩Gibbs抽样方法,改进了收敛性;同时,为了避免计算多重积分,利用了M-H算法估计边缘密度函数后计算Bayes因子,为模型的选择比较提供了一种准则.最后,通过模拟和实例验证了所给方法的有效性.  相似文献   

14.
广义部分线性模型是广义线性模型和部分线性模型的推广,是一种应用广泛的半参数模型.本文讨论的是该模型在线性协变量和响应变量均存在非随机缺失数据情形下参数的Bayes估计和基于Bayes因子的模型选择问题,在分析过程中,采用了惩罚样条来估计模型中的非参数成分,并建立了Bayes层次模型;为了解决Gibbs抽样过程中因参数高度相关带来的混合性差以及因维数增加导致出现不稳定性的问题,引入了潜变量做为添加数据并应用了压缩Gibbs抽样方法,改进了收敛性;同时,为了避免计算多重积分,利用了M-H算法估计边缘密度函数后计算Bayes因子,为模型的选择比较提供了一种准则.最后,通过模拟和实例验证了所给方法的有效性.  相似文献   

15.
候选者数据库网络调查下非概率抽样的统计推断问题是网络调查发展中迫切需要解决的问题.提出基于倾向得分广义线性模型的非概率抽样推断方法:将网络候选者数据库的调查样本与参考样本结合,建立Logistic、Probit、C-log-log三种广义线性模型来估计倾向得分,并对网络候选者数据库的调查样本进行倾向得分未加权比例的分组调整与倾向得分加权比例的分组调整来估计总体.研究结果表明:基于倾向得分广义线性模型的总体估计效果较好,并且使用调查权数的Logistic与C-log-log倾向得分未加权比例的分组调整估计最为稳健.  相似文献   

16.
在抽样估计中,当超总体模型为非线性形式时,广义回归估计量和最优估计量的估计效果均有待提高,而非参数回归估计量虽然能在一定程度上提高估计精度,但需要获得全部总体单位的辅助变量值,这在实际调查中往往难以满足。本文基于传统的广义回归估计量和最优估计量,借鉴非参数回归中局部多项式的估计思想,对原始辅助变量信息进行扩展,得到原始辅助变量多次方形式的新辅助变量,进而研究提出广义最优回归估计量。该估计量可以克服广义回归估计量、最优估计量和非参数回归估计量的缺陷,并证明其满足渐近无偏性和一致性。在不同超总体模型下,通过数值模拟方法比较了各类回归抽样估计方法的估计效果,模拟结果显示:在线性模型下,除了π估计量的精度较差,其余各类估计量的估计精度基本相同;但在非线性模型下,最优估计量和广义回归估计量的估计精度明显下降,而广义最优回归估计量和非参数的局部多项式回归估计量的估计精度都较好。  相似文献   

17.
在大数据下,全样本量很大,未知参数极大似然估计的计算变得十分困难.文章主要对于广义线性模型参数的极大似然估计研究一种有效的计算方法.首先证明了随机抽样算法下的估计量的渐近正态性,由此提出了入样概率的选取准则及两步随机抽样算法.模拟研究表明,绝大部分情况下,运用文章提出的方法所得到广义线性模型极大似然估计量的均方误差低于与之对比的简单随机抽样.  相似文献   

18.
利用广义p值和参数bootstrap方法,研究了Panel数据模型中未知参数的假设检验问题.对于回归系数,基于最小二乘估计和两步估计方法,考虑了非齐次线性假设检验问题.对于方差分量,研究了单边假设检验问题.进而利用Monte Carlo方法进行模拟研究.模拟结果表明,参数bootstrap检验方法既能较好控制犯第一类错误的概率,又具有较高的功效,且大多数情况下优于广义p值检验方法.  相似文献   

19.
本文讨论嵌套病例对照研究中相对危险率的估计问题,引入了相对危险率的两步估计,并在一般嵌套病例对照抽样的假设下讨论了相对危险率的两步估计的相合性问题,最后给出了几个例子。  相似文献   

20.
本文讨论嵌套病例对照研究中相对危险率的估计问题,引入了相对危险率的两步估计,并在一般嵌套病例对照抽样的假设下讨论了相对危险率的两步估计的相合性问题.最后给出了几个例子.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号