首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
非概率抽样在大数据时代有广阔的应用空间,但其统计推断问题仍有待研究和发展.针对这一问题,提出利用基于模型的推断方法结合配额抽样实现非概率样本的统计推断,其思路是先设定线性回归形式的超总体模型,再利用配额样本观测数据拟合模型估计未知参数,进而利用模型对非观测单元进行预测,案例分析结果显示基于超总体模型的推断方法是解决非概率样本统计推断的有力途径,具有较大的深入研究价值.  相似文献   

2.
孙桂萍  赵目  周勇 《数学学报》2022,(4):607-624
剩余寿命是刻画个体预期寿命的一个重要度量,对剩余寿命的早期研究主要集中在剩余均值上.然而当总体生存函数偏态或厚尾时剩余均值函数可能不存在,因此统计学者建议用剩余寿命分位数来刻画预期寿命.在完全数据和右删失数据下,剩余寿命分位数的建模和理论已经很完善.但是,在实际的调查研究中经常会遇到偏差抽样数据.例如,临床医学中的左截断数据,流行病学中的病例队列抽样数据,医学大型队列研究中的长度偏差抽样数据等等.忽略抽样偏差会导致参数估计有偏和不合理的推断结果.本文考虑一般偏差右删失数据下剩余寿命分位数回归的统计推断问题.首先,我们提出了一个一般偏差右删失数据下的剩余寿命分位数回归模型,并利用一般估计方程方法对模型中的参数进行了估计.针对已有文献常用的删失变量与协变量独立性假设,本文重点考虑了删失变量依赖于协变量场合.其次,由于估计量的渐近方差中涉及非参密度函数,在估计渐近方差时,本文采用Bootstrap方法.最后,数值模拟显示本文提出的方法有限样本性质表现很好.  相似文献   

3.
余鲁  杨宜平 《应用数学》2018,31(4):914-918
本文研究纵向数据下半参数工具变量模型中回归系数的区间估计问题.首先利用B-样条方法逼近半参数模型中的非参数函数.为了处理内生变量和纵向数据的组内相关性,对模型中回归系数提出了基于工具变量和二次推断函数的有效经验对数似然比统计量,并证明所提出统计量渐近服从标准卡方分布,由此构造回归系数的置信域.  相似文献   

4.
研究了有随机效应的Wiener退化模型基于加速退化数据的统计推断问题.利用广义枢轴量方法得到了模型参数和感兴趣可靠性指标的广义置信区间.说明了不含随机效应的Wiener退化模型的统计推断问题是有随机效应的Wiener退化模型的特殊情况.蒙特卡罗模拟结果显示文中提出的区间估计有较好的覆盖比例.最后利用LED加速退化数据说明文中提供的方法的有效性.  相似文献   

5.
纵向数据下广义估计方程估计   总被引:1,自引:0,他引:1  
广义估计方程方法是一种最一般的参数估计方法,广泛地应用于生物统计、经济计量、医疗保险等领域.在纵向数据下,由于组间数据是相关的,为了提高估计的效率,广义估计方程方法一般需要考虑个体组内相关性.因此,大多数文献对个体组内的协方差矩阵进行参数假设,但假设的合理性及协方差矩阵估计的好坏对参数估计效率产生很大影响,同时参数假设也可能导致模型误判.针对纵向数据下广义估计方程,本文提出了改进的GMM方法和经验似然方法,并对给出的估计量建立了大样本性质.其中分块的思想,避免了对个体组内相关性结构进行假设,从这种意义上说,这种方法具有一定的稳健性.我们还通过两个模拟的例子,考察了文中提出估计量的有限样本性质.  相似文献   

6.
本文在多种复杂数据下, 研究一类半参数变系数部分线性模型的统计推断理论和方法. 首先在纵向数据和测量误差数据等复杂数据下, 研究半参数变系数部分线性模型的经验似然推断问题, 分别提出分组的和纠偏的经验似然方法. 该方法可以有效地处理纵向数据的组内相关性给构造经验似然比函数所带来的困难. 其次在测量误差数据和缺失数据等复杂数据下, 研究模型的变量选择问题, 分别提出一个“纠偏” 的和基于借补值的变量选择方法. 该变量选择方法可以同时选择参数分量及非参数分量中的重要变量, 并且变量选择与回归系数的估计同时进行. 通过选择适当的惩罚参数, 证明该变量选择方法可以相合地识别出真实模型, 并且所得的正则估计具有oracle 性质.  相似文献   

7.
半连续数据在经济和社会科学调查中普遍存在.在分析该类数据时,经典两部分回归模型经常被用来刻画协变量对响应变量可变性的影响.然而,包含协变量并不能完全解释响应变量的可变性.忽略未被观测的数据异质性将导致方差的剧烈波动.在本文中,我们将两部分回归模型推广到两部分因子分析模型.多变量半连续数据未观测的异质性由潜在因子部分来解释.此外,通过引入潜在性因子,多重变量间的相依性也以线性组合方式通过共享因子变量得到刻画.在贝叶斯框架内,我们运用马尔可夫链蒙特卡洛(MCMC)方法来进行后验分析.GIBBS采样器被用于从后验分布中抽取样本.基于模拟的随机样本,未知参数估计和模型评价等统计推断问题获得解决.随机模拟和可卡因使用数据分析等实证结果显示了该方法的有效性和实用性.  相似文献   

8.
研究了缺失数据的均值推断问题.在随机缺失及半参数模型的假设下,设计了基于影响函数理论的经验似然推断方法,证明了所构造的对数经验似然比检验统计量具有非参数Wilks性质.此外,该经验似然方法可以利用辅助协变量中提供的附加信息来提高检验的功效.在近邻备择假设下,计算了检验统计量的功效,并且通过一些模拟考察了该方法在有限样本下的表现.  相似文献   

9.
研究了缺失数据的均值推断问题.在随机缺失及半参数模型的假设下,设计了基于影响函数理论的经验似然推断方法,证明了所构造的对数经验似然比检验统计量具有非参数Wilks性质.此外,该经验似然方法可以利用辅助协变量中提供的附加信息来提高检验的功效.在近邻备择假设下,计算了检验统计量的功效,并且通过一些模拟考察了该方法在有限样本下的表现.  相似文献   

10.
本文对二值结局变量数据,基于因果推断理论,提出根据患者的生物标记物进行最优治疗方案选择的统计方法.这种方法基于CSTE(covariate-specific treatment effect)曲线和CSTE曲线的置信带(SCB).CSTE曲线表示在给定生物标记物(协变量)的条件下,处理组的条件平均处理效应.同时,CSTE曲线及其SCB可以被用于对特定的治疗方案选择适宜的患者.本文利用B-样条方法估计CSTE曲线及其CSB,并推导了其近似大样本性质.本文还通过模拟比较研究了CSTE曲线的置信带的有限样本性质,并阐述了CSTE曲线及其置信带在真实数据中如何选择最优治疗方案.  相似文献   

11.
随机总体分位数的统计推断理论与方法一直是统计学研究的重要课题.其主要原因是分位数的应用涉及众多领域,且在各领域的研究中起到举足轻重的作用.本文系统地论述了基于样本次序统计量的总体分位数的非参数统计推断的理论和方法;给出了基于样本次序统计量的总体分位数的估计方法,总体两个分位数之差的置信区间,总体容许区间的求解方法及符号检验.希望有助于读者的科研与应用.  相似文献   

12.
<正>推断性统计学的基本思想方法是用样本估计总体,即通过从总体中抽取一个样本,根据样本的情况去推断总体的相应情况.因此,科学、合理地选择抽样方法采集样本,直接关系到对总体推断的准确程度.在学习中了解简单随机抽样、系统抽样、分层抽样的操作方法以及它们的区别与联系是我们解决有关统计问题的一个重点内容.  相似文献   

13.
在大型队列研究中,病例-队列设计是一种可以有效节约成本的试验设计方法.本文研究了在病例-队列设计下,基于长度偏差数据的比例均值剩余寿命模型的统计推断问题,提出了一种带有时间相依权重的加权混合估计方程方法来估计模型中的回归系数,并证明了在适当条件下,所得到的估计量具有相合性与渐近正态性.模拟结果表明本文所提出的方法在有限样本下的表现不错.最后,我们将所提出的方法应用到了一组实际数据中.  相似文献   

14.
在生物学、社会科学、保险理赔、可靠性和人口统计学等的研究中,我们经常会遇到复发事件数据的处理.最近一段时间以来,两个相邻复发事件的时间间隔的一个纵向数据模型已经引起统计工作者的广泛兴趣.本文中,我们提议另一个复发事件时间间隔模型,它可以用来模拟生存数据中带有所谓的持久生存者.非参数方法将用于我们所提议模型的统计推断,模拟和现实数据的例子将用来评价模型和提议估计方法的小样本性质.  相似文献   

15.
本文基于因果推断理论,提出根据病人的生物标记物进行最优治疗方案选择的统计方法.这种方法是基于CATE (conditional average treatment effect)曲线以及CATE曲线的置信带(SCB)的. CSTE曲线表示给定生物标记物(协变量)的条件下,处理组的条件平均处理效应.同时, CATE曲线及其SCB可以被用于对特定的治疗方案选择适宜的病人.文中利用B样条方法估计CATE曲线及其CSB,并推导了其近似大样本性质.文中还通过模拟比较研究了CATE曲线的置信带的有限样本性质,并阐述了CATE曲线及其置信带在真实数据中如何选择最优治疗方案.  相似文献   

16.
结合二次推断函数法、滤子法和经验似然估计法,为个体内存在相关性的部分线性单指标固定效应面板模型建立了惩罚经验似然估计法.在一些正则条件下,推导了模型估计量的大样本性质,证明了所提出的经验似然比渐近于卡方分布.进一步,用Monte Carlo模拟和真实数据分析评价了估计方法在有限样本下的表现.  相似文献   

17.
非参数核回归方法近年来已被用于纵向数据的分析(Lin和Carroll,2000).一个颇具争议性的问题是在非参数核回归中是否需要考虑纵向数据间的相关性.Lin和Carroll (2000)证明了基于独立性(即忽略相关性)的核估计在一类核GEE估计量中是(渐近)最有效的.基于混合效应模型方法作者提出了一个不同的核估计类,它自然而有效地结合了纵向数据的相关结构.估计量达到了与Lin和Carroll的估计量相同的渐近有效性,且在有限样本情形下表现更好.由此方法可以很容易地获得对于总体和个体的非参数曲线估计.所提出的估计量具有较好的统计性质,且实施方便,从而对实际工作者具有较大的吸引力.  相似文献   

18.
九、总体、样本及统计量  9-1名词解释 前几讲我们介绍了概率论的若干基础知识,从这一讲起我们介绍有关统计的基本概念和常用的统计方法。 在引言中我们讲过统计学的核心内容是统计推断,即通过反映事物局部信息的一组数据对所研究的对象的性质进行推断。为了将问题阐述得更为清楚和精确,有必要引进一些基本概念,解释几个以后经常使用的名词术语。 每个问题都有我们所关心的进行研究的对象。研究对象的全体称为总体。这里所说的对象可以是一个个具体的物体(例如某工厂生产的某种型号的电子管),也可以是物体的某个或某些特性(例如电子管的寿…  相似文献   

19.
人体微生物组对人体健康和疾病起着重要作用.高通量测序技术的发展使得我们可以定量分析微生物组中所有菌种的成分.本文回顾近来在微生物组学研究中的高维计数和成分数据分析方法,其中包括Dirichlet多项分布模型及其拓展、从大维稀疏计数矩阵估计成分数据、高维成分回归和基于对数基底的成分数据统计推断方法.  相似文献   

20.
黄玉  秦永松 《应用数学》2018,31(4):873-883
本文研究强混合样本下部分线性模型的经验似然推断,将分块技术应用到经验似然方法中,证明部分线性模型的参数β的对数经验似然比统计量的渐近分布为卡方分布,由此构造强混合样本下β的经验似然置信区间.在有限样本情况下给出数值模拟结果.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号