期刊界 All Journals 搜尽天下杂志传播学术成果专业期刊搜索期刊信息化学术搜索

1.

赵慧刘斌霞董庆凯张新雨《应用数学学报》2023,(3):313-328

文章研究了响应变量为现状数据的情况下,加速失效时间模型的Jackknife模型平均方法.首先对数据进行合理的无偏变换,进而得到回归参数的最小二乘估计.然后引入删一交叉验证准则来选取候选模型的权重,并在一定正则性条件下,建立对应模型平均估计量的渐近最优性.此外,数值模拟表明,与现有的其他模型平均和模型选择方法相比,本文所提出的方法在预测上表现更佳.最后将所提方法应用于尼日利亚儿童死亡率的数据进行实证研究,进一步验证了所提方法的优良性质. 相似文献

2.

有偏抽样下带信息观察和删失的面板数据的统计分析

下载免费PDF全文

刘焕彬苗瑞孙六全《中国科学:数学》2011,41(4):365-376

面板数据经常出现在许多研究领域, 比如纵向跟踪研究. 在很多情况下, 纵向反应变量与观察时间和删失时间都有关系. 本文在有偏抽样下, 针对这些相关性存在的情况, 利用一个不能观察的潜在变量, 提出了一个联合建模方法来刻画纵向反应变量与观察时间和删失时间的相关性, 获得了模型中回归参数的估计方程以及估计的渐近性质, 并通过数值模拟验证了这些估计在小样本下也是有效的, 同时把该估计方法用于一组实际的膀胱癌数据分析中. 相似文献

3.

基于交叉验证的模型选择中投票和平均方法的对照

侯利君《数学的实践与认识》2019,(9)

统计机器学习中评判模型好坏的准则,必须权衡模型的复杂度与训练数据的拟合优度.常用于评价模型好坏的方法包括AIC,BIC,Cp准则,交叉验证等.而在预测误差的估计中,使用最简单且最广泛的方法是交叉验证方法.考虑最广泛使用的标准K折交叉验证的两种选择方式:投票和平均.实验对照了模型选择中这两种不同的选择方式的差异,为将来人们在进行这两种方式的选择时作参考. 相似文献

4.

基于变系数模型的自适应分位回归方法

张圆圆邓文礼田茂再《数学年刊A辑(中文版)》2012,33(5):539-556

提出了变系数模型条件分位估计的一种新方法.变系数模型已经成为经济学、流行病学、纵向数据和医学领域处理高维数据的有力工具.该模型有助于探测数据的动态特征、降低模型偏差、避免高维灾难,同时便于解释.尽管关于变系数模型条件均值的估计已经有很多文章,但关于变系数模型条件分位的估计方面的文章相对较少.文中提出了一种有效的适应性分位回归方法来诊断出齐性邻域,进行局部自适应窗宽选择和局部线性逼近,同时给出了估计量的风险界和最优窗宽的自动选择准则.模拟研究说明了所提出估计方法的效果. 相似文献

5.

失混合效应模型的分位回归及变量选择

田玉柱李二倩田茂再罗幼喜《数学学报》2017,60(2):315-334

纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果．本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题．首先,逆删失概率加权方法被用来得到模型的参数估计．其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势．最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果．相似文献

6.

删失混合效应模型的分位回归及变量选择

《数学学报》2017,(2)

纵向数据常常用正态混合效应模型进行分析.然而,违背正态性的假定往往会导致无效的推断.与传统的均值回归相比较,分位回归可以给出响应变量条件分布的完整刻画,对于非正态误差分布也可以给稳健的估计结果.本文主要考虑右删失响应下纵向混合效应模型的分位回归估计和变量选择问题.首先,逆删失概率加权方法被用来得到模型的参数估计.其次,结合逆删失概率加权和LASSO惩罚变量选择方法考虑了模型的变量选择问题.蒙特卡洛模拟显示所提方法要比直接删除删失数据的估计方法更具优势.最后,分析了一组艾滋病数据集来展示所提方法的实际应用效果. 相似文献

7.

Cox比例风险模型中基于SELO惩罚函数的变量选择方法

曹永秀焦雨领石跃勇刘妍岩《中国科学:数学》2018,(5)

在生物医学研究中,研究个体的失效时间往往存在删失,Cox比例风险模型是经常被用来处理此类删失数据的模型.对于带有删失的高维数据,如何从众多协变量中挑选出少数的致病因素是研究者的兴趣所在.本文针对高维删失数据利用SELO惩罚函数考虑了基于Cox比例风险模型框架下的变量选择及参数估计问题.在允许协变量维数发散的条件下,本文给出SELO惩罚估计量的相合性以及oracle性质.计算方面若采用传统方法计算惩罚估计解,当协变量维数较高时计算Hesse阵的逆矩阵需要花费大量的时间,且SELO惩罚函数在原点的不光滑性也给计算SELO惩罚估计带来很大难度.为此,本文利用光滑化技术对SELO惩罚函数进行近似,并利用DFP公式去代替Hesse阵的逆矩阵,进而提出了MSQN算法.模拟计算的结果表明,SELO惩罚方法比已有常用的惩罚方法表现更好,而且本文提出的新算法与常用的坐标下降算法相比表现更优.在真实数据部分,本文还分析了乳腺癌数据,并利用留一交叉验证法来评估预测的好坏. 相似文献

8.

删失分位数变系数回归模型的FIC模型平均估计（英文）

《系统科学与数学》2018,(7)

考虑了删失分位数变系数回归模型的FIC准则,并基于FIC准则给出了兴趣参数的模型选择和平均估计.为了全面反映响应变量的分布信息,克服异常值和重尾模型误差,文章对响应变量的不同分位数水平进行建模,因此与普通最小二乘方法相比更为稳健.在较为一般的条件下,证明了所提估计的渐近性质,通过模拟实验研究了估计的有限样本性质,用所提方法分析了手机用户的游戏时间数据. 相似文献

9.

基于局部多项式展开的多元非参数模型贝叶斯带宽选择

韩忠成林金官汪红霞《数理统计与管理》2020,39(1):93-103

在多元非参数模型中带宽和阶的选择对局部多项式估计量的表现十分重要。本文基于交叉验证准则提出一个自适应贝叶斯带宽选择方法。在给定的误差密度函数下,该方法可推导出对应的似然函数,并构造带宽参数的后验密度函数。随后,通过带宽的后验期望可同时获得阶和带宽的估计。数值模拟的结果表明,该方法不仅比大拇指准则方法精确,且比交叉验证方法耗时更少。与此同时,与Nadaraya-Watson估计相比,所提带宽选择方法对多元非参数模型的适应性要更好。最后,本文通过一组实际数据说明有限样本下所提贝叶斯带宽选择的表现很好。相似文献

10.

多指标可加模型及在医疗费用预测中的应用

潘青赵晓兵《应用概率统计》2022,(1):43-52

对医疗费用的建模分析与合理预测是医疗保险费用厘定的基础与根本.医疗费用中的高维附加信息在长期预测中具有重要作用.然而,传统的统计建模方法不适用于处理高维纵向数据下的医疗费用.本文提出部分线性多指标可加模型,对具有高维特征的纵向医疗费用数据进行拟合与预测,并且使用两种不同的降维估计方法进行模型估计,并将该模型应用于一组含... 相似文献

11.

超高维Ⅱ型区间删失数据的非参数变量筛选法北大核心CSCD

张婧靳韶佳陈丹丹《应用数学学报》2021,(5):690-702

在定期随访的医学研究或临床实验中,人们经常会收集到高维区间删失数据,如何对这类数据进行降维是一个非常有意义的问题.本文基于Kolmogorov-Smirnov检验统计量,利用分割和融合的技巧,把独立特征筛选方法推广到区间删失数据中,提出了一种可以处理超高维Ⅱ型区间删失数据且不依赖于任何模型假设的变量筛选方法.此方法的适用范围很广,可以有效地处理各种生存模型下的超高维Ⅱ型区间删失数据,而且可以处理离散型,连续型等多种类型的协变量.在估计生存函数时,本文采用EM-ICM算法,极大地提高了计算效率.大量的数值模拟实验验证了此方法在有限样本下的有效性. 相似文献

12.

异方差线性测量误差模型的平均估计

季琳琳廖军宗先鹏《系统科学与数学》2018,(6)

频率模型平均估计近年来受到较多关注,但目前文献对有测量误差数据的模型平均估计方法研究较少.文章考虑异方差线性测量误差模型平均估计方法,基于Mallows权重选择准则提出了新的模型平均估计,并在理论上证明了其渐近最优性.模拟结果表明,新方法相较于一些常用的模型平均(如SAIC,SBIC)与模型选择方法(如AIC,BIC)具有较大优势. 相似文献

13.

响应变量删失情况下线性模型的FIC模型选择和模型平均

下载免费PDF全文

孙志猛马景义苏治《中国科学:数学》2013,43(7):647-661

本文给出了响应变量随机右删失情况下线性模型的FIC (focused information criterion) 模型选择方法和光滑FIC 模型平均估计方法, 证明了兴趣参数的FIC 模型选择估计和光滑FIC 模型平均估计的渐近正态性, 通过随机模拟研究了估计的有限样本性质, 模拟结果显示, 从均方误差和一定置信水平置信区间的经验覆盖概率看, 兴趣参数的光滑FIC 模型平均估计均优于FIC, AIC (Akaikeinformation criterion) 和BIC (Bayesian information citerion) 等模型选择估计; 而FIC 模型选择估计与AIC 和BIC 等模型选择估计相比, 也表现出了一定的优越性. 通过分析原发性胆汁性肝硬化数据集, 说明了本文方法在实际问题中的应用. 相似文献

14.

广义部分线性单指标模型的最优模型平均方法

张建强陈泽廖军许王莉《中国科学:数学》2023,(11):1461-1486

本文研究广义部分线性单指标模型(generalized partially linear single-index models, GPLSIMs)的模型平均问题.在实际应用中, GPLSIMs由于其灵活性和易解释性受到广泛关注.然而, GPLSIMs在应用中存在两类不确定性:变量的不确定性和单指标连接函数光滑度的不确定性.为了解决该不确定性问题,本文提出一种GPLSIMs的最优模型平均方法,该方法通过最大交叉验证准则得到数据驱动的权重.在模型误设定假设和发散模型空间的框架下,本文证明在最小化Kullback-Leibler (KL)损失准则下,所提出的模型平均估计渐近最优.同时,当候选模型集中存在伪真模型时,本文证明基于交叉验证准则得到的权重渐近地集中在伪真模型上.此外,基于提出的模型平均方法,本文为GPLSIMs构建了一种变量重要性度量,并证明该度量可以渐近识别所有真实模型中的变量.模拟研究和两个实际数据分析均展示了本文提出的方法相对于几种现有方法的优势. 相似文献

15.

基于因子收缩方法的高维协方差估计

杨小卜《数学的实践与认识》2022,(10):94-103

高维协方差矩阵在经济、金融、生物等众多领域中有着广泛应用.基于收缩估计模型,构造样本协方差矩阵与因子模型协方差矩阵的凸线性组合,通过对因子模型的改进来提高模型估计精度.在构造因子模型时,引入因子选择准则(pc_p3(k))来确定因子个数:在确定最优权重α时,使用基于MSE(S)分解的思想求解.通过数据验证发现,相较于传统方法,提升了协方差矩阵估计精确性;在构造投资组合模型时,也可以有效降低投资风险. 相似文献

16.

单调缺失机制下高维纵向线性回归模型的变量选择

汤杨冰田瑞琴徐登可《高校应用数学学报(A辑)》2017,32(2)

在响应变量带有单调缺失的情形下考虑高维纵向线性回归模型的变量选择.主要基于逆概率加权广义估计方程提出了一种自动的变量选择方法,该方法不使用现有的惩罚函数,不涉及惩罚函数非凸最优化的问题,并且可以自动地剔除零回归系数,同时得到非零回归系数的估计.在一定正则条件下,证明了该变量选择方法具有Oracle性质.最后,通过模拟研究验证了所提出方法的有限样本性质. 相似文献

17.

删失分位数回归模型基于扩展兴趣信息准则的平均估计

下载免费PDF全文

孙志猛《中国科学:数学》2014,44(8):857-874

本文结合分位数回归技术,基于删失回归模型,把Claeskens和Hjort的传统兴趣信息准侧(focused information criterion,FIC)扩展到兴趣向量的情形,提出扩展的兴趣信息准则(extended focused information criterion,E-FIC),有效解决了同时针对多个兴趣参数的平均估计问题,并且对删失响应变量的不同水平分位数进行建模,以全面反映响应变量分布特征,有效克服异常值和厚尾模型误差的影响.基于扩展的兴趣信息准则给出参数的平均估计方法,证明估计的渐近性质.通过Monte Carlo随机模拟试验比较所提估计方法和最小二乘方法在有限样本量下的表现,用所提方法对原发性胆汁性肝硬化数据集进行数据分析. 相似文献

18.

纵向数据下变系数混合效应模型的一种有效的压缩估计

《数理统计与管理》2014,(3):423-433

本文考虑了纵向数据下变系数混合效应模型的一种有效的压缩估计。结合考虑纵向数据的组内相关性,本文提出的统一正则估计方法可以同时选择和估计系数函数的参数效应分量和非参数效应的函数分量。本文还建立了估计量的渐近理论性质,且在Monte Carlo模拟和实际数据分析进行了充分的验证。相似文献

19.

右删失数据下多响应AFT模型的两阶段估计

刘慧馨《应用概率统计》2023,(1):10-26

在生存分析领域,加速失效时间(AFT)模型经常被用于预测事件发生的时间.本文将该模型推广到多事件时间情形,提出了多响应AFT模型,并假设协变量是高维的,模型的系数矩阵是联合低秩且稀疏的.此外还假设多个事件时间受制于同一个右删失变量.为了估计模型中的系数矩阵,本文提出一个两阶段方法,先对数据进行逆概率删失加权(IPCW),再用SESS算法求解一个稀疏降秩回归问题.本文通过数值模拟,验证了所提方法的有效性.最后将该方法应用于一个关于白血病患者骨髓移植的临床数据集. 相似文献

20.

高维混料模型的LASSO变量选择

《数理统计与管理》2019,(1):81-86

变量选择是统计建模中重要的问题。当试验数据维数很高时,传统变量选择方法的应用受到了很多制约。本文以高维混料试验为基础,比较了AIC准则和LASSO在变量选择问题上的优良性。通过实例验证,LASSO可以快速且准确地对高维混料模型中的变量进行筛选,从而得出最优模型,达到降低成本、提高利益的目的。相似文献