首页 | 本学科首页   官方微博 | 高级检索  
     检索      

超高维生存数据中交互效应的非参数变量筛选法
引用本文:张婧,刘妍岩.超高维生存数据中交互效应的非参数变量筛选法[J].数学学报,2024(3):582-598.
作者姓名:张婧  刘妍岩
作者单位:1. 中南财经政法大学统计与数学学院;2. 武汉大学数学与统计学院
基金项目:国家自然科学基金(11971362,11901581,12371274);;湖北省自然科学基金(2021CFB502);;中南财经政法大学中央高校基本科研业务费(2722024BY024);
摘    要:在医学、遗传学、经济学等领域的研究中,线性回归模型常被用来研究变量间的回归关系,以进行分析和预测.而在很多实际问题中,仅仅考虑主效应的影响是远远不够的,变量之间的交互效应也会对因变量产生重要影响,同时考虑主效应和交互效应的交互模型能更全面地刻画变量之间的关系.在高维数据中,变量的个数p比较大,二阶交互项的个数(p(p+1))/2更大,此时对交互模型的统计分析存在很大的困难和挑战.如何从众多交互效应中挑选出对感兴趣事件有显著影响的重要交互效应是一个非常重要的问题.目前对此问题的研究主要集中在线性模型框架下的完全数据,本文将研究超高维右删失生存数据中重要交互效应的选取.基于距离相关系数和两步分析法的原理,本文提出了一种不依赖于任何模型假设的交互效应变量筛选方法.此方法可以同时实现重要主效应和重要交互效应的选取,且可以处理p很大的超高维数据.本文通过大量的数值模拟试验评估了该方法在有限样本下的表现,结果显示此方法能有效地处理超高维右删失数据中交互效应的选取问题.最后本文把它应用到弥漫性大b细胞淋巴瘤(DLBCL)数据的实例分析中.

关 键 词:交互效应  超高维生存数据  距离相关系数  两步分析法  变量筛选
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号