高维线性回归模型稳健变量选择方法综述 |
| |
引用本文: | 邹航,姜云卢.高维线性回归模型稳健变量选择方法综述[J].应用概率统计,2024(1):157-181. |
| |
作者姓名: | 邹航 姜云卢 |
| |
作者单位: | 暨南大学经济学院 |
| |
基金项目: | 国家自然科学基金项目(批准号:12171203);;广东省自然科学基金项目(批准号:2022A1515010045);;中央高校基本科研业务费专项资金项目(批准号:23JNQMX21)资助; |
| |
摘 要: | 随着大数据时代的到来,在经济学、金融学和生物医学等众多研究领域中频繁收集到高维数据.高维数据的特征之一是变量维数p随着样本量n的增加而变大且通常会超过样本量,同时,异常值也容易出现在高维数据中.因此,如何克服异常值给高维统计推断带来的影响,从而得到更精确的模型,是目前统计学研究的热点问题之一.本文是对高维线性模型下的稳健变量选择方法进行综述.具体地,首先介绍评估稳健性的三个指标:影响函数、崩溃点和最大偏差.其次着重介绍了稳健变量选择方法,包括响应变量含有异常值,响应变量和协变量都含有异常值,高崩溃点且高效的变量选择方法.紧接着介绍相关算法,通过模拟和实例比较不同变量选择方法.最后,简要探讨了高维稳健有效变量选择方法存在的问题及未来的可能发展方向.
|
关 键 词: | 高维线性回归模型 稳健性 变量选择 有效性 |
|
|