基于杠杆值大数据集抽样的异常点诊断 |
| |
引用本文: | 晏振,戴晓文,田茂再. 基于杠杆值大数据集抽样的异常点诊断[J]. 数理统计与管理, 2016, 0(5): 794-802. DOI: 10.13860/j.cnki.sltj.20160922-021 |
| |
作者姓名: | 晏振 戴晓文 田茂再 |
| |
作者单位: | 1. 广西师范大学数学与统计学院,广西桂林541004;中国人民大学应用统计科学研究中心,统计学院,北京100872;2. 中国人民大学应用统计科学研究中心,统计学院,北京100872;3. 中国人民大学应用统计科学研究中心,统计学院,北京100872;兰州财经大学统计学院,甘肃兰州730020;新疆财经大学统计与信息学院,新疆乌鲁木齐830001 |
| |
基金项目: | 国家自然科学基金(11271368;11261009),教育部高等学校博士学科点专项科研基金(20130004110007),国家社会科学基金重点项目(13AZD064),北京市社会科学基金重大项目(15ZDA17)以及兰州商学院“飞天学者特聘计划”. |
| |
摘 要: | 本文主要研究大数据集下利用杠杆值抽样后的异常点诊断问题。首先讨论了数据删除模型中参数估计的统计性质,构造了四种异常点诊断统计量;其次,根据均值漂移模型的漂移参数的假设检验问题,构造了三种检验统计量;最后,通过模拟和实证数据分析结果得出本文的结论—异常点诊断对于基于杠杆值的大数据集抽样估计起到重要的影响作用。
|
关 键 词: | 大数据 杠杆值 异常点 不等概抽样 最小二乘估计 |
Outliers Diagnosis in Big Data Leveraging Sampling |
| |
Abstract: | |
| |
Keywords: | big data leverage outliers unequal probability sampling least square estimation |
本文献已被 万方数据 等数据库收录! |
|