首页 | 本学科首页   官方微博 | 高级检索  
     检索      

大规模数据下子抽样模型平均估计理论
引用本文:宗先鹏,王彤彤.大规模数据下子抽样模型平均估计理论[J].系统科学与数学,2022(1):109-132.
作者姓名:宗先鹏  王彤彤
作者单位:北京工业大学理学部;首都师范大学数学科学学院
基金项目:北京市自然科学基金重点研究专项(Z210003);国家自然科学基金(11971323,12031016,71973116);首都师范大学交叉科学研究院和生物统计交叉学科研究项目资助课题。
摘    要:随着信息时代的来临,如何从海量数据中快速、有效地挖掘有用信息是目前面临的新挑战.子抽样方法作为大规模数据分析的有效工具,已经受到国内外学者的广泛关注.不过,传统的子抽样方法通常没有考虑到模型的不确定性.当模型假设不正确时,后面的统计推断将会出现偏差,甚至导致错误的结论.为了解决该问题,文章利用频率模型平均的方法构建了子抽样模型平均估计(简称SSMA估计).理论上,文章证明了SSMA估计是全部数据下模型平均估计的一个渐近无偏且相合的估计.另外,我们基于Hansen (2007)的Mallows模型平均方法提出了SSMA估计的权重选择准则,并证明了方差已知和未知时权重估计的渐近最优性.在这些理论性质的研究中,文章同时考虑了模型和抽样设计带来的双重随机性.最后,数值分析进一步说明了所提出方法的有效性.

关 键 词:大数据分析  子抽样方法  模型平均  Mallows准则  渐近最优性

Sub-Sampling Model Averaging Theory for Large Scale Data
ZONG Xianpeng,WANG Tongtong.Sub-Sampling Model Averaging Theory for Large Scale Data[J].Journal of Systems Science and Mathematical Sciences,2022(1):109-132.
Authors:ZONG Xianpeng  WANG Tongtong
Institution:(Faculty of Science,Beijing University of Technology,Beijing 100124;School of Mathematical Sciences,Capital Normal University,Beijing 100048)
Abstract:
Keywords:Big data analysis  sub-sampling method  model averaging  Mallows’criterion  asymptotic optimality
本文献已被 维普 等数据库收录!
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号