首页 | 本学科首页   官方微博 | 高级检索  
     

多源数据融合视角下非概率样本与概率样本的大量插补推断方法
作者姓名:刘展  周青  王林  潘莹丽
作者单位:湖北大学数学与统计学学院应用数学湖北省重点实验室
基金项目:国家社会科学基金(21XTJ006)资助课题;
摘    要:随着社会的发展,概率样本无回答率越来越高,其目标变量可能存在缺失的情况.同时,大数据与网络调查的发展使得获得的样本大多数是非概率样本,如何结合这两种样本推断总体是当今时代多源数据融合领域的一个热点问题.假设存在目标变量完全缺失的概率样本和数据完整的非概率样本,提出基于非概率样本建立超总体局部多项式模型,插补概率样本缺失的目标变量,并利用插补后的概率样本估计总体,进一步证明提出估计的渐近性质.模拟和实证研究表明:与基于非概率样本的倾向得分逆加权估计相比,提出估计的绝对相对偏差,方差与均方误差更小,且与基于真实概率样本的总体估计相接近;提出总体均值估计的方差估计的绝对相对偏差与95%置信区间覆盖率也接近于基于真实概率样本的总体估计的相应指标,估计效果较好.

关 键 词:非概率样本  概率样本  超总体局部多项式模型  大量插补  多源数据
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号