首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 109 毫秒
1.
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽样算法是Wang等(2018)[1]提出的基于L-最优和A-最优的思想,确定每个抽样单元的入样概率。本文在此基础上,定义多目标抽样的各单元的入样概率,并推导模型参数估计量的渐近性质,最后用模拟数据和实际例子对均值两步子抽样算法和多目标两步子抽样方法进行比较。结果表明,在样本量相同时,A-最优准则下均值两步子抽样算法在估计精度上优于基于两步子抽样算法的MPPS抽样和L-最优准则下均值多目标两步子抽样算法。在计算效率上也较全样本估计有显著的提高,节约了计算时间。  相似文献   

2.
为解决规模以下工业企业调查中存在的样本代表性不足的问题,提出基于平衡样本的校准估计方法,并得出相应的估计量和估计量方差。该方法在抽样设计阶段采用了平衡抽样设计,在估计阶段采用了校准估计方法,较大限度地使用了辅助信息;通过数据分析得出基于平衡样本的校准估计方法要优于基于平衡抽样的HT估计方法。同时,为满足平衡变量间线性无关的假定,提出使用主成分分析、切片逆回归和切片平均方差估计三种方法对相关的平衡变量进行处理的思路。该方法对我国规模以下工业企业调查的完善具有理论与实践的双重意义,可适当的推广至我国政府统计的其他调查中。  相似文献   

3.
无回答在抽样调查中经常出现,无回答层再抽样是解决无回答的常用方法.当辅助变量总体均值未知时,本文讨论了双无回答层抽样的三重抽样方法,给出了三重抽样的分层汉森-赫维茨估计量和比率估计量,以及它们的方差和估计方差.给出满足事前给定总调查费用约束的三重抽样过程的最优设计参数,以及比率估计量的方差估计.给定总调查成本,三重抽样的分层汉森—赫维茨估计量与比率估计量进行模拟比较,演示比率估计量的优良性.  相似文献   

4.
抽样调查是获取社会经济调查数据的主要手段,其抽样设计一般采用分层多阶段不等概的抽样设计。但是,在抽样设计和实际抽样中,人们往往忽视末端样本个体的抽样,本文主要基于中国家庭动态跟踪调查数据对末端样本的概率抽样方法进行比较研究。  相似文献   

5.
在空间调查领域中,分布良好的样本中很少会同时出现彼此接近的单元.将地理坐标作为平衡变量的立方体法存在无法捕捉总体单元的空间依赖性的不足.文章在立方体法能有效捕获总体空间趋势的基础上,创新性地引入系统抽样的思想.文章提出的抽样设计方法在保持单元空间相对位置的同时,充分利用地理坐标信息,集中相似单元点获得有序总体,使原先总体具有“空间趋势”.首先,在保持空间相关性的前提下,将抽样单元排序问题转换为单源最短路径问题.然后,利用Dijkstra算法获得有序总体,在快速立方体法的飞行阶段更新初始包含概率进行有序空间抽样.最后,通过模拟研究和实证分析表明对空间总体按照相似单元彼此靠近的原则进行排序,可减少抽样误差,获得较为均衡的样本,从而验证所提抽样思路的可行性.  相似文献   

6.
指令性抽样下的样本往往不具有代表性,因此仅用它们来推断总体将是不适合的,这篇文章基于观察信息,利用概率统计方法将没有发出调查指令的样本信息补充出来,然后利用观察信息和补充信息一起来对总体进行推断.具体我们给出了总体均值和方差参数估计的迭代公式,并给出它们在经济犯罪调查和流行病调查中的应用.  相似文献   

7.
1一般描述 1)不等概率抽样的必要性 前几讲介绍的简单随机抽样与分层随机抽样有一个公同的特点:总体(或层,下同)中的每个单元入样的概率都相等.这种抽样称为等概率抽样.如果总体中的每个单元在总体中的地位.(或重要性)相差不多,等概率抽样是理所当然的.等概率抽样实施简单,相应的数据处理公式也简单.但在许多实际问题中,我们还需要使用不等概率抽样.一种情况是调查的总体单元与抽样总体的单元可能不一致.例如某学校欲对学生的家庭情况进行调查,调查总体是全校学生的家庭.在这些家庭中,许多家庭只有一个孩子在该学校就读,也有些家庭有两个或…  相似文献   

8.
范永亮.转移概率流图的概率理论基础与应用方法(Ⅲ).数理统计与管理,1998,17(3),55~60.本文引入多元转移概率函数及多元转移概率流图的概念,介绍处理同一转移过程中多个随机变量的变量分离方法,并以连续抽样方案中的抽样方式和抽检程序的讨论为例,探讨了变量分离方法的应用  相似文献   

9.
工程实践中存在着各种不确定性因素,影响着工程结构的安全运行。结构可靠性分析以失效概率的形式考虑了不确定性的影响,可为结构的安全设计提供指导。然而,失效概率的评估往往涉及昂贵功能函数的调用,导致难以负担的计算成本。为解决该问题,基于Kriging模型的可靠性分析法在近年来受到了广泛的关注。该方法以训练良好的Kriging模型近似真实功能函数,从而在失效概率的计算中达到减少功能函数评价次数的目的。本文在主动学习Kriging模型的框架下,提出了基于两阶段局部抽样策略的结构可靠性分析法,以提高失效概率的估计精度和计算效率。在该方法中,Kriging模型的训练样本以两阶段局部抽样的方式从候选样本池中被逐渐添加。第一阶段以输入变量的均值点为抽样中心,利用概率密度函数确定抽样区域。当所估计失效概率满足基于置信区间的阶段划分阈值时,则开始第二阶段的局部抽样。第二阶段则以最可能失效点为抽样中心,以目标可靠度和功能函数的非线性度确定抽样区域。应用案例表明:所提方法能平衡有效抽样区域的全局探索和局部搜索,实现高精度失效概率估计的同时提高计算效率。  相似文献   

10.
中国人民银行城镇户调查抽样方案的设计   总被引:4,自引:0,他引:4  
本文采用多级、分层、PPS与等概率相结合的混合抽样方法,在考虑实际条件和限制的情况下,尽可能地使抽样的科学性和可操作性得到较好的结合,为中国人民银行的全国城镇储户调查设计了切实可行的抽样方案  相似文献   

11.
辅助信息在改进和完善抽样设计、提高抽样估计精度和节省抽样费用等方面具有重要作用,鉴于此,基于分层排序集样本建立了总体均值的比率估计量,同时考虑估计精度和调查费用两个方面,证明了抽样方案的优良性.最后,通过实例进一步分析,结果表明,在给定的估计精度下,分层排序集抽样方法可以有效降低抽样调查费用.  相似文献   

12.
校准是最常用的加权调整方法,然而传统加权调整设计效应模型只考虑有差异权数导致的精度损失,忽略使用辅助信息后的精度改进,因此应用于设计效应计算时存在一定的缺陷。本文在Spencer模型的基础上进行拓展,引入反映辅助变量和调查变量相关关系的广义回归估计量,构建了校准加权设计效应的一般模型。数值分析结果显示,校准加权设计效应模型的效果优于传统加权调整设计效应模型;尤其在调查变量与辅助变量高度相关的情形下,校准加权设计效应模型能够准确地估计出不等概率抽样设计和校准调整的综合效率。  相似文献   

13.
辅助信息在改进和完善抽样设计、提高抽样估计精度和节省抽样费用等方面具有重要作用,鉴于此,基于分层排序集样本建立了总体均值的比率估计量,同时考虑估计精度和调查费用两个方面,证明了抽样方案的优良性.最后,通过实例进一步分析,结果表明,在给定的估计精度下,分层排序集抽样方法可以有效降低抽样调查费用.  相似文献   

14.
非概率抽样在大数据时代有广阔的应用空间,但其统计推断问题仍有待研究和发展.针对这一问题,提出利用基于模型的推断方法结合配额抽样实现非概率样本的统计推断,其思路是先设定线性回归形式的超总体模型,再利用配额样本观测数据拟合模型估计未知参数,进而利用模型对非观测单元进行预测,案例分析结果显示基于超总体模型的推断方法是解决非概率样本统计推断的有力途径,具有较大的深入研究价值.  相似文献   

15.
通过将逆抽样设计视为一种特殊的二重抽样,建立了二重抽样和为回归估计的二重抽样的一般形式,得到了逆抽样设计算法下的回归估计.模拟分析的结果表明,以回归估计的形式引入较为合适的辅助信息,能够在估计精度上对逆抽样设计算法做出改进.  相似文献   

16.
董俊超 《大学数学》2021,37(3):117-120
对简单随机抽样两种定义的关系进行了讨论,澄清了教科书中的一些模糊不清之处;通过反例举证了两种定义在某种意义下的不等价性;给出了变概率抽样与不等概率抽样的定义,指出变概率抽样与不等概率抽样也可以是简单随机抽样;本文最后,给出了简单随机抽样的更具一般性的(广义)定义.  相似文献   

17.
连续抽样方案的多元转移概率流向图方法   总被引:5,自引:0,他引:5  
本文通过由多元转移概率流向图寻求多元转移概率母函数的方法,对于使用概率抽样方式的CSP-1,CSP-2,CSP-T和CSP-V四类连续抽样方案进行了较全面的讨论。讨论表明了此种方法对属性抽样问题的适用性。  相似文献   

18.
本文简略介绍转移概率流图方法在计数抽样研究中的应用与发展,以概率母函数为基础引入了变量及路径的转移概率函数的术语与概念,并讨论了它们的基本性质。  相似文献   

19.
本文考虑了在无放回不等概率抽样下,当有完全辅助信息时,利用模型校正的伪经验对数似然方法去构造关于-Y和F(t)的置信区间.同时考虑了非分层抽样和分层抽样的情形,定义了由模型校正估计量的设计效应调整的伪对数经验似然比函数,并导出了伪经验对数似然比函数的渐近分布.  相似文献   

20.
准确估计人口总数估计量方差是中国1%人口抽样调查数据分析重要内容.但由于中国1%人口抽样调查综合采用分层、二阶段、概率比例、整群抽样方法,且原则上从每个被抽中初级单元中仅抽取一个次级单元,传统抽样调查方差估计方法不再适用.本文提出适用于中国1%人口抽样调查的不等概率重权数Bootstrap方差估计法.该方法将不等概率抽样引入重抽样过程,并针对从绝大多数被抽中初级单元中仅抽取一个次级单元情形,设计入样概率.理论推导和数值模拟表明,新方法能减少方差估计量偏差,实例分析验证了该方法在中国1%人口抽样调查中的优良性.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号