首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 140 毫秒
1.
针对海量数据,子抽样算法是当前一种流行的简化计算和降低计算成本的方法。现阶段的研究主要集中于单目标变量的估计上。多目标抽样也是现实生活中经常遇到的问题。本文提出基于广义线性模型,多目标抽样的均值两步子抽样算法。两步子抽样算法是Wang等(2018)[1]提出的基于L-最优和A-最优的思想,确定每个抽样单元的入样概率。本文在此基础上,定义多目标抽样的各单元的入样概率,并推导模型参数估计量的渐近性质,最后用模拟数据和实际例子对均值两步子抽样算法和多目标两步子抽样方法进行比较。结果表明,在样本量相同时,A-最优准则下均值两步子抽样算法在估计精度上优于基于两步子抽样算法的MPPS抽样和L-最优准则下均值多目标两步子抽样算法。在计算效率上也较全样本估计有显著的提高,节约了计算时间。  相似文献   

2.
随着大数据时代的来临,为了提高计算效率,Wang等(2018)提出基于logistic回归的最优子抽样算法,在保证参数估计精度的前提下,节省了大量的运算时间.为解决变量间的多重共线性,文章提出基于岭回归模型的最优子抽样算法,并证明岭回归模型中参数估计的一致性与渐近正态性.利用数值模拟与实证分析对最优子抽样算法进行评估,...  相似文献   

3.
提出一种在分布式环境中利用共轭梯度法优化二次损失函数的算法,该算法利用本地子机器局部损失函数的一阶导数信息更新迭代点,在每次迭代中执行两轮通信,通过通信协作使主机器上的损失函数之和最小化.经过理论分析,证明该算法具有线性收敛性.在模拟数据集上与分布式交替方向乘子法进行对比,结果表明分布式共轭梯度算法更匹配于集中式性能....  相似文献   

4.
在数据缺失机制形式未知时,通过两步抽样得到了分布函数的相合估计量,证明了该估计量的渐近正态性.文中假设第二次抽样时的数据缺失机制与第一次抽样时的数据缺失机制函数形式类似,允许两者有一个一维未知参数的差别.  相似文献   

5.
通过引入潜在变量得到了截尾情形屏蔽数据下指数分布两部件串联系统交点模型较简单的似然函数.利用Gibbs抽样与Metropolis-Hastings算法相结合的MCMC方法对各参数进行了抽样.基于Gibbs样本对参数进行估计.随机模拟的结果表明估计的精度较高.  相似文献   

6.
随着大数据时代的到来,P2P网络借贷的数据规模日益庞大,导致P2P网络借贷信用风险比传统的金融借贷信用风险更加难以预测,使得大量的P2P机构面临倒闭.文章运用美国Lending Club网站2017-2018年的数据,采取两步子抽样方法抽取样本,建立logistic回归模型对P2P网络借贷信用风险进行预测.研究结果表明...  相似文献   

7.
在构建随机效应面板数据Biprobit模型和部分可观测Biprobit模型的基础上,采用基于Halton序列的模拟极大似然法估计这类模型的参数.相比于采用传统的数值积分公式处理似然函数中二重积分的方法,依赖于Monte Carlo积分的模拟极大似然法具有不依赖于积分节点选取的数值稳定性,且无需过多抽样就可以保证求解的精度.模拟实验结果说明了算法的有效性,对农户消费信贷约束的实证结果表明,不同抽样次数下参数估计结果并无明显差别,算法具有稳定性.  相似文献   

8.
邹智康  罗元 《应用数学》2021,(4):992-998
针对数据集分散在不同机器的情况,本文对高维稀疏线性回归模型提出了一种通信有效的分布式学习方法,主要解决了KKT系统中的?0正则化最小二乘问题.每一轮牛顿迭代中,在每个子块上通过对KKT系统中?0正则化方法改进提高计算速度和估计的精度.对于分布存储的子块,我们的方法通过传递梯度向量从而节约数据传输的成本.实验数据表明,我...  相似文献   

9.
针对由制造商、分销中心和零售商组成的多级分布式供应链协同计划问题,建立了三层规划生产-分销计划谈判模型,设计了基于合作对策的两步协商方法。首先,基于模糊隶属度原理,将三层规划问题转化为单层规划问题。接着,设计了基于合作对策的两步协商过程,描述了两步协商模型和交互协商算法步骤,并对算法进行了性能分析。最后,给出了基于多层规划的协同生产-分销计划模型,并得到了基于合作对策的协商算法的解决方案。并通过与其它优化策略的对比,验证该解决方案的优越性。  相似文献   

10.
研究数据集被分割并存储于不同处理器时的特征提取和变量选择问题,其中处理器通过某种网络结构相互连接.提出分布式L_(1/2)正则化方法,基于ADMM算法给出分布式L_(1/2)正则化算法,证明了算法的收敛性.算法通过相邻处理器之间完成信息交互,其变量选择结果与数据集不分割时利用L_(1/2)正则化相同.实验表明,所提出的新算法有效、实用,适合于分布式存储数据处理.  相似文献   

11.
利用EM算法和MCMC方法得到了左截断右删失数据下离散型寿命失效率变点模型的参数估计.利用筛选法对缺失数据进行填充,对各参数进行Gibbs抽样.随机模拟证实方法可行且参数估计的精度较高.  相似文献   

12.
为应对分布式大数据对传统统计建模分析带来的巨大挑战,考虑Expec tile回归模型以实现基于分布式大数据的有效数据处理和统计推断.其新颖之处在于对分布式存储于每台机器中的数据,分别应用Expectile回归,再通过平均方法聚合这些回归结果并进行综合推断.在算法上,考虑在处理大数据计算中热门的交替方向乘子算法(ADMM)基础上,提出了分块ADMM算法,该迭代算法易于并行计算,结果稳健,而且可以显著减少存储大数据所需的容量.不仅基于分布式大数据的Expectile回归模型的参数估计具有良好的有效性和渐近性质,而且数值模拟和实证分析也都验证了该方法在处理分布式大数据时的有效性.  相似文献   

13.
通过将逆抽样设计视为一种特殊的二重抽样,建立了二重抽样和为回归估计的二重抽样的一般形式,得到了逆抽样设计算法下的回归估计.模拟分析的结果表明,以回归估计的形式引入较为合适的辅助信息,能够在估计精度上对逆抽样设计算法做出改进.  相似文献   

14.
针对鸡群算法(Chicken swarm optimization,CSO)求解复杂高维问题收敛精度低、容易陷入局部极值等问题,提出了一种基于自适应子种群和动态反向学习的改进鸡群(ICSO)算法.根据鸡群算法迭代进化进程,自适应确定公鸡种群规模大小,并据此将母鸡种群和小鸡分成若干个子种群;设计进化停滞判定机制,并引入动态反向学习因子以改进算法个体更新方式,有效保持鸡群样本多样性和算法全局深度搜索能力.典型测试函数仿真实验结果表明,与SFLA算法、PSO等智能优化算法相比,ICSO算法具有更高的收敛精度和更优的复杂函数优化能力.  相似文献   

15.
本文考虑一个分布式优化问题,其中整个网络上智能体之间的交互可能会发生链路故障,并在随机—闲聊设置下提出了一个有向网络上的动量加速算法.在目标函数是强凸且光滑的假设下,从理论上证明了所提出的算法可以线性收敛到精确解.由于使用了重球动量项,所提出的算法可以更快地收敛到精确解.数值结果表明,与现有的分布式算法相比,该算法能够更快地收敛到精确解,特别是对于病态问题.  相似文献   

16.
通过添加缺损的寿命变量数据得到了带有不完全信息随机截尾试验下泊松分布参数多变点模型的完全数据似然函数,研究了变点位置参数和其它参数的满条件分布.利用Gibbs抽样与Metropolis-Hastings算法相结合的MCMC方法对各参数的满条件分布分别进行了抽样,把Gibbs样本的均值作为各参数的贝叶斯估计,并且详细介绍了MCMC方法的实施步骤.最后进行了随机模拟试验,试验结果表明各参数贝叶斯估计的精度都较高.  相似文献   

17.
传统的机器学习方法无法捕捉到电力负荷需求的不确定性以及动态变化规律.本文将最新提出的隐马尔可夫模型在线学习算法应用于电力负荷预测研究,充分提取历史数据中的不确定性特征和动态变化规律,并结合分解算法,更精确利用数据中的动态变化特征,从而提高预测精度.算法基于隐马尔可夫概率预测模型,在获得新样本时对模型进行在线更新,适应最新数据;利用STL时序分解算法对负荷数据进行分解,使具有不同不确定性和动态变化规律的分量分离开,再分别使用在线学习算法对不同特征的分量进行预测,构造电力负荷预测组合算法.基于三个公开电力负荷数据集的测试结果表明,相比于单一的在线学习模型,本文提出的组合算法提高了预测精度,预测相对误差最高减少了27%.  相似文献   

18.
通过添加数据得到截断删失情形下泊松分布的完全数据似然函数,研究变点位置和其它参数的满条件分布.利用Gibbs抽样与Metropolis-Hastings算法相结合的MCMC方法对参数进行估计,详细介绍MCMC方法的实施步骤.随机模拟试验的结果表明参数Bayes估计的精度较高.  相似文献   

19.
本文将辅助--充分交织策略, 即Yu和Meng (2011)中提到的ASIS算法, 应用于Gibbs抽样算法中以提高两个方差参数的收敛性. 我们通过对潜在规模缩减因子(PSRF)、轨迹图及后验估计 比较了ASIS算法与普通Gibbs抽样算法的性能, 其中一个参数的收敛性有了很大的提高, 但另一个参数没有很明显的提高. 然而, 由于ASIS算法相与普通的Gibbs抽样算法相比极大地减少了为达到收敛所 需要的循环次数, 整体的抽样性能得到了极大的提高.  相似文献   

20.
在一般PageRank问题的基础上,Gleich等结合了马尔科夫链的性质提出了高阶PageRank问题.基于Gleich等提出的几个算法,结合两步分裂迭代的思想提出了解高阶PageRank问题的一个两步分裂迭代算法.该算法能增加收敛的范围,并且减少算法的迭代步数.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号