首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到10条相似文献,搜索用时 93 毫秒
1.
利用正则化方法来进行变量选择是近年来研究的热点.在实际应用中解释变量常常以组的形式存在,通常我们希望将重要的组和组内重要的协变量选择出来,即双重变量选择.基于两种非凸惩罚函数SCAD和MCP,分别提出了稀疏Group SCAD和稀疏Group MCP估计方法,通过分块坐标下降迭代算法,达到组内和组间变量同时稀疏的效果.数值模拟结果表明本文提出的两种方法在模型预测和变量选择能力上优于Group Lasso和稀疏Group Lasso算法.并将该算法有效地应用于实际的初生儿体重数据集分析中.  相似文献   

2.
以2006-2016年31个省份的居民家庭人均医疗保健消费支出为研究对象,从人口健康、经济、卫生条件、环境、教育、医疗资源要素成本和政策七大方面选取了19个影响因素,运用弹性网对影响我国居民医疗负担的因素变量进行筛选压缩,并选用逐步回归、Lasso模型和自适应Lasso模型作为对比,最终得出9个较为重要的变量,进行参数估计,最后对模型的准确率进行预测,结果表明:政府干预程度对我国居民医疗负担的影响最大;弹性网在变量选择和模型预测方面更优.  相似文献   

3.
改进的自适应Lasso方法在股票市场中的应用   总被引:1,自引:0,他引:1  
《数理统计与管理》2019,(4):750-760
在金融领域,自适应Lasso被广泛的用于股票价格预测模型中的变量选择和参数估计。然而,自适应Lasso是针对非时间序列模型提出的,忽略了时间序列模型特定的结构,比如时间序列模型中通常会出现滞后阶数越靠后,对未来的预测能力越弱的特性,从而,容易造成估计及预测不精确。因此,时间序列模型的变量选择惩罚参数的设计应与滞后阶数相关,即对越靠后的滞后阶数应加上越大的惩罚。为了充分考虑时间序列模型的特性且保留自适应Lasso的优点,本文针对时间序列AR(p)模型提出一种改进的自适应Lasso(MA Lasso)方法,通过在自适应Lasso惩罚基础上乘以一个关于滞后阶数单调不减的函数来达到目标。这样设计的惩罚参数的另一个优点是通过选取特定的惩罚参数,Lasso,自适应Lasso方法都是MA Lasso方法的特例。进一步,对于AR(p)模型中另一个重要参数p的选择问题,本文提出一种改进的BIC模型准则来选择p。最后,将MA Lasso方法应用到中证100指数中,实证分析表明,与Lasso和自适应Lasso相比,MA Lasso选择最简模型且预测效果最佳,即选择最少的预测变量的同时且具有最小的模型预测误差。  相似文献   

4.
个人信用评价问题研究中,需要建立较多的虚拟变量作为解释变量.Group Lasso可以将相关的虚拟变量作为组进行整体剔除或保留在模型中.结合具体的个人信贷数据,应用Group Lasso方法进行变量选择建立Logistic模型,并与全模型、向前选择和向后选择建立的Logistic模型进行比较,发现Group Lasso方法建立的模型,在变量解释和预测正确率上,都是最优的.  相似文献   

5.
在使用变量选择方法选出模型后,如何评价模型中变量系数的显著性是统计学重点关注的前沿问题之一.文章从适应性Lasso变量选择方法的选择结果出发,在考虑实践中误差分布多样性的前提下,基于选择事件构造了模型保留变量系数的条件检验统计量,并给出了该统计量的一致收敛性质的证明过程.模拟研究显示,在多种误差分布下所提方法均可进一步优化变量选择结果,有较强的实用价值.应用此方法对CEPS学生数据进行了实证分析,最终选取了学生认知能力等10个变量作为影响中学生成绩的主要因素,为相关研究提供了有益的参考.  相似文献   

6.
准确预测国际原油价格,对于维护经济稳定和规避风险具有重要意义.由于国际油价的波动是由多种因素引起的,本文采用误差修正模型确定原油价格与因素的关系.将结果作为SVM回归预测模型的输入模式,建立基于多因素SVM的油价预测模型.通过实证研究,发现基于多因素SVM的油价预测模型相对于误差修正模型和基于国际油价本身的自回归SVM预测模型具有更好的拟合和预测效果.  相似文献   

7.
变量选择是统计学中重要的问题之一,而利用正则化方法来进行变量选择是近年来研究的热点.采用一种迭代光滑L_(1/2)算法,通过增加参数稀疏化阈值条件,使其中绝对值较小的回归参数稀疏为0,从而实现变量选择的功能.将该算法与Lasso(least absolute shrinkage and selection operator),自适应Lasso以及L_(1/2)正则化方法进行比较,数值模拟结果表明该算法同样具有良好的变量选择和预测能力,最后将该算法应用到实际的前列腺数据分析.  相似文献   

8.
基于分位数回归及其变量选择模型,利用2011年中国健康与营养调查数据(CHNS)实证分析了医疗消费的影响因素.通过Lasso方法从多个影响因素中选取出了对医疗消费影响较大的因素,发现个人收入、年龄、受教育程度、患病程度和地区变量对医疗消费的影响较大,通过分位数回归模型,对影响医疗消费诸因素的作用方式与程度进行了研究.  相似文献   

9.
主要研究因变量存在缺失且协变量部分包含测量误差情形下,如何对变系数部分线性模型同时进行参数估计和变量选择.我们利用插补方法来处理缺失数据,并结合修正的profile最小二乘估计和SCAD惩罚对参数进行估计和变量选择.并且证明所得的估计具有渐近正态性和Oracle性质.通过数值模拟进一步研究所得估计的有限样本性质.  相似文献   

10.
根据组合预测思想构建了基于Lasso+SVM的制造业上市公司财务风险组合预警模型,包括串联型组合和信息融合型组合两种,并选取22个财务指标建立了财务预警指标体系,对我国86家制造业上市公司的财务状况进行了预测,还与单一风险预警模型预测效果进行了比较,结果发现:财务风险组合预警模型的预测效果明显高于单一预警模型,用第t-1年的财务数据进行预测的准确率达到了95%以上;串联型组合预警模型的预测效果最优,用第t-1和t-2年的财务数据进行预测的准确率分别达到了100%和90%.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号