首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 29 毫秒
1.
及时有效的预测机场拥挤状态并辅助机场管理部门采取相应缓解拥挤的措施,将有助于提高机场的服务质量和运行效率.提出了利用回归分析的方法对机场拥挤问题进行研究.利用已有的历史航班数据挖掘出与机场拥挤最为相关的因素,并将其作为预测变量来预测响应变量.使用到两种回归分析方法即:普通最小二乘回归(OLS)和支持向量回归(SVR).使用历史数据来训练模型,并将这两种训练模型用于真实数据集上做测试,且取得较好的预测效果.实验结果证明该方法在机场拥挤预测问题上的可用性和有效性.  相似文献   

2.
将MCMC算法融合到主成分回归分析模型中,提出MCMC主成分回归分析方法.新方法既具有有效避免解释变量之间的多重共线性问题以及简化回归方程结构的主成分回归分析方法的优势,又能够充分利用MCMC算法的融合先验信息、模型信息及样本似然函数的长处.将方法应用于对嘉兴市1997年至201.0年的经济发展指标的数据建模分析,结果表明,方法能有效克服现有分析方法的不足,建立预测精度更高的模型.  相似文献   

3.
在多变量模式识别领域,变量间经常会存在复共线性,复共线性不仅会影响参数估计的效果,也会使变量的敏感性出现显著异常.马田系统是以马氏距离作为测量尺度的多变量模式识别方法,复共线性会通过马氏距离影响马田系统变量筛选的效果和判别的准确率.基于岭估计提出了一种新的测量尺度—岭马氏距离,利用岭迹法确定岭参数,将其引入马田系统使得马田系统对病态数据具有更好的耐受性.通过案例验证了岭马氏距离可以很好的克服复共线性,并提高马田系统的判别准确率.  相似文献   

4.
PLSR模型的回归效果分析   总被引:6,自引:1,他引:5  
本文简单地介绍了多元线性回归、主元回归、部分最小二乘回归模型 ,用实例对三种方法的回归性能进行比较 ,并指出在消除多重共线性、回归系数估计精度及预测精度等方面 ,部分最小二乘回归模型优于其它两种模型  相似文献   

5.
将LSTM用于沪深300指数的股价预测中,并在通用变量开盘价、收盘价、最高价、最低价的基础上新加入了日成交量与日成交额,以此来预测第二日的最高价,获得了比较好的预测效果,并与SVR模型和Adaboost模型预测作对比,LSTM获得的测试集RMSE要更低.接着,用SVR、Adaboost和LSTM进行岭回归集成,即,先用训练集对这三种模型进行训练,然后用训练数据进行测试,将它们的测试结果作为自变量,以相应的真实第二日最高价作因变量,进行岭回归,再对测试集数据做出预测,得到测试集的RMSE进一步降低;再者,查看回归方程发现SVR系数为负,与因变量呈负相关关系,进一步选取Adaboost和LSTM两种模型在训练集上的预测结果做自变量,相应的真实第二日最高价作因变量,再次进行岭回归,得到测试集的RMSE再次降低,进一步验证了回归集成算法的有效性,可以为广大投资者做买卖决策时提供重要的参考价值.  相似文献   

6.
为了突破税收预测常用分析思路及方法的局限,更全面的反映数据全貌和回归信息,提出带税基的个人所得税分位回归预测模型.即以分位回归为基础模型,兼顾时间和税基因素,完成预测模型的构建,为预测领域提供一种新工具.利用1994-2014年的个人所得税和城镇居民人均可支配收入数据,以不带税基和带税基的模型为参照,比较所提出模型对2014年的预测效果,并给出2015年个人所得税的预测情况.研究发现,分位回归预测模型与线性回归模型揭示的变量间关系规律吻合,仍然保持较高的预测精度,对数据的展示更为详实,尤其在中段分位处,城镇居民人均可支配收入对个人所得税的影响表现的较为突出.  相似文献   

7.
与现有网络结构设计方法不同,本文将RBF网络解释为解释变量和被解释变量之间的一个非线性函数,基于RBF网络的学习动态特性提出2种修剪模型WRBF和TRBF。这两种模型根据参数显著性增加和删减节点,为网络结构设计提供了理论依据。对中国信贷序列预测的结果表明,这些模型能够识别外移、萎缩和衰减等冗余核函数,得到的精简网络具有最好的预测精度,对于提高货币政策前瞻性具有很好应用价值。  相似文献   

8.
数据挖掘技术能有效地挖掘出潜在的银行客户,能够大大提高银行的竞争力.介绍了数据挖掘技术中常用的三种模型:逻辑回归模型、BP神经网络模型和决策树模型,同时构造了一种新模型——逻辑回归与BP神经网络混合的模型,然后分别采用这四种模型对可能影响银行客户是否认购定期存款的影响因素进行数据挖掘分析,分别构建了基于逻辑回归模型、BP神经网络模型、逻辑回归与BP神经网络的新模型、决策树模型的银行客户定期存款认购的四种模型,同时利用R语言分别对这四种模型进行分析,分别用ROC曲线的AUC值和正确率比较这四种模型的功效强弱以及稳定性,研究结果表明,给出的新模型——逻辑回归与BP神经网络的新模型的预测效果更好,训练集和测试集预测的准确率分别为0.936和0.931,训练集和测试集ROC曲线的AUC值分别为0.998和0.987,这可以大大缩小银行推送认购定期存款的客户范围,有效地挖掘出潜在的银行客户,可以大大提高银行的效率.  相似文献   

9.
区域经济发展智能预测方法   总被引:2,自引:0,他引:2  
肖健华 《经济数学》2005,22(1):57-63
分析了影响区域经济发展的各种因素,指出由于这些因素相互制约、相互影响,使得传统的经济预测方法越来越难以胜任区域经济发展预测的需要.论述了核方法在处理非线性、不确定性和不精确性数据上存在的优势,建立了基于核方法三种经济预测模型,并将这三种预测模型与其它两种预测方法一起,对区域经济的发展进行组合预测.最后,采用数据融合的方法将各个体模型的预测结果进行集成,作为最终的输出.实际的结果表明,基于核方法的组合预测技术能取得较为理想的预测效果.  相似文献   

10.
本文是《厦门港及附近水域交管系统应用研究》课题中关于港口货物吞吐量预测的部分。这一课题已通过专家鉴定。文中应用回归模型预测2000年厦门港货物吞吐量。通过从多个解释变量中选择合适的解释变量,可获得较好的预测结果。其结果说明在应用数学模型预测时,最为关键的是模型、变量和数据三者之间的相互适应,而不在于模型的复杂程度,特别是在历史数据不多的情况下更是如此。  相似文献   

11.
通过文献回顾、专家访谈和问卷调查,确定了8种对消费者寿险购买行为有重要影响的个体态度变量。根据在全国10个城市进行问卷调查所获得的态度变量和人口统计学变量数据,采用判别分析和Logistic回归的方法分别建立了消费者寿险购买行为的预测模型。对模型的评价表明,2个模型都有较好的预测精度;若将两个模型的联合应用,能取得更好的预测效果,对寿险营销管理具有重要的参考价值。  相似文献   

12.
植物遗传与基因组学研究表明许多重要的农艺性状有影响的基因位点不是稀疏的,受到大量微效基因的影响,并且还存在基因交互项的影响.本文基于重要油料作物油菜的花期数据,研究中等稀疏条件下的基因选择问题,提出了一种两步Bayes模型选择方法.考虑基因间的交互作用,模型的维数急剧增长,加上数据结构特别,通常的变量选择方法效果不好.本文提出两步变量选择的方法:首先利用Kolmogorov特征扫描方法筛除那些明显不重要的变量,达到降维的目的;其次,在选出的位点中考虑交互作用.为了克服Bayes方法计算速度慢的问题,本文在模型中引入指示变量,通过估计指示变量的后验分布选择模型.模拟结果表明本文提出的方法在预测精度和计算稳定性上有良好的表现,与不加指示变量的Bayes方法相比,在预测精度上有很大的提高.最后,利用本文提出的方法分析一个油菜花期数据,发现了一些交互效应的基因位点.  相似文献   

13.
针对在采用BP神经网络进行期货价格预测时,存在的模型结构复杂,易陷入局部极小值,模型无法收敛问题.考虑从网络结构和网络参数两个方面对BP网络模型进行优化,由此提出基于GRA-CS-BP算法的期货价格预测方法.首先用灰色关联度分析法进行输入变量筛选,找出和预测价格关联度大的重要因素作为网络输入,简化网络模型整体结构.然后采用布谷鸟算法对网络权阈值参数进行优化,将经过选择优化后建立的BP神经网络模型用于期货价格预测.仿真结果表明,新模型不仅具有更高的预测精度,同时其运行的稳定性也要好于单纯BP神经网络模型,为期货价格预测提出了一种新的方法.  相似文献   

14.
基于多重共线性的处理方法   总被引:2,自引:0,他引:2  
多重共线性简称共线性是多元线性回归分析中一个重要问题。消除共线性的危害一直是回归分析的一个重点。目前处理严重共线性的常用方法有以下几种:岭回归、主成分回归、逐步回归、偏最小二乘法、Lasso回归等。本文就这几种方法进行比较分析,介绍它们的优缺点,通过实例分析以便于选择合适的方法处理共线性。  相似文献   

15.
随着我国足球博彩产业的发展,与足球赛事相关的数据分析和统计工作也越来越受重视.通过双变量Poisson模型及其拓展的几种对角膨胀模型来拟合2015赛季中超联赛各场比赛进球数据.结果表明只用双变量Poisson模型不能很好拟合比赛进球得分数据,用对角膨胀双变量Poisson模型能较好估计各支球队在整个赛季过程中主场和客场的进攻和防守实力,预测每场比赛进球数,提高模型拟合度,并且解决了以往模型在预测低比分或高比分平局时出现的偏差.因此,对角膨胀双变量Poisson回归模型适用性强,对预测足球等项目比赛的进球数是较好的模型.  相似文献   

16.
基于errors-in-variables的预测模型及其应用   总被引:1,自引:0,他引:1  
预测是统计学实际应用的一个主要方面,多元线性回归预测是一种很好的方法,广泛地应用在各种实际领域,但其局限性及不足也是明显的。本文以一种新的观点认识数据,即认为变量的观测里均含有误差,同时认为不应删除经慎重选择进来的解释变量。为此,本文提出了一种新的多元预测方法———多元线性EIV预测。本文还考虑了新预测模型的一个实例应用,并从相对偏差上与多元回归预测进行了比较,从而揭示了多元线性EIV预测的先进性及较好的预测精度。  相似文献   

17.
PLS回归在消除多重共线性中的作用   总被引:12,自引:1,他引:11  
本文详细阐述了解释变量的多重共线性在回归建模与分析中的危害作用,并指出目前常用的几种消除多重线性影响的方法,以及它们的不足之处。本文结合实证研究指出:利用一种新的建模思路—PLS回归,可以更好地消除多重共线性对建模准确性与可靠性所带来的影响  相似文献   

18.
许多数据表示为区间数时更有利于管理和决策.为有效预测区间数序列,考虑系统中普遍存在的时滞效应,基于传统灰色模型同时引入系统特征和相关因素的滞后项,然后进一步把模型的适用范围从精确数序列拓广到区间数序列,提出了矩阵型时滞灰色多变量模型.在此基础上,提出了一种确定区间数序列最优滞后阶的方法.最后对我国财政收入和社会消费品零售总额进行预测,结果表明新模型是有效的,在拟合和预测方面均优于其他五个灰色竞争模型,具有一定的应用价值.  相似文献   

19.
本文通过例子介绍多元线性回归中自变量共线性的诊断以及使用 SAS/SATA( 6.12 )软件中的 REG等过程的增强功能处理回归变量共线性的一些方法。包括筛选变量法 ,岭回归分析法 ,主成分回归法和偏最小二乘回归法  相似文献   

20.
文章基于可加风险模型假设,采用偏最小二乘回归和有监督的主成分回归两种投影降维方法,研究了高维协变量情况下现状数据的降维问题。通过深入地模拟试验,对比两种降维方法在高维相关现状数据的生存预测方面的表现,最后将两种降维方法结合实际数据集进行实证分析。模拟和实证结果表明这两种降维方法能很好地处理具有高维、强相关协变量的小样本数据集,比如基因微阵列数据。在后续的研究中,有望将现状数据扩展至其它更一般的区间删失数据。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号