首页 | 本学科首页   官方微博 | 高级检索  
文章检索
  按 检索   检索词:      
出版年份:   被引次数:   他引次数: 提示:输入*表示无穷大
  收费全文   12篇
  数学   12篇
  2020年   1篇
  2019年   1篇
  2018年   2篇
  2017年   5篇
  2016年   1篇
  2010年   1篇
  2007年   1篇
排序方式: 共有12条查询结果,搜索用时 28 毫秒
1.
本文给出了集成学习模型可以收敛的集成学习算法,拟自适应分类随机森林算法。拟自适应分类随机森林算法综合了Adaboost算法和随机森林算法的优势,实验数据分析表明,训练集较大时,拟自适应随机森林算法的效果会好于随机森林算法。另外,拟自适应分类随机森林算法的收敛性确保它的推广误差可以通过训练集估计,所以,对于实际数据,拟自适应分类随机森林算法不需要把数据划分为训练集和测试集,从而,可以有效的利用数据信息。  相似文献
2.
利用随机森林特征选择算法,对信用评估的可用指标集进行特征选择,在此基础上建立基于随机森林融合朴素贝叶斯的信用评估模型.选取UCI数据库中的German数据集进行实证研究,结果表明,通过随机森林进行特征选择的随机森林融合朴素贝叶斯模型具有更高的预测准确度.  相似文献
3.
商品需求预测对于电商企业意义重大,对阿里电商平台的交易数据进行挖掘以获取有效特征,利用特征建立模型对未来两周这些商品的需求进行动态预测,并基于预测结果和成本最小的原则提出分仓规划建议.预测模型选择随机森林做回归,然后在残差分析的基础上建立报童模型求解分仓的库存规划.对特征数量众多的电商交易数据挖掘所建立的模型有助于电商企业进行有效的商品需求预测并据此制定成本更低的分仓规划.  相似文献
4.
在海量征信数据的背景下,为降低缺失数据插补的计算成本,提出收缩近邻插补方法.收缩近邻方法通过三阶段完成数据插补,第一阶段基于样本和变量的缺失比例计算入样概率,通过不等概抽样完成数据的收缩,第二阶段基于样本间距离,选取与缺失样本近邻的样本组成训练集,第三阶段建立随机森林模型进行迭代插补.利用Australian数据集和中国各银行数据集进行模拟研究,结果表明在确保一定插补精度的情况下,收缩近邻方法较大程度减少了计算量.  相似文献
5.
随着信息技术的进步和发展,现代生物学越来越多地将这些技术用于大规模生物数据的收集、分析、挖掘等过程.大量计算机技术,特别是统计方法被用来进行复杂疾病的分析.大量研究表明,人体的许多表型性状差异以及对药物和疾病的易感性等都可能与某些位点相关联,或和包含有多个位点的基因相关联.因此,定位与性状或疾病相关联的位点在染色体或基因中的位置,能帮助研究人员了解性状和一些疾病的遗传机理,也能使人们对致病位点加以干预,防止一些遗传病的发生.利用随机森林方法、Bootstrap重抽样、logistic回归等大数据分析方法,意在解决优化生物学位点关联性分析中单一致病位点识别、多位点相互作用和多性状位点关联性分析等子问题.  相似文献
6.
本文分析了15具白骨化尸体标本的股骨汞(Hg),铅(Pb),镉(Cd)元素含量数据,在三年的时间内采集了3次,一共收集到45个数据.首先将这组数据看着纵向数据,利用线性随机效应混合模型、Cox随机混合效应模型进行分析,结果显示,如果对每个白骨化尸体标本建立线性模型,可以精确预测出死亡时间,而且不需要采集铅元素含量数据.混合效应模型的预测效果也很好,最大误差不会超过1个月.其次我们对数据不作任何假设,利用机器学习中随机森林方法分析数据,并利用5折交叉验证方法来判断结果的可靠性,训练集和测试集的NMSE分别为0.1205944,0.5604286,因此可以用训练出的模型来预测死亡时间.  相似文献
7.
In this paper,we obtain some results on the existence and uniqueness of solutions to stochastic forest evolution system under non-Lipschitz condition, with Lipschitz condition being considered as a special case.We develop our theory by investigating convergence of sequence of stochastic process defined by successive approximations in the general functional setting.The major tools we used are Bihari inequality and Davis inequality.  相似文献
8.
随着中国经济的不断发展,城市化进程不断推进,总人口逐年增加;农村人口逐年减少,粮食的需求量逐年增加,某些贫困地区已经出现粮食短缺的状况.本文选取了1986年-2016年辽宁省年粮食总产量、有效灌溉面积、农业化肥施用量、农业机械总动力、播种面积以及受灾面积等相关数据.利用支持向量机回归、线性回归,随机森林三种方法,对辽宁省粮食产量进行了预测,并比较了三种方法预测的精准度.  相似文献
9.
信用评估是商业银行控制和防范信贷风险的关键途径.决策树模型较好的直观解释性使其成为当前个人信用评估中的常用模型,但决策树模型存在容易导致过拟合且预测精度有限的问题.通过在决策树模型算法中引入类随机森林随机有放回的抽样模式,运用机器自动循环迭代寻求最优树的建模思想,建立了自适应最优C5.0决策树个人信用评估模型.该模型具有快速收敛特征变量、较好的泛化能力和高预测精度的特点,在实证分析中对商业银行个人信用评估模型质量提升带来比较明显的改进效果.  相似文献
10.
利用集成算法中的Bagging、Boosting和Random Forest三个方法,选取股票指数中的中小板指数、深证成指数、上证指数、创业板指数4组数据进行分析,得出Random Forest对上证指数、中小板指预测结果较好;Boosting对创业板指预测结果较好;Bagging对深证成指预测较好.并在4个板指中,随机选取了4支股票数据(分别为大连重工、中南建设、中国医药、东方国信)进行分析,得出集成算法在数据为200个的情况下,预测结果较为准确,其中不同方法对不同股票的适宜程度有所不同.  相似文献
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号