基于随机森林算法的两阶段变量选择研究 |
| |
作者姓名: | 冯盼峰 温永仙 |
| |
作者单位: | 福建农林大学计算机与信息学院 |
| |
摘 要: | 变量选择在高维数据处理中尤为重要,其中变量的重要性评级是关键问题.文章提出基于随机森林两阶段逐步变量选择算法.第一阶段提出变量重要性排序改进方法,目的进一步提高重要变量与噪声变量的区分度.第二阶段基于随机森林的逐步变量选择.通过模拟数据验证该方法的有效性和可行性.对水稻数据QTL定位进行实证研究,将基于两阶段随机森林逐步变量选择算法与SCAD、Elastic Net、传统QTL定位WinQTLcart2.5软件的运行结果比较,发现基于随机森林两阶段逐步变量选择算法能有效筛选变量.
|
本文献已被 CNKI 等数据库收录! |
|