基于SMOTE和KNN的石油数据缺失填充算法 |
| |
引用本文: | 李董,迟家俊,相博,王梅.基于SMOTE和KNN的石油数据缺失填充算法[J].数学的实践与认识,2019(17). |
| |
作者姓名: | 李董 迟家俊 相博 王梅 |
| |
作者单位: | 东北石油大学计算机与信息技术学院;大庆钻探工程公司钻井一公司;吐哈油田公司鄯善采油厂 |
| |
摘 要: | 大数据环境下,数据缺失是一种普遍现象,由此带来数据决策偏差等问题.针对石油生产数据缺失问题,提出一种基于SMOTE和KNN的数据填充SMKNN算法.受不平衡数据集过采样的启发,SMKNN算法在KNN算法基础上采用SMOTE算法选取近邻随机插值产生的数据作为近似缺失值,同时,采用多重填补思想求平均值作为填充数据.分别采用UCI机器学习标准数据集和大庆油田某井区生产数据进行实验,验证了SMKNN算法不仅能填充数据,而且提高了准确率.
|
关 键 词: | 数据缺失 数据填充 KNN算法 SMOTE算法 多重填补 |
Missing Oil Value Filling Algorithm Based on KNN and SMOTE |
| |
Abstract: | |
| |
Keywords: | |
本文献已被 CNKI 等数据库收录! |
|