基于K-means-CNN耦合的采砂大数据智能清洗模型研究 |
| |
引用本文: | 张静,陈燕林.基于K-means-CNN耦合的采砂大数据智能清洗模型研究[J].现代信息科技,2023(18):99-105. |
| |
作者姓名: | 张静 陈燕林 |
| |
作者单位: | 1. 河南工业贸易职业学院信息工程学院;2. 华北水利水电大学电子工程学院 |
| |
基金项目: | 河南省高等学校重点科研项目(21A510007);;河南省重大科技专项(201110210300); |
| |
摘 要: | 针对水下采砂大数据中存在信息缺失、冗余、混乱等问题,构建一种K-means聚类与CNN(卷积神经网络)的耦合模型。首先应用最小二乘法得到K-means的聚类阈值,使同类型数据更易于聚类;对数据集进行CNN网络训练,根据各种不同的样本进行网络参数选择,同时实现了CNN智能融合处理;再把从现场收集的大数据输入经过K-means-CNN智能耦合的模式中,将水下采砂大数据分为缺失、冗余、混乱、正常四种类型,并进行标记和数据清洗。试验结果表明,基于K-means-CNN的数据清洗模型,对异常数据的有效清除率超过80%,提高了水下采砂大数据的质量,为后续水下采砂大数据分析打下良好的基础。
|
关 键 词: | 水下采砂 大数据清洗 K-means聚类 最小二乘法 卷积神经网络 |
|