首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 78 毫秒
1.
准确预测致密气藏分段压裂水平井产能是压裂效果评价和优化设计的关键环节。现有的产能预测方法,引入了过多的假设和简化,很难全面反映致密储层流体多尺度的运移机理和复杂物理过程,导致产能预测误差较大。提出一种基于机器学习的致密气藏分段压裂水平井产能预测方法,该方法综合利用已收集的地质、压裂水平井产能及钻完井等多类型数据,通过机器学习算法直接挖掘数据内部规律,建立产能预测模型。此外,为解决常规机器学习模型的“黑盒子”问题,还利用SHAP(SHapley Additive exPlanations)方法对建立的机器学习模型进行全局和局部解释,分析影响产能的主要因素,增加了模型的可信性和透明度。以苏里格气田苏东示范区为例,验证了该方法的有效性和实用性。与油气藏数值方法相比,该方法不仅提高了产能预测的精度,而且缩短了建模周期,加快了计算速度。  相似文献   

2.
交通事故致因因素导致交通事故的发生,而交通事故致因因素的产生与驾驶人的特征相关。基于K-means++对事故伤亡人数、年龄、驾驶经验、事故责任、驾驶人的不安全行为值、车辆的不安全状态值进行聚类分析,探讨具备不同特征的驾驶人群体产生不同类别的交通事故致因因素的倾向性。结果表明,当聚类簇数为3时,轮廓系数为0.52,模型将驾驶人分为3个群体。其中:驾驶经验及年龄较低,事故责任较高的驾驶人群体存在较高的不安全行为值;驾驶经验及年龄较高,事故责任较高的驾驶人群体存在较高的车辆的不安全状态值及较高的伤亡人数;事故责任较低的驾驶人群体的不安全行为值与车辆的不安全状态值均较低。  相似文献   

3.
为提高风险预测系统的易用性和可解释性,提出基于自组织映射网络(SOM)改进的即时学习(JITL)风险预测框架。首先,应用SOM对数据样本进行聚类,并对聚类特征进行解释。进而,通过基于聚类结果的样本选择算法构建待测数据的相似样本集,在线上调用作为基学习器的支持向量机(SVM)进行建模并输出风险预测结果。最后,采用一个交通事故数据集对风险模型的性能进行测试,检验其精度、易用性和可解释性。结果表明:采用SOM-JITL策略的SVM模型,受试者工作状况曲线面积指标达到0.720,相比不使用该策略的传统SVM模型提高17.5%,精度较高;SOM-JITL模型构建所需参数调节工作少,具有较好的易用性;此外,SOM聚类结果准确识别出处于交通拥堵等高风险场景,与现实场景一致,具有可解释性。综上,SOM-JITL策略能有效提高基学习器的性能,达到精度、可解释性和易用性的平衡,有助于以低成本大规模推广风险预测系统。  相似文献   

4.
目的 研究混凝土自生收缩的多因素作用机理,建立适用于混凝土自生收缩预测的机器学习模型,增强机器学习算法的可解释性。方法 将水灰比、水胶比等14个指标作为输入变量,混凝土自生收缩值作为输出变量进行预测;采用BPNN、SVM、RF及XGBoost算法建立混凝土自生收缩预测模型,基于判定系数R2、均方根误差RMSE及平均绝对误差MAE,选取最适用于混凝土自生收缩的预测模型;采用SHAP法解释输入变量对输出变量的贡献程度、相关性及各输入变量的作用机理。结果 相较于其他算法而言,XGBoost算法可以有效预测混凝土的自生收缩,此时得到的R2、RMSE及MAE分别为0.956、0.055及0.026。结论 骨灰比是影响混凝土自生收缩的关键变量;骨灰比、高吸水树脂掺量等指标与混凝土自生收缩呈现负相关;时间与硅灰掺量等指标与混凝土自生收缩呈现正相关;采用SHAP法可以有效解决机器学习模型存在的黑盒问题,提高模型的可解释性。  相似文献   

5.
陈赟  刘湘慧  陈玉斌 《科学技术与工程》2021,21(35):15222-15229
为明确交通隧道施工事故致因之间纵向影响关系及层级结构,本文从事故发生全过程视角出发,在利用文本挖掘技术构建事故致因体系的基础上,借助决策实验室分析法(DEMATEL)及解释结构模型(ISM)判断各致因的重要性程度,建立事故致因多级递阶结构模型,确定关键致因因素,构建关键致因影响链,深入分析其纵向影响关系,并以WLM隧道为例进行验证,证实其实用性。研究结果表明:5方面20项交通隧道施工事故致因间存在明显的层级结构;人员、管理及环境因素对技术因素、机械设备与材料因素存在直接影响作用,其中安全意识及素养、安全监管、施工方案及各类环境因素在事故致因体系中占据重要位置,对其进行有效管控是良好安全管理的体现。本研究可为交通隧道施工安全管理提供参考与依据。  相似文献   

6.
韩策  翟越  屈璐  李宇白  李艳 《科学技术与工程》2023,23(18):7895-7902
为探究弹性能指数、应力系数、脆性系数、埋深四种岩爆指标与岩爆等级之间的相关关系,解决复杂机器学习算法的黑盒问题。本文引入LIME(local interpretable model agnostic explanations)算法,完善岩爆机器学习预测过程中的可解释性。文章搜集国内外190组岩爆实例工程构建数据集经过预处理后,通过9种机器学习算法比较获得最优算法并采用贝叶斯优化获得算法最优参数,建立岩爆预测模型。基于LIME可解释性算法,对四种岩爆指标进行相关、回归及阈值分析,最后采用弹性能指数及应力系数两种指标阈值对终南山隧道竖井工程进行岩爆预测。研究结果表明:(1) 岩爆等级与弹性能指数、应力系数呈线性相关,且弹性能指数线性关系更明显;(2) 岩爆等级与脆性系数、埋深呈非线性相关,且脆性系数非线性关系更明显;(3) 4个岩爆指标对岩爆等级影响程度依次为:弹性能指数、应力系数、埋深、脆性系数;(4) LIME算法可以准确地表达岩爆等级与岩爆指标之间的相关关系且得到的两种指标阈值与终南山隧道竖井工程实例具有一致性。  相似文献   

7.
为优化城市快速路出口影响区的交通组织,降低出匝车辆的换道风险,提高交通运行的安全性和高效性,依托上海自然驾驶实验数据,提取城市快速路出口影响区出匝车辆的轨迹数据样本,建立出口影响区换道风险评价方法及分级标准;针对三种常见的快速路出口,考虑人、车和路域环境方面的综合因素,利用二项Logistic模型构建换道风险模型,分析不同因素对换道风险的影响程度,以及一定条件下车辆存在换道风险的概率;在此基础上,根据出口影响区的车辆运行信息和换道风险模型,控制换道风险在合理范围内,得到出匝车辆的合理(最迟)换道位置,并提出相应的城市快速路出口影响区的车道管理方法。  相似文献   

8.
野火易发性评价对野火灾害的前期预防以及灾害管理决策的制定至关重要。目前野火易发性的研究主要集中于提高模型的预测精度,而往往忽略对模型的内部决策机制进行解释分析。为此,构建了一种基于可解释机器学习的野火易发性模型,并详细分析了各因子对野火易发性预测结果的影响。以南宁市历史野火样本为基础,综合考虑样本的空间分布特征,选取高程、归一化植被指数(normalized difference vegetation index, NDVI)、年均降雨和平均气温等18项评价因子,利用分类和回归树(calssification and regression tree, CART)、随机森林(random forest, RF)、轻量的梯度提升机(light gradient boosting machine, LGBM)和极致梯度提升(extreme gradient boosting, XGBoost)4种机器学习模型构建野火易发性预测模型。基于性能最优的易发性模型,运用沙普利加和解释(shapley additive explanations, SHAP)方法完成特征全局性解释、依赖性分析和典型样本...  相似文献   

9.
为了缓解网约车交通事故,以网约车驾驶员为研究对象,探究网约车交通事故致因机理.通过调查问卷收集了2 458名网约车驾驶员个体属性、工作强度、工作压力、不良驾驶行为和交通事故经历的相关信息.对数据进行分类处理后,通过贝叶斯网络建立网约车事故频率预测模型.基于十折交叉验证法,使用混淆矩阵与接收者操作特征曲线校验模型精度.结果表明,模型预测能力较好,模型分析了11种与事故频率直接相关的影响因素,识别了16类导致高频率事故发生概率增加的不利状态,且发现多种不利状态组合对事故频率产生的非线性扩增效应和叠加效应.研究结论有助于管理部门制定相应预防对策以减少网约车交通事故频率.  相似文献   

10.
应力敏感是致密砂岩气藏损害的主要原因之一,预测应力敏感损害下岩芯渗透率和裂缝开度的变化规律一直是致密砂岩储层保护领域的重点。以塔里木盆地克拉苏构造带岩样为研究对象,基于应力敏感实验及调研数据,采用机器学习多元线性回归算法,耦合了围压渗透率关系模型和K-p函数参数预测模型,建立了岩芯渗透率预测模型和裂缝开度预测模型,并通过决定系数、均方根误差和相对误差检验模型精度。结果表明,围压渗透率关系模型在裂缝性岩芯和非裂缝性岩芯中预测结果决定系数平均值均大于0.960;K-p函数参数预测模型在裂缝性岩芯中的均方根误差高于非裂缝性岩芯,但裂缝性岩芯的相对误差要低于非裂缝性岩芯,综合来看岩芯渗透率预测模型更适用于裂缝性岩芯;裂缝开度预测模型与实测值决定系数0.978,预测精度较高。建立的渗透率预测模型和裂缝开度预测模型可为致密砂岩储层的开采与保护提供指导。  相似文献   

11.
地震破坏预测研究对于建筑结构减灾规划、震前风险预测、震后应急评估有着重要意义。传统的方法因为受到震害资料数量的限制以及计算精度和能力的制约,一般基于经验只考虑少数因素对结构破坏的影响。通过使用随机森林算法,设计了一个综合考虑地震动、结构和场地等多维度信息的分类方法,用以预测建筑物的地震破坏程度。本文研究框架基于新西兰国家地震委员会所收集的27次地震详细破坏资料,处理得到14.2万条高质量建筑物损失数据,考虑了谱加速度、建筑形状、层数等16个影响因素,将4种不同的损伤状态作为模型的学习标签进行地震破坏预测训练。结果表明,随机森林算法在6种分类算法中性能最佳,经过学习曲线法调参、代价敏感学习之后,经过优化得到的随机森林模型对于测试集的整体预测精确率可以达到75.4%,对4种损伤标签的召回率分别达到了88.2%、55.0%、60.7%和70.8%,远好于其他方法。当只考虑对结果影响最重要的前12个因素,该模型的预测精度仍然能够达到73.7%。可见,基于此框架所训练的预测模型具有良好的精度与适用性,同时该框架对于中国震害资料大数据库的研究具有较高的参考价值。  相似文献   

12.
【目的】比较分析XGBoost模型、LightGBM模型、随机森林模型(RF)、K最近邻模型(KNN)、长短期记忆神经网络(LSTM)、决策树模型(DT)共6个PM2.5浓度预测模型,以准确、及时预测环境PM2.5浓度。【方法】基于重庆市合川区2020年全年空气质量监测数据和气象数据,通过最大相关最小冗余算法(MRMR)进行数据降维选择最优特征子集,作为模型的输入,逐一进行PM2.5浓度预测;考虑到不同季节PM2.5浓度差异较大,故分季节预测了PM2.5浓度;为了探究各模型预测性能,计算了各模型运行时间和内存占用,并基于PM2.5与特征变量的相关性和特征变量的重要性探讨了模型预测性能季节性差异原因。【结果】模型总体预测精度从高到低排序为 XGBoost、RF、LightGBM、LSTM、KNN、DT模型;预测性能方面,6个模型均表现为秋冬季节预测精度高于春夏季节;LightGBM模型可在保证模型精度的情况下,大幅减少模型训练时间和内存占用;特征重要性显示PM10浓度、气温和气压的重要性高,O3浓度、风向和NO2浓度重要性相对较弱。【结论】采取MRMR方法进行数据降维选取的最优特征子集能较好地预测PM2.5浓度;相比较而言,XGBoost、RF、LightGBM、LSTM模型在PM2.5浓度预测上具有较优性能,其中综合性能较好的为LightGBM模型。  相似文献   

13.
With the emergence of various intelligent applications,machine learning technologies face lots of challenges including large-scale models,application oriented real-time dataset and limited capabilities of nodes in practice.Therefore,distributed machine learning(DML) and semi-supervised learning methods which help solve these problems have been addressed in both academia and industry.In this paper,the semi-supervised learning method and the data parallelism DML framework are combined.The pseudo-l...  相似文献   

14.
岩爆类型预测是防治和控制硬岩矿山岩爆灾害的有效方式。基于国内外397组岩爆案例数据,规范训练集与测试集的数据预处理方式,采用模型参数优化及交叉验证技术获得最近邻、支持向量机与决策树模型最佳参数;对比分析主成分分析法(PCA)与过采样SMOTE对3种机器学习算法预测准确率的影响,并采用准确率、精确率、召回率、F1等指标对模型预测性能进行评估。结果表明:主成分分析对3种机器学习模型的预测准确率并无提升,不同岩爆类型的样本之间不具有较为明显的决策边界;过采样SMOTE算法仅对决策树模型有明显的提升,基于过采样建立的SMOTE-DT模型预测准确率为77.50%,高于仅对原始数据集进行标准化处理的KNN、SVM模型的68.75%与57.50%;SMOTE-DT在高估与低估岩爆类型表现优于KNN与SVM模型,对于四种岩爆类型的F1值均大于0.7,岩爆预测性能稳定可靠。此外,采用本文构建的3种机器学习模型对山西紫金金矿进行了岩爆类型预测,模型预测结果与现场观测结果相一致。本文构建的三种用于岩爆类型预测的机器学习模型避免了训练集信息泄露对测试集造成影响,研究结果为岩爆类型预测及规范机器学习模型训练过程提供了理论支撑。  相似文献   

15.
采用决策树(DT)模型及其衍生的随机森林(RF)模型、极端随机树(ET)模型和梯度提升树(GBDT)模型,对用于甲烷吸附的金属有机框架材料(MOFs)进行了高通量的计算筛选。利用1 800种材料的特征向量数据,计算了特征向量之间的相关性并进行重要度分析,发现材料的结构特征与化学信息特征的相关性不大,但是结构特征的重要度较高。将数据库中的1 260种材料作为训练集并使用上述4种机器学习模型进行训练,再将剩余的540种材料作为测试集对模型的筛选结果进行比较和评估。接收者操作特征(ROC)曲线和查准率-查全率(PR)曲线结果表明,GBDT模型自身稳定性强且预测结果精度高,因而成为筛选吸附甲烷的高性能金属有机框架材料的最佳模型。针对RF模型和GBDT模型进行参数优化,发现协调单个决策树的个数和决策树节点的分裂特征数量能够有效改善RF模型的性能,而调节回归树的学习速率和迭代次数可有效改善GBDT模型性能。最后基于540种材料的测试集,利用GBDT模型筛选出前20种高性能吸附材料,分析了它们的主要特征向量与甲烷吸附量之间的关系。  相似文献   

16.
提出一种基于样本分布的极限学习机预测模型WELMSD.该模型先用kN近邻密度估计方法估计出样本的密度值,再用估计出的密度值给传统ELM的经验风险项加权,克服传统ELM在对时间序列进行预测时忽略样本分布的缺点.基于Rossler混沌时间序列和上证、深证股票数据的实验仿真结果证明了所提算法的有效性,且当近邻参数k_N取值较小时,所提模型对参数不敏感,是一种更优的多变量时间序列预测模型.  相似文献   

17.
技术方案深度的不足导致依据定额概预算来确定输电线路工程投资的方法准确性低、工作量大,因此,研究基于机器学习的投资预测模型需求迫切。针对输电线路投资的高维数、非线性等特点,提出了基于极端梯度提升(extreme gradient boosting, XGBoost)算法的输电线路工程投资预测方法。通过采用实际输电线路工程数据对模型进行训练和测试,预测结果显示XGBoost模型在预测精度、结果偏差方面相较于神经网络和支持向量机(support vector machine, SVM)都具有较大的优势,能输出指标重要性排序,为决策者提供有效的投资额和控制指标参考,且模型的可靠性和可解释性较高。  相似文献   

18.
魏东  张天祎  冉义兵 《科学技术与工程》2021,21(28):11910-11920
基于警务数据和时空数据构建犯罪预测模型,利用机器学习手段进行案事件预测,在国家安全稳定领域具有重要的意义。犯罪预测涉及三个主要方面:特征选择与处理、预测模型和地理信息可视化。分析了犯罪预测理论与方法的基本思想,在探索犯罪的生成机理和演化规律基础上,对经验模型和时空模型研究成果进行了综述。在此基础上,对根据不同预测特征选取最优算法的策略进行了讨论,同时对比简述了各类算法的特点,并对现存问题和未来研究方向进行了探讨。  相似文献   

19.
针对传统基于BP神经网络建立的连铸坯质量预测模型训练速度慢、适应能力弱、预测精度低等问题,本文提出一种基于极限学习机的连铸坯质量预测方法,对方大特钢60Si2Mn连铸坯中心疏松和中心偏析缺陷进行预测,并与BP和遗传算法优化BP神经网络预测模型的预测结果进行分析对比.结果表明:BP及GA-BP神经网络预测模型对连铸坯中心疏松和中心偏析缺陷的预测准确率分别为50%、57.5%、70%和72.5%;而基于极限学习机的连铸坯预测模型预测准确率更高,对连铸坯中心疏松和中心偏析缺陷的预测准确率分别为85%和82.5%,且该模型具有极快的运算时间,仅需0.1s.该模型可对连铸坯质量进行迅速准确地分析,为连铸坯质量预测的在线应用提供了一种新的方法.  相似文献   

20.
在极限学习机预测多变量时间序列研究中,针对以往将矩阵转换成向量作为模型输入,从而影响预测精度的问题,结合奇异值分解思想,提出一种直接以矩阵作为输入的多变量时间序列极限学习机预测型SVDELM.由Rossler、Chen’s、Lorentz和股票多变量时间序列的实验结果表明,SVDELM是一种有效的多变量时间序列预测模型.  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号