首页 | 本学科首页   官方微博 | 高级检索  
     检索      

基于BERT的短文本分类模型及在铁路CIR设备故障诊断中的应用
引用本文:张奕林,叶含瑞,张玲玲,薛倚明.基于BERT的短文本分类模型及在铁路CIR设备故障诊断中的应用[J].系统科学与数学,2024(1):115-131.
作者姓名:张奕林  叶含瑞  张玲玲  薛倚明
作者单位:1. 中国科学院大学经济与管理学院;2. 中国科学院大学数字经济监测预测预警与政策仿真教育部哲学社会科学实验室;3. 香港中文大学(深圳)数据科学学院;4. 中国科学院大数据挖掘与知识管理重点实验室
基金项目:国家自然科学基金面上项目(72071194);
摘    要:在设备故障诊断领域,操作说明、维修记录等文本数据具有极大的应用价值,充分挖掘和利用这类数据能大幅度提升故障诊断的工作效率.现有研究常用语义特征抽取及无监督聚类方法挖掘文本数据,辅助进行故障定位,但这类方法通常无法解释故障原因和给出提供相应维修方案的理由,据此生成的故障维修方案不易于理解.文章基于现有的成熟预训练语言模型BERT (bidirectional encoder representation from transformers),提出了一种基于BERT的短文本分类模型和知识图谱结合的故障定位方法,以充分挖掘和利用铁路CIR设备的文本数据中蕴含的知识和规律.所用方法首先基于CIR设备的功能层次关系确定故障模块,然后借助基于BERT的文本分类技术实现故障的初步定位,最后结合知识图谱进一步确定故障原因等信息辅助进行故障诊断,基于知识图谱积累的故障诊断知识提供故障维修方案易于维修人员理解,有助于知识的管理和工程效率的提升.在文本分类技术方面,文章利用铁路CIR设备故障维修台账记录数据进行实验,实验结果证明,基于BERT的短文本分类模型相较传统分类模型在性能上有较大的提升;在故障诊断方...

关 键 词:文本分类  BERT  CIR设备  故障诊断
设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号