Review of construction and reasoning methods for knowledge graphs in coal mining domain
-
摘要:
将煤矿领域来自不同数据源的知识进行抽取,形成知识网络,借助推理技术可辅助煤矿设备故障诊断、安全风险实时预警与处置、灾害事故原因分析、应急救援方案生成及生产组织和运营管理决策支持,从而推进智慧矿山建设。梳理了知识图谱尤其是煤矿领域知识图谱的研究现状,介绍了以知识为驱动的人工智能发展历程、基于知识图谱的人工智能系统架构、知识图谱的主要类型和代表性工作,剖析了煤矿领域已有知识图谱的知识建模情况、知识图谱构建方式、知识图谱使用方式和成熟度。从实体识别、关系抽取、知识图谱融合与纠错、知识图谱推理等方面,对煤矿领域知识图谱构建与推理技术面临的挑战进行了分析,指出针对上述挑战,需研究基于跨度的实体识别方法、基于多堆叠分类器的关系抽取方法、实体的嵌入表示方法、实体间关系的一致性约束建模方法;煤矿领域知识图谱推理技术的研究需以应用为驱动,与业务场景密切结合;煤矿领域存在大量图像、视频等多模态数据,未来可构建煤矿领域多模态知识图谱,还可融入时间信息构建煤矿领域时序知识图谱。
Abstract:Knowledge from diverse data sources in the coal mining domain is extracted to construct a knowledge network. Leveraging reasoning technologies, this network supports equipment fault diagnosis, real-time safety risk warnings and responses, disaster cause analysis, emergency rescue planning, production organization, and operational decision-making, thereby advancing intelligent mining. This paper reviews the research progress on knowledge graphs, with a focus on their applications in coal mining. It discusses the evolution of knowledge-driven artificial intelligence, the architecture of AI systems based on knowledge graphs, primary types of knowledge graphs, and representative studies. The paper examines knowledge modeling, construction, utilization, and maturity of existing knowledge graphs in the coal mining domain. Key challenges in knowledge graph construction and reasoning, spanning entity recognition, relation extraction, graph fusion and error correction, and reasoning, are analyzed. To address these challenges, proposed solutions include span-based entity recognition methods, multi-stack classifier-based relation extraction, entity embedding techniques, and consistency constraint modeling for entity relationships. Research on reasoning techniques should remain application-driven and tightly integrated with business scenarios. Given the abundance of multimodal data such as images and videos in the coal mining field, future efforts could focus on constructing multimodal and temporal knowledge graphs by incorporating time information.
-
0. 引言
智慧矿山建设对实现煤炭行业的高质量发展具有至关重要的作用[1-3]。根据建设目标和技术途径,智慧矿山的发展分为3个阶段:第1阶段主要依托物联网和大数据技术实现对矿山状态的全方位感知、综合分析和趋势预测,核心是数据、算法和算力[4-5]。第2阶段主要依托人工智能中决策智能的发展成果,在第1阶段的基础上引入知识,实现自主决策[6]。第3阶段主要依托机器人的广泛应用,实现自主控制,达到无人化智慧矿山的高级目标[7-8]。
目前,第1阶段的建设目标已经基本完成,能够对矿山中人、物、环境和设备的状态进行全面感知、预测和预警[9-10]。然而,煤矿生产中存在众多涉及决策的过程,如设备故障诊断、安全风险处置、灾害事故原因分析、灾害应急救援方案生成及生产组织和运营决策等。目前这些过程仍然主要依赖人工经验,智能化程度较低[11]。造成上述问题的重要原因在于第1阶段主要依靠数据、算法和算力,没有有效利用领域专家的知识,决策能力不足。面向第2阶段实现自主决策的建设目标,亟需开展煤矿领域知识图谱构建与推理方法的研究[12]。
知识图谱旨在通过实体和实体间关系来阐述客观世界的概念、对象及其相互关联性[13-14]。目前,通用领域知识图谱发展已较为成熟,主要包括国内的CN−DBpedia[15],Zhishi.me[16]及国外的Wikidata[17],Freebase[18],YAGO[19]等,被广泛应用于互联网搜索、智能问答系统和推荐系统等。行业领域知识图谱也受到广泛关注,如医疗领域知识图谱、金融领域知识图谱、教育领域知识图谱等,被用于临床辅助决策[20]、投资辅助决策[21]、学习路径规划[22]等。因此,煤矿领域知识图谱是推进智慧矿山建设的关键环节。
将煤矿领域来自不同数据源的知识进行抽取,形成一张丰富的知识网络,借助推理技术可以辅助煤矿设备故障诊断、安全风险实时预警与处置、灾害事故原因分析、应急救援方案生成及生产组织和运营管理决策支持,提高煤矿的科学管理能力和安全生产水平。
本文对煤矿领域知识图谱构建与推理方法的研究进行综述。首先,梳理知识图谱的研究现状,概述以知识为驱动的人工智能发展历程、基于知识图谱的人工智能系统架构、知识图谱的主要类型和代表性工作,分析煤矿领域知识图谱的研究现状,重点剖析该领域已有知识图谱的知识建模情况、知识图谱构建方式、知识图谱使用方式和成熟度;然后,对煤矿领域知识图谱构建与推理面临的挑战进行分析,覆盖实体识别、关系抽取、知识图谱融合与纠错、多跳推理的路径选择等方面;最后,对煤矿领域知识图谱构建与推理的技术趋势和该领域知识图谱在综采设备故障智能诊断、安全风险实时预警与处置、灾害事故原因分析、应急救援方案生成、生产组织和运营决策支持等方面的应用进行展望。
1. 研究现状
1.1 知识图谱研究现状概述
2012年,谷歌提出了知识图谱的概念,标志着以知识为驱动的人工智能进入新的发展阶段。以知识为驱动的人工智能经历了5个重要发展时期,如图1所示。第1时期是专家系统的提出,标志着人工智能研究向知识主导的转变。第2时期是知识库的提出。这一时期知识表示和知识库构建成为研究的热点。第3时期是知识工程概念的提出,标志着人工智能研究从知识表示到知识应用的转变。第4时期是语义网概念的提出,将传统人工智能的发展与万维网结合,以资源描述框架为基础,在万维网中应用知识表示与推理方法,实现更语义化的智能信息处理与交互。第5时期是知识图谱的诞生,标志着知识工程技术迈入了新时代。这一时期的关键特征是以资源描述框架(Resource Description Framework,RDF)三元组和属性图等形式表示知识,数据规模巨大,需要使用机器学习、自然语言处理等技术进行自动化的知识图谱构建。
知识图谱催生了大批人工智能应用。基于知识图谱的人工智能系统架构包括源数据层、知识图谱构建与推理层、应用层,如图2所示。源数据层提供知识图谱构建所需的结构化数据(如链接数据、关系型数据库)、半结构化数据(如HTML,XML,JSON)和非结构化数据(如文本、图像、视频)。知识图谱构建与推理层抽取源数据中所包含的知识,完成知识图谱构建,并通过推理技术支持上层应用。知识图谱的应用不仅涵盖面向一般互联网用户的通用领域,如互联网搜索、智能问答、个性化信息推荐等,还涉足各行业领域,如医疗领域的智能化诊疗、金融领域的投资辅助决策和教育领域的个性化学习路径规划等。
知识图谱可以分为传统知识图谱、时序知识图谱和多模态知识图谱3种类型。
传统知识图谱通常从非结构化的文本数据中抽取出实体和关系,并表达为复杂的图结构。实体是知识图谱中的基本元素,代表现实世界中的事物和概念,表达为图结构中的节点。关系代表实体之间的连接或关联,描述实体之间的某种语义关系,表达为图结构中的边。代表性工作如阮彤等[23]构建的中医药知识图谱和陆锋等[24]构建的地理知识图谱。
时序知识图谱相比传统知识图谱增加了时间维度,知识图谱的结构、实体和关系都会随着时间的推移发生改变。代表性工作如陈德华等[25]针对临床领域时序知识图谱研究了链接预测模型。
多模态知识图谱通过整合不同类型的数据,如文本、图像、视频、音频等,更全面地表示知识。代表性工作如Deng Cheng等[26]提出的GAKG。GAKG是基于地球科学相关的期刊上发表的112万篇论文数据所构建的大型多模态学术知识图谱。除论文中的文本外,还提取了论文内部的插图和表格信息,具有多模态的属性。
在形成知识图谱的基础上,需借助知识图谱推理技术为各类智能化应用提供支持。知识图谱推理技术利用知识图谱中已有的知识推理出新知识,为各种任务(如问答和推荐)提供关键支持。代表性工作如Zhu Anjie等[27]使用分层强化学习框架实现知识图谱推理,Zheng Shangfei等[28]提出一种多跳多模态知识图谱推理模型。
1.2 煤矿领域知识图谱研究现状分析
随着智慧矿山建设的不断推进,知识图谱亦受到煤矿领域研究者的广泛关注。根据应用场景的不同,煤矿领域现有知识图谱大体可分为煤矿灾害防治知识图谱和煤矿机电设备维护知识图谱,其代表性工作技术成熟度情况见表1。
表 1 煤矿领域知识图谱代表性工作技术成熟度情况Table 1. Technological maturity of representative work of knowledge graph in coal mining domain应用场景 代表性工作 知识建模情况 知识图谱构建方式 知识图谱使用方式 成熟度评价 煤矿灾害
防治许娜等[29] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 罗香玉等[30] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 刘鹏等[31] 仅对相关概念进行分类,没有定义关系类型 自动构建 仅以查询方式使用知识图谱 ★★☆☆☆ 刘永立等[32] 概念类别和关系类型均未明确定义 人工构建 仅探讨知识图谱推理的潜在应用,未实现推理 ★☆☆☆☆ 吴克介[33] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 煤矿机电
设备维护李哲等[34] 依据专家经验确定概念类别和关系类型 人工和自动构建
相结合仅探讨知识图谱推理的潜在应用,未实现 ★★★☆☆ 韩一博等[35] 依据专家经验确定概念类别和关系类型 自动构建 未提及 ★★☆☆☆ 冯银辉等[36] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 煤矿灾害防治是保障煤矿安全的关键措施。煤矿灾害防治知识图谱旨在整合、存储和表达与煤矿灾害防治相关的知识,以提升对煤矿灾害的理解、预防和处理能力。通过构建煤矿灾害防治知识图谱,可以对实时监控数据进行动态分析,从而实现早期预警和异常检测。代表性工作如许娜等[29]从安全管理系统结构和安全隐患风险2个维度对煤矿建设安全领域知识进行分类,提炼出实体和实体之间的关系类型,基于Bert的双向长短时记忆网络条件随机场模型(Bert-Bidirectional Long Short Term Memory-Conditional Random Field,Bert−BiLSTM−CRF)进行实体识别,基于规则的方法进行关系抽取,完成知识图谱的自动构建,基于构建的知识图谱实现煤矿建设安全管理领域的知识问答;罗香玉等[30]采用本体方法对顶板灾害防治领域的概念和关系进行分类建模,使用基于跨度的实体识别方法和基于依存句法树引导实体表示的关系抽取方法完成知识图谱的自动构建,展望了顶板灾害防治知识图谱在顶板管理知识问答方面的应用;刘鹏等[31]对煤矿安全领域相关概念分类建模,基于网格长短时记忆网络(Lattice-Long Short Term Memory,Lattice−LSTM)进行实体识别,基于语义相似度进行关系抽取,完成知识图谱自动构建,基于构建的知识图谱提出了一种知识查询方法;刘永立等[32]将知识图谱与应急处置预案进行动态融合,利用数据融合技术整合多源异构数据,构建出火灾及耦合灾害知识图谱、灾害事理图谱、监管部门图谱等,根据构建的知识图谱实现应急预案的决策支持;吴克介[33]在总结矿井安全监控系统领域知识源的基础上进行领域知识图谱构建,分析了知识源获取、知识提取、知识存储与展示的技术实现途径,采用基于双向长短时记忆网络条件随机场(Bidirectional Long Short Term Memory-Conditional Random Field,BiLSTM−CRF)与词注意力机制结合的方法进行命名实体识别,采用梯度提升决策树模型进行关系抽取,将研究成果应用于安全监控系统异常分析,对矿井采煤工作面报警情况进行分析。
煤矿机电设备维护知识图谱整合和管理煤矿机电设备知识及故障数据,提高事故处理效率,并为决策提供支持。代表性工作如李哲等[34]针对难以从煤矿机电设备事故表象和部分监控数据判断设备事故根本原因,以及缺少能够利用历史数据、经验知识的有效手段来提高设备事故处理效率等问题,采用双向长短时记忆网络和条件随机场的方式进行实体识别,并基于实体识别的结果制定专业词库(包括煤矿机电设备、事故和措施等专业名词),编制规则模板实现简单句式的关系抽取,对涉及上下文语义分析且跨句子或跨段落的复杂关系进行人工处理完成关系抽取,构建了煤矿机电设备事故知识图谱;韩一博等[35]构建综采设备本体模型,确定概念及关系,基于联合编码的方式进行实体识别,使用图数据库进行知识存储,完成煤矿综采设备知识图谱的构建。冯银辉等[36]将综采设备的故障、维修、调度和检修记录等信息关联,利用 BiLSTM−CRF 模型进行实体识别,基于带有位置标记的卷积神经网络(Piecewise Convolutional Neural Network,PCNN) 按前述预定义关系模式进行实体关系抽取,构建了采煤机、液压支架、刮板输送机和泵站的知识图谱模型及知识库管理系统,并开发智能问答系统,设计了知识推理算法,利用AIML实现交互式检索问答,从而提供智能化决策支持。
煤矿领域知识图谱构建和推理相关的研究仍处于初级阶段,距离成熟的工业化应用仍然存在较大差距。要构建完善的煤矿领域知识图谱和实现支持复杂场景智能化决策的知识图谱推理技术,仍需克服诸多挑战,包括数据源的多样性和异构性、复杂知识关系的表达与推理等。
2. 主要研究挑战
本文从煤矿领域知识图谱构建的基础技术、完善技术及知识图谱推理技术3个方面分别论述各自面临的挑战。实体识别和关系抽取是构建煤矿领域知识图谱的基础技术,通过识别文本中的实体及实体对间存在的关系来构建知识图谱,在这一阶段可能会出现关系不完整或错误。因此,需要通过知识图谱融合和知识图谱纠错来完善初步构建的知识图谱。完成知识图谱构建后,借助知识图谱推理技术服务于各类智能化应用。知识图谱构建与推理相关技术之间的关系如图3所示。
2.1 知识图谱构建基础技术面临的挑战
2.1.1 实体识别
在实体识别中,实体嵌套是指在文本中,多个实体以部分包含(嵌套)的方式出现,其中一个实体完全或部分地包含在另一个实体中。煤矿领域文本存在大量的嵌套实体,如:实体“坚硬顶板水力压裂技术”嵌套了另一个实体“坚硬顶板”;实体“薄煤层工作面支架工作阻力”嵌套了实体“薄煤层工作面”,而“薄煤层工作面”又二次嵌套了实体“薄煤层”。
传统基于序列标注的实体识别方法将实体识别问题转换为字的分类问题[37],只对一个字标记一个标签(某实体类型的开始字、某实体类型的内部字或非实体字),无法解决嵌套实体识别的问题。由于嵌套实体存在单个字可同时属于多个实体的情况,在标注时会出现一字多标签的现象,使得该任务面临相当大的挑战。
2.1.2 关系抽取
关系抽取是一种典型的信息抽取任务,主要是从非结构化文本中抽取出实体对的关系并确定实体对关系的类型[38-39]。在该任务中,2个存在着关系的实体被称为头实体和尾实体,实体对关系用三元组表达,即<头实体,关系类型,尾实体>。例如,在文本“顶板预裂爆破技术已被证明是防治坚硬顶板冲击矿压灾害的有效手段之一”中,需要抽取的三元组是<预裂爆破技术,预防,坚硬顶板冲击矿压>。其中,头实体 “预裂爆破技术”与尾实体 “坚硬顶板冲击矿压”存在 “预防”关系。
关系抽取任务中的实体重叠问题是指一个实体与其他多个实体之间存在1个或多个关系或2个实体之间存在多个关系。煤矿领域知识图谱构建的关系抽取任务中,文本存在不同关系之间实体重叠的情况较多。在上述示例文本中,头实体 “预裂爆破技术”与尾实体 “坚硬顶板冲击矿压”存在 “预防”关系,头实体 “预裂爆破技术”与尾实体“坚硬顶板”存在“适用”关系,其中“预裂爆破技术”是重叠实体。在文本“煤体变形响应除受地应力影响外,同时还受到煤体温度和瓦斯解吸耦合作用影响”中,“煤体变形响应”既与“地应力”存在“引发”关系,也与“煤体温度”“瓦斯解吸耦合作用”存在“引发”关系,其中“煤体变形响应”是重叠实体。
基于实体对分类器的关系抽取方法[40]将关系抽取问题转换为字的分类问题,只对每个字标记1个标签(某关系类型的头实体开始位置、某关系类型的尾实体开始位置、某关系类型的头实体结束位置、某关系类型的尾实体结束位置、其他位置),这种方法导致每个实体只能参与1个三元组,难以处理关系抽取中的实体重叠问题。当关系之间存在实体重叠时,重叠的实体需要参与多个三元组,字的标签不唯一,这给关系抽取带来了很大的挑战。
2.2 知识图谱构建完善技术面临的挑战
2.2.1 知识图谱融合
知识图谱融合是指将来自不同数据源或不同知识图谱的信息进行整合和合并的过程,旨在形成一个更大、更全面的知识图谱。在煤矿领域,由于一个实体可能在不同数据源或不同的知识图谱中具有不同的表示方式,知识图谱的融合可以将来自不同数据源的知识信息整合到一个统一的框架中,解决数据来源多样性带来的问题。
当前大多数知识图谱的构建是基于不同数据源进行的。为获取完整性和准确性更高的知识,知识图谱融合是一项必不可少的工作,能够实现知识的相互补充和纠错。知识图谱融合的关键问题是实体对齐,即辨识来自不同知识图谱的相同实体。基于实体对齐的结果可以对多个知识图谱的相同实体对之间的关系进行合并和纠错。
当前实体对齐的主要思路是基于图嵌入独立完成各个知识图谱实体的向量化表示,然后以人工标注的对齐实体数据为训练集,通过学习获得不同知识图谱向量表示空间的变换关系模型,基于该模型实现未标注实体之间的对齐。目前实体对齐依赖的重要依据是知识图谱的结构信息。不同知识图谱构建时数据源不同,异构程度较高,如果仅利用结构信息进行实体对齐,则准确率较低。因此,基于知识图谱结构的实体嵌入表示方法无法适用,适于异构知识图谱融合的实体对齐方法依然是一个重要的研究挑战。
2.2.2 知识图谱纠错
知识图谱纠错是对知识图谱中存在的错误、不一致或不完整性进行识别和修正的过程。知识图谱纠错的任务主要包括错误识别和错误修正。错误识别是指识别知识图谱中存在的错误、不一致性或不准确的信息,如错误的实体类型、错误的关系等;错误修正是指对识别和定位的错误进行修正,通过替换或删除实体或关系来纠正知识图谱中的错误。
知识图谱涉及多种类型的实体和关系,实体间关系的一致性约束建模是知识图谱纠错的关键,有效建模实体间关系的一致性约束对提升知识图谱的纠错能力至关重要。通过判断实体之间的关系是否与一致性约束相冲突,可以对错误进行识别,如关系类型具有排他性时,如果发现某实体与多个实体之间存在该类型的关系,则认为其中存在错误关系。实体间关系的一致性约束建模需要考虑领域内不同关系类型的性质,确保能够描述各种可能的一致性约束,这一过程相对复杂且困难。因此,如何评价实体间关系的一致性约束建模的完备性成为知识图谱纠错的一大挑战。
2.3 知识图谱推理面临的挑战
知识图谱推理是一种利用已有知识图谱中的信息,通过逻辑推理或语义分析来发现新的知识的技术[41]。通过这种推理方法,能够更深入地理解和利用大量的结构化知识,从而支持更智能、更高效的应用程序和服务。在煤矿领域,若已知事实“矿工小明被砸落的岩石击中头部受伤”,且知识图谱中存在<矿工,使用,安全帽>的关系,可以推断出小明受伤可能因为他没有戴安全帽。这种推理过程有助于从已知信息中推导出新的结论,并在煤矿安全管理等方面提供更为精准和有力的支持。
目前主流的知识图谱推理方法包括基于图神经网络的方法和基于强化学习的方法。基于图神经网络的方法通过对知识图谱中实体进行嵌入表示和消息传递,捕捉复杂的高阶关系,实现知识图谱的推理。基于强化学习的方法通常定义推理过程中的状态、动作和奖励函数,通过不断试探和学习,逐步优化推理策略,找到最优推理路径,实现知识图谱的自动推理。
基于图神经网络的方法进行知识图谱推理的主要挑战是实体嵌入表示的误差传播。知识图谱中的多跳路径由各种不同类型的实体和关系组成,这些路径中可能包含无关或不重要的实体和关系,不相关的路径会引入噪声,图神经网络在经过多个图卷积层增强图特征提取充分性的同时,会造成实体嵌入表示误差的传播。解决这一问题的关键在于从所有可能的路径中识别并利用有用的信息,同时过滤噪声信息。因此,如何进行知识图谱实体的嵌入表示,完成特征提取,成为图神经网络方法进行知识图谱推理的一大挑战。
基于强化学习的方法通过多跳推理来进行知识图谱推理,同时考虑多个路径上的信息,涉及到跨越多个关系进行推理,能够提供更全面、更可靠的推理结果。然而,在选择知识图谱推理路径时,需要同时考虑知识图谱的复杂结构、信息的不完整性、语义歧义及计算复杂度等因素,并在搜索空间的指数级增长中用尽可能短的时间找到最相关和最有效的路径。因此,基于强化学习的方法进行知识图谱推理时,如何选择路径是一大挑战。
知识图谱构建和推理技术面临的主要挑战总结见表2。对煤矿领域而言,嵌套实体和实体重叠关系广泛存在,亟须实体识别和关系抽取技术的突破;存在异构知识图谱实体对齐的现实需求,知识图谱融合技术有待进一步发展;实体间关系的一致性约束尚不明确,知识图谱纠错困难;知识图谱推理技术须在应用中逐步发展。
表 2 知识图谱构建与推理技术面临的主要挑战Table 2. Main challenges in knowledge graph construction and reasoning techniques技术名称 所属类别 主要挑战 技术难点描述 实体识别 知识图谱构建基础技术 嵌套实体的识别 单个字可同时属于多个实体,基于字分类器的实体识别方法无法适用 关系抽取 知识图谱构建基础技术 实体重叠条件下的关系抽取 单个实体可同时属于多个三元组,基于实体对分类器的关系抽取方法无法适用 知识图谱融合 知识图谱构建完善技术 异构知识图谱间的实体对齐 基于知识图谱结构的实体嵌入表示方法无法适用 知识图谱纠错 知识图谱构建完善技术 实体间关系的一致性约束建模 一致性约束建模的完备性评价 基于图神经网络的
知识图谱推理知识图谱推理技术 实体的嵌入表示 多个图卷积层在增强图特征提取充分性的同时,会造成实体嵌入表示误差的传播 基于强化学习的
知识图谱推理知识图谱推理技术 多跳推理下的路径选择 指数级增长的搜索空间带来的计算复杂性 3. 展望
3.1 技术趋势
为解决煤矿领域知识图谱构建中嵌套实体识别问题,需研究基于跨度的识别方法。将嵌套实体识别问题转换为子串(称为跨度)的分类问题。通过研究跨度的表示方法,充分提取跨度的语义特征,以实现跨度的准确分类。嵌套实体中包含的多个实体各自对应不同的跨度,通过跨度分类可实现对嵌套结构中多个实体的识别。
为解决煤矿领域知识图谱构建中关系抽取的实体重叠问题,需研究基于多堆叠分类器的关系抽取方法。每个分类器关联一种关系类型,用于判断句子中是否存在与输入头实体存在对应类型关系的尾实体。通过多个分类器的堆叠可有效解决多个关系中实体重叠的问题。
为解决煤矿领域知识图谱融合中的实体对齐问题,需研究实体的嵌入表示方法。除考虑拓扑结构信息外,还需融入实体和关系的语义信息。
为解决煤矿领域知识图谱中的知识图谱纠错问题,需研究实体间关系的一致性约束建模方法。基于该方法检测知识图谱中存在的关系冲突,以发现错误。
煤矿领域知识图谱推理技术的研究需以应用为驱动,与业务场景密切结合。以具体业务场景为切入点,通过以点带面的研究,获取煤矿领域知识图谱推理技术的最佳实践路径。
3.2 潜在应用场景
煤矿领域知识图谱潜在应用场景包括综采设备故障智能诊断、安全风险实时预警与处置、灾害事故原因分析、应急救援方案生成、生产组织和运营决策支持。在构建煤矿领域知识图谱时,首先,收集与应用场景相关的数据,如煤矿领域学术论文和技术报告、煤矿地质勘探资料、煤矿事故案例分析报告、煤矿设备操作手册和维修记录等;其次,明确定义场景相关的实体类型及实体之间的关系类型;然后,利用自然语言处理和文本挖掘技术,对收集到的文本数据进行处理和分析,抽取出关键信息和知识;最后,将抽取出的知识以知识图谱的形式进行表示。
3.2.1 基于知识图谱的综采设备故障智能诊断
煤矿综采设备长期运行在潮湿、煤尘的环境下,同时承受巨大冲击和异常振动,故障频繁发生。为减少设备故障对生产造成的不利影响,一方面需监测设备的运行状态,判断整体或局部是否存在异常,以尽早发现故障;另一方面需在故障发生后,准确定位故障原因以尽快排除。现有的故障诊断方法过分依赖专家个人经验,效率低下,且对历史故障数据缺乏系统化管理,经验和知识难以共享。
通过构建煤矿综采设备故障知识图谱可有效克服现有故障诊断方法的缺陷。煤矿综采设备故障知识图谱可描述综采设备、故障类型、故障原因及维修建议之间的关系。基于该知识图谱及其推理技术,可以实现煤矿综采设备故障智能诊断,提高故障原因定位的准确性和故障排除的效率,并且能够基于历史故障数据预测未来可能发生的故障,达到预知性维护的效果。
3.2.2 基于知识图谱的安全风险实时预警与处置
煤矿作业中存在的风险因素如瓦斯突出、煤尘爆炸、顶板塌陷、水害、火灾等,严重威胁矿工的生命安全和矿井的安全运行。因此,实时监测这些风险并及时预警,对于确保煤矿安全生产至关重要。
通过压力传感器、气体检测仪、烟雾探测器、流量计等设备对液压系统、瓦斯浓度、烟雾浓度、涌水量等进行实时监测。然而,仅依赖实时数据监测并不能产生预警和形成有效处置方案,需根据知识图谱中实体之间的关系作进一步推断。当发现实时数据出现异常时,可将其异常表现与知识图谱中对应的实体和关系进行匹配。借助动态分析和推理,明确潜在风险类型,追溯可能原因并生成处置方案。
3.2.3 基于知识图谱的灾害事故原因分析
随着煤炭开采量的增加,煤矿灾害事故的发生率也相应增长。这些灾害事故包括冒顶、瓦斯爆炸、水灾、煤尘爆炸、火灾等多种类型[42]。在灾害发生时,迅速分析出事故原因并提供有效处理措施非常重要,但却极具挑战性。这是因为煤矿灾害事故原因复杂,往往是人员、设备、管理、环境等多种因素综合作用的结果。构建煤矿灾害事故知识图谱能够系统整理和关联上述因素,有助于更全面地理解事故的形成原因。
基于煤矿灾害事故知识图谱可以对事故原因进行深入分析,帮助制定更加科学的政策、法规和监管措施,以及采取更加有效的预防和控制措施,以减少煤矿灾害的发生和降低煤矿灾害的影响。
3.2.4 基于知识图谱的应急救援方案生成
在煤矿灾害事故发生时,迅速生成有效的应急救援方案对指导现场应急救援工作至关重要。目前,煤矿企业中的灾害事故应急预案主要以纸质版或电子文档的形式保存。这种方式比较落后,无法及时更新且不能反映事故发生前后的实时信息,难以高效整合各种救援知识与方案,从而降低了救援的水平[43]。
为高效整合救援知识,以生成更加科学的煤矿应急救援方案,构建煤矿应急救援知识图谱。该知识图谱能够实时更新,提供准确、全面的应急救援信息。基于知识图谱推理技术可以生成恰当的煤矿应急救援方案,帮助指挥人员和救援人员采取正确的行动,提高应急救援工作的效率和水平。
3.2.5 基于知识图谱的生产组织和运营决策支持
在煤矿企业中,涉及生产计划、资源调度、安全管理和成本控制等方面的决策需要考虑大量的数据和信息。基于知识图谱的决策支持系统在煤矿生产组织和运营决策中成为了一个新兴技术方向。
基于上述知识图谱及其推理技术,可以根据煤矿地质特征、矿井结构和采矿工艺等知识,预测矿井产量、能耗和安全风险,从而帮助煤矿管理层做出生产规划、设备配置、安全管理等方面的合理决策。
3.2.6 典型应用场景示例分析
以煤矿综采设备故障智能诊断场景为例,说明知识图谱及推理方法的应用。
“液压支架压力过低”“液压油泄漏”“液压泵异常”“液压油温度升高”和“噪声过大”均是包含在煤矿综采设备故障知识图谱中的实体,其中“液压支架压力过低”对应的实体类型是故障种类,“液压油泄漏”和“液压泵异常”对应的实体类型是故障原因,“液压油温度升高”和“噪声过大”对应的实体类型是故障现象。<“液压油泄漏”,“导致”,“液压支架压力过低”> <“液压泵异常”,“导致”,“液压支架压力过低”> <“液压油泄漏”, “表现为”,“液压油温度升高”> <“液压泵异常”, “表现为”,“噪声过大”>均为知识图谱中存在的关系三元组。如果通过实时获取的压力传感器监测数据发现系统出现了“液压支架压力过低”这一类型的故障,结合知识图谱中的三元组<“液压油泄漏”,“导致”,“液压支架压力过低”>和<“液压泵异常”,“导致”,“液压支架压力过低”>,可以推理出可能的故障原因是“液压油泄漏”或“液压泵异常”。进一步分析温度传感器和声音传感器的实时监测数据,如果出现“液压油温度升高”而没有出现“噪声过大”的现象,结合知识图谱中的三元组<“液压油泄漏”, “表现为”,“液压油温度升高”>和<“液压泵异常”, “表现为”,“噪声过大”>,可以更准确地推断出系统出现“液压支架压力过低”这一类型故障的原因是“液压油泄漏”而不是“液压泵异常”。
4. 结语
梳理了知识图谱尤其是煤矿领域知识图谱的研究现状,分析了煤矿领域知识图谱构建与推理技术面临的挑战,对煤矿领域知识图谱构建与推理的技术趋势进行展望,并列举了煤矿领域知识图谱在设备故障诊断、应急救援方案生成、灾害事故原因分析及生产组织和运营决策支持等方面的应用。煤矿领域存在大量图像、视频等多模态数据,未来可以构建煤矿领域多模态知识图谱,还可以融入时间信息构建煤矿领域时序知识图谱,以进一步完善煤矿领域知识图谱的内容并提升应用效果。
-
表 1 煤矿领域知识图谱代表性工作技术成熟度情况
Table 1 Technological maturity of representative work of knowledge graph in coal mining domain
应用场景 代表性工作 知识建模情况 知识图谱构建方式 知识图谱使用方式 成熟度评价 煤矿灾害
防治许娜等[29] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 罗香玉等[30] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 刘鹏等[31] 仅对相关概念进行分类,没有定义关系类型 自动构建 仅以查询方式使用知识图谱 ★★☆☆☆ 刘永立等[32] 概念类别和关系类型均未明确定义 人工构建 仅探讨知识图谱推理的潜在应用,未实现推理 ★☆☆☆☆ 吴克介[33] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 煤矿机电
设备维护李哲等[34] 依据专家经验确定概念类别和关系类型 人工和自动构建
相结合仅探讨知识图谱推理的潜在应用,未实现 ★★★☆☆ 韩一博等[35] 依据专家经验确定概念类别和关系类型 自动构建 未提及 ★★☆☆☆ 冯银辉等[36] 依据专家经验确定概念类别和关系类型 自动构建 仅以查询方式使用知识图谱 ★★★☆☆ 表 2 知识图谱构建与推理技术面临的主要挑战
Table 2 Main challenges in knowledge graph construction and reasoning techniques
技术名称 所属类别 主要挑战 技术难点描述 实体识别 知识图谱构建基础技术 嵌套实体的识别 单个字可同时属于多个实体,基于字分类器的实体识别方法无法适用 关系抽取 知识图谱构建基础技术 实体重叠条件下的关系抽取 单个实体可同时属于多个三元组,基于实体对分类器的关系抽取方法无法适用 知识图谱融合 知识图谱构建完善技术 异构知识图谱间的实体对齐 基于知识图谱结构的实体嵌入表示方法无法适用 知识图谱纠错 知识图谱构建完善技术 实体间关系的一致性约束建模 一致性约束建模的完备性评价 基于图神经网络的
知识图谱推理知识图谱推理技术 实体的嵌入表示 多个图卷积层在增强图特征提取充分性的同时,会造成实体嵌入表示误差的传播 基于强化学习的
知识图谱推理知识图谱推理技术 多跳推理下的路径选择 指数级增长的搜索空间带来的计算复杂性 -
[1] 王国法,庞义辉,任怀伟,等. 智慧矿山系统工程及关键技术研究与实践[J]. 煤炭学报,2024,49(1):181-202. WANG Guofa,PANG Yihui,REN Huaiwei,et al. System engineering and key technologies research and practice of smart mine[J]. Journal of China Coal Society,2024,49(1):181-202.
[2] 张志刚,张庆华,刘军. 我国煤与瓦斯突出及复合动力灾害预警系统研究进展及展望[J/OL]. 煤炭学报:1-13[2024-05-31]. https://doi.org/10.13225/j.cnki.jccs.2023.1079. ZHANG Zhigang,ZHANG Qinghua,LIU Jun. Research progress and prospects of coal and gas outburst and composite dynamic disaster warning systems in China[J/OL]. Journal of China Coal Society:1-13[2024-05-31]. https://doi.org/10.13225/j.cnki.jccs.2023.1079.
[3] 王国法,刘峰,庞义辉,等. 煤矿智能化——煤炭工业高质量发展的核心技术支撑[J]. 煤炭学报,2019,44(2):349-357. WANG Guofa,LIU Feng,PANG Yihui,et al. Coal mine intellectualization:the core technology of high quality development[J]. Journal of China Coal Society,2019,44(2):349-357.
[4] 王海军,曹云,王洪磊. 煤矿智能化关键技术研究与实践[J]. 煤田地质与勘探,2023,51(1):44-54. DOI: 10.12363/issn.1001-1986.22.12.0992 WANG Haijun,CAO Yun,WANG Honglei. Research and practice on key technologies for intelligentization of coal mine[J]. Coal Geology & Exploration,2023,51(1):44-54. DOI: 10.12363/issn.1001-1986.22.12.0992
[5] 王海军,王洪磊. 带式输送机智能化关键技术现状与展望[J]. 煤炭科学技术,2022,50(12):225-239. WANG Haijun,WANG Honglei. Status and prospect of intelligent key technologies of belt conveyor[J]. Coal Science and Technology,2022,50(12):225-239.
[6] 毛君,杨润坤,谢苗,等. 煤矿智能快速掘进关键技术研究现状及展望[J]. 煤炭学报,2024,49(2):1214-1229. MAO Jun,YANG Runkun,XIE Miao,et al. Research status and prospects of key technologies for intelligent rapid excavation in coal mines[J]. Journal of China Coal Society,2024,49(2):1214-1229.
[7] 高晓亮. 煤矿井下智能化钻探配套钻具研究进展[J]. 煤田地质与勘探,2023,51(10):156-166. DOI: 10.12363/issn.1001-1986.23.04.0214 GAO Xiaoliang. Status and development of intelligent drilling tools for coal mine[J]. Coal Geology & Exploration,2023,51(10):156-166. DOI: 10.12363/issn.1001-1986.23.04.0214
[8] 魏文艳. 综采工作面智能化开采技术发展现状及展望[J]. 煤炭科学技术,2022,50(增刊2):244-253. WEI Wenyan. Development status and prospect of intelligent mining technology of longwall mining[J]. Coal Science and Technology,2022,50(S2):244-253.
[9] 卢振龙,徐刚,尹希文,等. 煤矿智能化顶板矿压预警技术研究[J]. 煤炭工程,2023,55(12):22-27. LU Zhenlong,XU Gang,YIN Xiwen,et al. Early warning technology of coal mine roof pressure based on machine learning[J]. Coal Engineering,2023,55(12):22-27.
[10] 袁亮,吴劲松,杨科. 煤炭安全智能精准开采关键技术与应用[J]. 采矿与安全工程学报,2023,40(5):861-868. YUAN Liang,WU Jingsong,YANG Ke. Key technology and its application of coal safety intelligent precision mining[J]. Journal of Mining & Safety Engineering,2023,40(5):861-868.
[11] 高洪波. 基于应急预案的煤矿应急救援辅助决策系统设计[J]. 工矿自动化,2024,50(2):147-152,160. GAO Hongbo. Design of coal mine emergency rescue auxiliary decision system based on emergency plan[J]. Journal of Mine Automation,2024,50(2):147-152,160.
[12] 刘峰,郭林峰,张建明,等. 煤炭工业数字智能绿色三化协同模式与新质生产力建设路径[J]. 煤炭学报,2024,49(1):1-15. LIU Feng,GUO Linfeng,ZHANG Jianming,et al. Synergistic mode of digitalization-intelligentization-greeniation of the coal industry and it's path of building new coal productivity[J]. Journal of China Coal Society,2024,49(1):1-15.
[13] 王文广. 知识图谱:认知智能理论与实战[M]. 北京:电子工业出版社,2022. WANG Wenguang. Knowledge map : cognitive intelligence theory and practice[M]. Beijing:Publishing House of Electronics Industry,2022.
[14] 张吉祥,张祥森,武长旭,等. 知识图谱构建技术综述[J]. 计算机工程,2022,48(3):23-37. ZHANG Jixiang,ZHANG Xiangsen,WU Changxu,et al. Survey of knowledge graph construction techniques[J]. Computer Engineering,2022,48(3):23-37.
[15] XU Bo,XU Yong,LIANG Jiaqing,et al. CN-DBpedia:a never-ending Chinese knowledge extraction system[C]. International Conference on Industrial,Engineering and Other Applications of Applied Intelligent Systems,Arras,2017:428-438.
[16] NIU Xing,SUN Xinruo,WANG Haofen,et al. Zhishi. me- weaving Chinese linking open data[M]. Heidelberg:Springer,2011.
[17] VRANDEČIĆ D,KRÖTZSCH M. Wikidata[J]. Communications of the ACM,2014,57(10):78-85. DOI: 10.1145/2629489
[18] BOLLACKER K,COOK R,TUFTS P. Freebase:a shared database of structured general human knowledge[C]. AAAI Conference on Artificial Intelligence,Palo Alto,2007:1962-1963.
[19] NICKEL M,TRESP V,KRIEGEL H P. Factorizing YAGO:scalable machine learning for linked data[C]. 21st International Conference on World Wide Web,Lyon ,2012:271-280.
[20] SHANG Yong,TIAN Yu,ZHOU Min,et al. EHR-oriented knowledge graph system:toward efficient utilization of non-used information buried in routine clinical practice[J]. IEEE Journal of Biomedical and Health Informatics,2021,25(7):2463-2475.
[21] 唐晓波,谭明亮,胡潇然,等. 面向金融决策支持的知识获取研究综述[J]. 信息资源管理学报,2020,10(3):27-35. TANG Xiaobo,TAN Mingliang,HU Xiaoran,et al. A review of financial decision-making support-oriented knowledge acquisition[J]. Journal of Information Resources Management,2020,10(3):27-35.
[22] 郑庆华,董博,钱步月,等. 智慧教育研究现状与发展趋势[J]. 计算机研究与发展,2019,56(1):209-224. DOI: 10.7544/issn1000-1239.2019.20180758 ZHENG Qinghua,DONG Bo,QIAN Buyue,et al. The state of the art and future tendency of smart education[J]. Journal of Computer Research and Development,2019,56(1):209-224. DOI: 10.7544/issn1000-1239.2019.20180758
[23] 阮彤,孙程琳,王昊奋,等. 中医药知识图谱构建与应用[J]. 医学信息学杂志,2016,37(4):8-13. DOI: 10.3969/j.issn.1673-6036.2016.04.002 RUAN Tong,SUN Chenglin,WANG Haofen,et al. Construction of traditional Chinese medicine knowledge graph and its application[J]. Journal of Medical Informatics,2016,37(4):8-13. DOI: 10.3969/j.issn.1673-6036.2016.04.002
[24] 陆锋,余丽,仇培元. 论地理知识图谱[J]. 地球信息科学学报,2017,19(6):723-734. DOI: 10.3969/j.issn.1560-8999.2017.06.001 LU Feng,YU Li,QIU Peiyuan. On geographic knowledge graph[J]. Journal of Geo-Information Science,2017,19(6):723-734. DOI: 10.3969/j.issn.1560-8999.2017.06.001
[25] 陈德华,殷苏娜,乐嘉锦,等. 一种面向临床领域时序知识图谱的链接预测模型[J]. 计算机研究与发展,2017,54(12):2687-2697. DOI: 10.7544/issn1000-1239.2017.20170640 CHEN Dehua,YIN Suna,LE Jiajin,et al. A link prediction model for clinical temporal knowledge graph[J]. Journal of Computer Research and Development,2017,54(12):2687-2697. DOI: 10.7544/issn1000-1239.2017.20170640
[26] DENG Cheng,JIA Yuting,XU Hui,et al. GAKG:a multimodal geoscience academic knowledge graph[C]. 30th ACM International Conference on Information & Knowledge Management,Queensland,2021:4445-4454.
[27] ZHU Anjie,OUYANG Deqiang,LIANG Shuang,et al. Step by step:a hierarchical framework for multi-hop knowledge graph reasoning with reinforcement learning[J]. Knowledge-Based Systems,2022,248. DOI: 10.1016/J.KNOSYS.2022.108843.
[28] ZHENG Shangfei,WANG Weiqing,QU Jianfeng,et al. MMKGR:multi-hop multi-modal knowledge graph reasoning[C]. IEEE 39th International Conference on Data Engineering,Anaheim,2023:96-109.
[29] 许娜,梁燕翔,王亮,等. 基于知识图谱的煤矿建设安全领域知识管理研究[J]. 中国安全科学学报,2024,34(5):28-35. XU Na,LIANG Yanxiang,WANG Liang,et al. Research on knowledge management in coal mine construction safety field based on knowledge graph[J]. China Safety Science Journal,2024,34(5):28-35.
[30] 罗香玉,杜浩,华颖,等. 一种煤矿顶板灾害防治知识图谱构建方法[J]. 工矿自动化,2024,50(6):54-60. LUO Xiangyu,DU Hao,HUA Ying,et al. A method for constructing a knowledge graph of coal mine roof disaster prevention and control[J]. Journal of Mine Automation,2024,50(6):54-60.
[31] 刘鹏,叶帅,舒雅,等. 煤矿安全知识图谱构建及智能查询方法研究[J]. 中文信息学报,2020,34(11):49-59. DOI: 10.3969/j.issn.1003-0077.2020.11.007 LIU Peng,YE Shuai,SHU Ya,et al. Coalmine safety:knowledge graph construction and its QA approach[J]. Journal of Chinese Information Processing,2020,34(11):49-59. DOI: 10.3969/j.issn.1003-0077.2020.11.007
[32] 刘永立,王海涛. 基于知识图谱的火灾及耦合灾害应急处置管理[J]. 煤矿安全,2022,53(9):144-150. LIU Yongli,WANG Haitao. Fire and coupling disaster emergency management based on mapping knowledge domain[J]. Safety in Coal Mines,2022,53(9):144-150.
[33] 吴克介. 煤矿安全监控系统领域知识图谱构建及应用研究[J]. 煤炭技术,2024,43(4):238-242. WU Kejie. Research on construction and application of domain knowledge map of coal mine safety monitoring system[J]. Coal Technology,2024,43(4):238-242.
[34] 李哲,周斌,李文慧,等. 煤矿机电设备事故知识图谱构建及应用[J]. 工矿自动化,2022,48(1):109-112. LI Zhe,ZHOU Bin,LI Wenhui,et al. Construction and application of mine electromechanical equipment accident knowledge graph[J]. Industry and Mine Automation,2022,48(1):109-112.
[35] 韩一搏,董立红,叶鸥. 基于联合编码的煤矿综采设备知识图谱构建[J]. 工矿自动化,2024,50(4):84-93. HAN Yibo,DONG Lihong,YE Ou. Construction of knowledge graph for fully mechanized coal mining equipment based on joint coding[J]. Journal of Mine Automation,2024,50(4):84-93.
[36] 冯银辉,秦泽宇. 基于综采集控平台的智能辅助决策系统研究[J]. 煤炭技术,2023,42(1):241-245. FENG Yinhui,QIN Zeyu. Research on intelligent auxiliary decision system based on fully mechanized mining control platform[J]. Coal Technology,2023,42(1):241-245.
[37] YANG Dongying,LIAN Tao,ZHENG Wen,et al. Enriching word information representation for Chinese cybersecurity named entity recognition[J]. Neural Processing Letters,2023,55(6):7689-7707. DOI: 10.1007/s11063-023-11280-7
[38] 宁尚明,滕飞,李天瑞. 基于多通道自注意力机制的电子病历实体关系抽取[J]. 计算机学报,2020,43(5):916-929. DOI: 10.11897/SP.J.1016.2020.00916 NING Shangming,TENG Fei,LI Tianrui. Multi-channel self-attention mechanism for relation extraction in clinical records[J]. Chinese Journal of Computers,2020,43(5):916-929. DOI: 10.11897/SP.J.1016.2020.00916
[39] 鄂海红,张文静,肖思琪,等. 深度学习实体关系抽取研究综述[J]. 软件学报,2019,30(6):1793-1818. E Haihong,ZHANG Wenjing,XIAO Siqi,et al. Survey of entity relationship extraction based on deep learning[J]. Journal of Software,2019,30(6):1793-1818.
[40] ZHENG Suncong,WANG Feng,BAO Hongyun,et al. Joint extraction of entities and relations based on a novel tagging scheme[C]. 55th Annual Meeting of the Association for Computational Linguistics,Vancouver,2017:1227-1236.
[41] 官赛萍,靳小龙,贾岩涛,等. 面向知识图谱的知识推理研究进展[J]. 软件学报,2018,29(10):2966-2994. GUAN Saiping,JIN Xiaolong,JIA Yantao,et al. Knowledge reasoning over knowledge graph:a survey[J]. Journal of Software,2018,29(10):2966-2994.
[42] 丁百川. 我国煤矿主要灾害事故特点及防治对策[J]. 煤炭科学技术,2017,45(5):109-114. DING Baichuan. Features and prevention countermeasures of major disasters occurred in China coal mine[J]. Coal Science and Technology,2017,45(5):109-114.
[43] 杨梦,周恩波. 煤矿智能应急预案生成系统设计与关键技术[J]. 煤矿安全,2018,49(7):96-98. YANG Meng,ZHOU Enbo. Design and key technologies for coal mine intelligent emergency plan generation system[J]. Safety in Coal Mines,2018,49(7):96-98.