刘婷1, 潘理虎1,2, 张素兰1, 陈立潮1, 张英俊1
(1.太原科技大学 计算机科学与技术学院, 山西 太原 030024;2.中国科学院 地理科学与资源研究所, 北京 100101)
摘要:针对传统本体构建方法耗时耗力且主观依赖性强的问题,提出了一种基于形式概念分析的采煤工作面本体构建方法。该方法可有效地发现领域数据中隐含的概念和概念间的关系,并通过概念格将本体可视化,将新增信息自动地添加到本体中,实现了本体的半自动化更新。实例验证了该方法的有效性。
关键词:煤炭开采; 采煤工作面; 本体构建; 本体更新; 半自动化; 形式概念分析; 概念格
采煤工作面是矿井事故的多发地点[1],通过本体[2-3]建模能全面地监控采煤工作面的整个生产过程,实时地监控设备的状态、人员的行为,在出现危险事故时及时通知作业人员,从而降低事故发生率。目前本体已在知识工程、信息检索等方面有了较多应用,但在煤矿领域的应用较少,相关研究主要有:郭华[4]进行了瓦斯监控系统的本体模型研究,为解决海量数据的集成与共享问题提出了一种有效的方法;药慧婷[5]构建了掘进工作面本体模型,为智能决策系统的实现提供了支持和保障;孟现飞[6]构建了基于本体的煤矿事故预警知识库,为煤矿事故预警提供了保障。
传统的手工构建本体的方法费时费力且对领域专家的依赖性强,形式概念分析(Formal Concept Analysis,FCA)[7]能帮助研究人员有效地挖掘出隐含的概念和概念间的关系,形成概念间的层次结构,目前已经在数据挖掘、信息获取、机器学习等领域有了广泛应用。本文针对采煤工作面的环境条件、各类事故的发生情况及作业人员的安全操作,提出了一种基于FCA的采煤工作面本体半自动化构建方法(Coal Face Ontology Construction based on FCA,CFOCFCA),最后通过实例证明了该方法的有效性。
FCA建立在数学基础上,是一种从形式背景上进行数据分析和规则提取的工具,将本体的概念、属性、关系等以形式化的方式表达出来,然后构造出概念格,概念格能够清楚地表达本体的层次结构[8]。下面是以采煤工作面为背景的FCA的几个相关定义。
定义1: 采煤工作面的形式背景(Formal Context)可以看成一个三元组K=(A,B,R),A和B分别代表对象与属性的集合,R表示二者之间的二元关系。若对象a与属性b在关系R中,可表示为aRb或者(a,b)∈R。
定义2:X为对象集合A的子集,f(X)表示X中所有对象的共同属性的集合,f(X)={b∈B|∀a∈X,aRb}。Y为属性集合B的子集,g(Y)表示具有Y中属性的所有对象的集合,g(Y)={a∈A|∀b∈Y,aRb}。
定义3: 形式背景(A,B,R)中的形式概念(Formal Concept)是一个二元组(X,Y),其中X⊆A,Y⊆B,如果f(X)=Y,g(Y)=X,则X称为形式概念(X,Y)的外延(Extent),Y称为形式概念(X,Y)的内涵(Intent)。
定义4: (X1,Y1)与(X2,Y2)是2个形式概念,若X1⊆X2(相当于Y2⊆Y1),则称(X2,Y2)是(X1,Y1)的父概念(Superconcept), (X1,Y1)是(X2,Y2)的子概念(Subconcept),记作(X1,Y1)≤(X2,Y2)。按此方式组成的概念集合称为形式背景(A,B,R)的概念格(Concept Lattice)。
2.1 本体构建流程
CFOCFCA基本原理:首先构建一个能代表采煤工作面知识的初始本体,然后采用形式概念分析法来实现本体的更新,通过概念格将本体可视化,从而发现本体中潜在的对象和属性,将其加入到本体中使本体完善。CFOCFCA结构如图1所示。本体建模主要分为两部分:初始本体模型的构建和本体更新。
图1 CFOCFCA结构
2.2 初始本体模型的构建
初始本体作为本体更新的基础,应该包含采煤工作面的大多数概念、属性及其联系。构建本体模型最重要的是依据现有采煤工作面的安全规程等相关信息,抽象本体模型中的类、属性、实例等。本文结合七步法与骨架法建立采煤工作面初始本体模型。建模的具体步骤:明确该本体的应用领域为采煤工作面;从文献中找到与该领域相关的全部术语;描述类及类的层次结构;定义类的属性;定义属性间的约束;创建对象;进行本体评价。
2.3 本体更新
构建的初始本体是静态本体,为了满足用户的需求,需要对本体进行更新。形式概念分析法是很好的本体半自动化更新方法,形式背景是FCA的基础,因此,形式背景应该包含领域的主要知识。通过将形式背景转化成概念格来将本体可视化,发现潜在的类及属性,将其转换成本体概念的层级关系[9]。
本体更新步骤:将初始本体转换成形式背景K1=(A1,B1,R1);将监控系统监测到的煤矿数据信息存储到关系数据库中,并转换成另一个形式背景K2=(A2,B2,R2);将2个形式背景合并成1个形式背景K=(A,B,R),完成知识的合并更新;将合并后的形式背景转换成概念格,将本体可视化;最后将概念格与原有本体进行对比,将新增的类、属性和关系等添加到本体中,完成本体更新。
在形式背景转换成概念格的过程中,本文采用智慧来等[10]提出的基于属性的概念格渐进式构造算法,通过有效地构造概念格,清晰地展现本体的层次结构。
3.1 初始本体
使用Protégé4.3建模工具来对初始本体进行建模,为保障本体编辑与推理的兼容性,用英文来命名采煤工作面本体的概念。采煤工作面本体中的概念有设备(Apparatus)、灾害(CoalDamage)、工作环境(Environment)、作业人员(ProfessionWorker)及操作方法(Operation)等。以灾害类为例,它分为多个子类,如爆炸事故类(ExplosionsDamage)与矿井水害类(MineFloodDamage),爆炸事故类又分为矿井瓦斯类(MineGasDamage)和矿尘类(MineDustDamage)。通过定义属性及属性约束来表达采煤工作面知识间的联系,如定义矿井瓦斯灾害属性的有发生地点(hasPlace some Worker-Place)、瓦斯浓度(hasGasConcentrationValue some float)、温度(hasTemperature some int)和氧气浓度(hasO2ConcentrationValue some float)。初始本体的部分类及属性描述如图2所示。
图2 初始本体部分类及属性描述
3.2 本体更新
以煤矿灾害类为例来描述采煤工作面本体更新的过程。初始本体中的灾害类(CoalDamage)包含爆炸事故类(ExplosionsDamage)和矿井水害类(MineFloodDamage),爆炸事故类(Explosions-Damage)包含矿井瓦斯灾害类(MineGasDamage)和矿尘灾害类(MineDustDamage),构建的初始本体如图3所示。
图3 初始本体模型
提取出初始本体中的所有灾害类的子类及其所对应的属性,并转换为形式背景,见表1。将监控系统所获得的矿井事故数据存储到关系数据库中,并将其转换成形式背景,见表2。合并后的形式背景见表3。
表1 初始本体的部分形式背景
表2 由数据库表转换成的部分形式背景
表3 合并后的形式背景
将表3转换成概念格,如图4所示。为了便于造格,图4中1,2,3,4,5分别代表矿井瓦斯、矿井水害、矿尘、机电事故、矿井火灾;a,b,c,d,e,f,g,h分别代表发生地点、瓦斯浓度、温度、火源、涌水量、矿尘浓度、氧气浓度、设备状态。
图4 由表3转换成的概念格
将概念格最底层节点去除后与初始本体进行比较,并将概念格的外延映射为本体中的类,内涵映射为本体中的属性。从图4可以看出,机电事故类(MechanicalAndElectricalDamage)不包含在任何原有类中,将其作为CoalDamage的子类;矿井火灾类(MineFireDamage)包含在ExplosionsDamage中,但与MineGasDamage和MineDustDamage不同,将其作为ExplosionsDamage的一个新子类;最后将MechanicalAndElectricalDamage与MineFire-Damage的属性一起添加到本体中,完成对初始本体的更新,形成一个新的本体。更新后的本体如图5所示。
图5 更新后的本体
3.3 结果分析
CFOCFCA通过将构造的概念格的外延和内涵映射成本体中的类和属性,构造了一个新的本体模型,减少了人工的参与。从图4可以看出,构造出的概念格清晰地表达了本体概念的层次结构,根据节点的位置和连线关系可以客观地判断出概念间的层级关系和隐含关系,提高了本体构建的自动化程度和效率,达到了预期效果。
通过分析煤矿的情境信息构建了采煤工作面本体模型,提出了CFOCFCA,有效地弥补了传统本体构建方法的不足,发现了领域本体中隐含的知识,减少了人力参与,为领域本体的构建提供了新途径,最后通过实例来展现本体构建与更新的过程。但是,如何自动地处理数据、构建形式背景、降低构造概念格的复杂度仍然是需要考虑的重要问题,因此,下一步工作将着重于本体的自动化构建方面。
参考文献:
[1] 徐青云,赵耀江,李永明.我国煤矿事故统计分析及今后预防措施[J].煤炭工程, 2015,47(3):80-82.
[2] LALINGKAR A, RAMNATHAN C, RAMANI S. Ontology-based smart learning environment for teaching word problems in mathematics[J].Journal of Computers in Education,2014,1(4):313-334.
[3] CHEN Xin,DUAN Feng,ZHANG Yingchao.Description method of conceptual model based on the ontology[J].Journal of Beijing Institute of Technology,2012,21(4):510-517.
[4] 郭华. 煤矿瓦斯监控系统的本体模型研究[D]. 太原:太原科技大学, 2014.
[5] 药慧婷,陈立潮,潘理虎.掘进工作面本体模型研究[J].工矿自动化, 2015,41(9):93-96.
[6] 孟现飞. 基于本体的煤矿事故预警知识库模型及其应用[D].徐州:中国矿业大学, 2014.
[7] CIGARRN-RECUERO J, GAYOSO-CABADA J, RODR-ARTACHO M, et al. Assessing semantic annotation activities with formal concept analysis[J]. Expert Systems with Applications, 2014, 41(11):5495-5508.
[8] LEE S, LEE H, JUNG J, et al. Arabidopsis thaliana RNA-binding protein FCA regulates thermotolerance by modulating the detoxification of reactive oxygen species[J]. New Phytologist, 2014, 205(2):555-569.
[9] MAO H. Characterization and reduction of concept lattices through matroid theory[J]. Information Sciences, 2014, 281:338-354.
[10] 智慧来,智东杰.基于属性的概念格渐进式构造原理与算法[J].计算机工程与应用,2012,48(26):17-21.
LIU Ting1, PAN Lihu1,2, ZHANG Sulan1, CHEN Lichao1, ZHANG Yingjun1
(1.School of Computer Science and Technology,Taiyuan University of Science and Technology,Taiyuan 030024, China; 2.Institute of Geographic Science and Natural Resource Research,Chinese Academy of Science, Beijing 100101, China)
Abstract:In view of problem of time-consuming and subjective dependence of traditional ontology construction method, an ontology construction method of coal mining face based on formal concept analysis was proposed. The method can discover concepts implied in domain data and relationship between the concepts effectively, use concept lattice to visualize ontology and add new information to ontology automatically, and realize semi-automatically update of ontology. Experiment proved effectiveness of the proposed method.
Key words:coal mining; coal mining face; ontology construction; ontology update; semi-automation; formal concept analysis; concept lattice
文章编号:1671-251X(2017)01-0073-04
DOI:10.13272/j.issn.1671-251x.2017.01.018
收稿日期:2016-07-22;
修回日期:2016-12-05;责任编辑:胡娴。
基金项目:“十二五”山西省科技重大专项项目(20121101001);山西省中科院科技合作项目(20141101001);山西省科技攻关项目(20141039)。
作者简介:刘婷(1991-),女,山西忻州人,硕士研究生,主要研究方向为软件体系结构,E-mail:2434033088@qq.com。
中图分类号:TD67
文献标志码:A
网络出版:时间:2016-12-30 10:33
网络出版地址:http://www.cnki.net/kcms/detail/32.1627.TP.20161230.1033.018.html
刘婷,潘理虎,张素兰,等.基于形式概念分析的采煤工作面本体构建研究[J].工矿自动化,2017,43(1):73-76.