煤矿监控类系统远程故障分析平台

高文12

(1.中煤科工集团常州研究院有限公司江苏 常州 2130152.天地(常州)自动化股份有限公司江苏 常州 213015)

摘要针对煤矿监控类系统故障处理时效性低、现场维护工作量大、运维成本高等问题,在对故障信息进行统一规范的基础上,设计了一种煤矿监控类系统远程故障分析平台。该平台分为设备层、网络层、系统层和运维层。设备层内置具备故障自诊断能力的故障探针,检测到故障后将关联信息缓存,并上传至网络层。网络层收到设备层传来的故障信息后,先对设备层故障信息进行缓存,再连同网络层产生的故障信息一起打包上传至系统层。系统层部署的故障信息采集软件可通过内存接口、数据库或文本文件等方式从监控类系统上位机软件中获得故障信息,同时支持网络层设备故障信息直接采集,将故障信息缓存后传输至运维层。运维层将接收的故障信息存入故障信息中心库进行分析和推送。该平台可为煤矿监控类系统故障分析提供重要的数据支撑,为煤矿监控类系统运维服务提供有效的技术保障。

关键词煤矿监控系统; 故障分析平台; 远程分析; 故障信息; 运维服务; 分级推送; 故障探针

中图分类号:TD67

文献标志码:A

网络出版地址:http://kns.cnki.net/kcms/detail/32.1627.TP.20190126.1807.001.html

文章编号1671-251X(2019)02-0105-04 DOI:10.13272/j.issn.1671-251x.2018110029

收稿日期2018-11-12;

修回日期:2019-01-20;

责任编辑:盛男。

基金项目天地科技股份有限公司智慧矿山专项项目(2016-ZHKSZX-03);天地(常州)自动化股份有限公司科研项目(2018GY002)。

作者简介高文(1981-),男,山西朔州人,工程师,主要从事煤矿监控软件、云计算和大数据技术应用研究,E-mail:digital_x@163.com。

引用格式高文.煤矿监控类系统远程故障分析平台[J].工矿自动化,2019,45(2):105-108.GAO Wen.Remote fault analysis platform of coal mine monitoring system[J].Industry and Mine Automation,2019,45(2):105-108.

Remote fault analysis platform of coal mine monitoring system

GAO Wen1,2

(1.CCTEG Changzhou Research Institute, Changzhou 213015, China; 2.Tiandi(Changzhou) Automation Co., Ltd., Changzhou 213015, China)

Abstract:For problems of low time-efficiency of fault process, heavy on-site maintenance workload and high cost of operation and maintenance of coal mine monitoring system, a remote fault analysis platform of coal mine monitoring system was designed based on unified specification of fault information. The platform is divided into device layer, network layer, system layer and operation and maintenance layer. Fault probe with self-diagnosis capability is built into the device layer. After fault is detected by the fault probe, relevant information is cached and uploaded to the network layer. The network layer caches the fault information from the device layer, and then packs and uploads it to the system layer with the fault information generated by the network layer. Fault information acquisition software deployed in the system layer can obtain fault information from upper computer software of monitoring system by means of memory interface, database or text file. Meanwhile, it supports direct acquisition of fault information of equipment in the network layer and transfers the cached fault information to the operation and maintenance layer. The operation and maintenance layer stores received fault information into fault information center library for analysis and push. The platform can provide important data support for fault analysis of coal mine monitoring system and effective technical support for operation and maintenance of coal mine monitoring system.

Key words:coal mine monitoring system; fault analysis platform; remote analysis; fault information; operation and maintenance service; hierarchical push; fault probe

0 引言

随着煤矿信息化建设的深入发展和“两化融合”的逐步推进,煤矿已建成安全监控系统、人员定位系统、大型机电设备集中控制系统和矿井综合自动化系统等多种监控类系统,为煤矿安全生产提供了有力的技术保障。然而,煤矿监控类系统架构多样,缺乏对故障信息分级分类的统一定义描述,故障处理知识共享缺少途径,导致故障处理时效性低、现场维护工作量大、运维成本高[1-3]。鉴此,笔者设计了一种煤矿监控类系统远程故障分析平台,可实现故障信息统一采集、远程分析和分级推送等功能。

1 故障信息规范

煤矿监控类系统种类繁多,故障信息表示方式各异,存储格式也不统一,技术人员需要通过多种途径查看故障信息,难以快速、准确查找故障原因。因此,需要对故障信息进行规范,有利于在煤矿监控类系统远程故障分析平台中进行不同级别、类别故障信息的聚合、统计、查询和分析操作[4],也有利于进行运维相关工作任务的分派管理和执行。

(1) 故障信息分级规范。按故障信息所表现的故障严重程度进行分级。① 一级故障信息(致命故障信息):可能导致人员生命安全受到危害的故障信息。② 二级故障信息(严重故障信息):必然导致系统整体终止运行或组件损坏的故障信息。③ 三级故障信息(一般故障信息):必然导致系统功能缺失、性能降低的故障信息。④ 四级故障信息(轻微故障信息):可能导致系统功能缺失、性能降低的故障信息。

(2) 故障信息分类规范。① 故障事件类:直接描述本次故障事件的信息。② 隐患信息类:与可能发生的故障密切关联的信息。③ 一般信息类:对描述故障事件、分析故障原因有帮助的任何信息。

(3) 故障信息一般通过故障探针检测获得,故障探针内容和传输规范见表1。

表1 煤矿监控类系统故障探针内容和传输规范
Table 1 Fault probe content and transmission specification of coal mine monitoring system

探针类型探针内容传输规范故障标志系统当前已启用的探针是否存在故障类型:16 bit无符号整型编码:每一位0/1代表相应探针故障无/有 初始化异常和初始化过程相关的导致系统无法进入正常运行状态的异常,如依赖文件缺失等类型:32 bit无符号整型编码:每一位0/1代表相应初始化异常无/有通信异常和通信相关的异常,如串口无法打开、网络服务器无法连接等格式:32 bit无符号整型编码:每一位0/1代表相应通信异常无/有硬件运行异常和硬件相关的异常,如漏电保护、过流保护等格式:32 bit无符号整型编码:系统内部各设备自定义不超过32种硬件故障类型,每一位0/1代表相应硬件故障无/有软件运行异常和软件相关的异常,如数据库访问异常、对内存位置的无效访问等格式:32 bit无符号整型编码:系统内部各设备自定义不超过32种软件故障类型,每一位0/1代表相应软件故障无/有配置信息异常配置信息无效,如配置文件损坏、超出数据范围等格式:16 bit无符号整型编码:系统内部各设备自定义不超过16种配置信息类型,每一位0/1代表相应配置信息异常无/有关联设备故障和本设备关联的其他设备发生异常,且这些异常不能被该关联设备检测到,如传感器冒大数,该传感器本身可能无法检测,需要由传输链路上的上级设备判断格式:16 bit无符号整型编码:系统内部各设备自定义不超过16种关联设备故障类型,每一位0/1代表相应关联设备故障无/有

2 平台架构

煤矿监控类系统远程故障分析平台分为设备层、网络层、系统层和运维层,如图1所示。设备层包含监控类系统中的终端设备(如传感器、执行器等);网络层包含所有数据传输中间层设备(如分站、网关和交换机等);系统层包含监控类系统上位机软件和故障信息采集软件;运维层包含远程故障信息分析软件和故障信息中心库。

图1 煤矿监控类系统远程故障分析平台架构
Fig.1 Architecture of remote fault analysis platform of coal mine monitoring system

平台涵盖故障信息的产生、采集、传输、存储、统计、分析和推送等环节。故障事件发生在哪个层级,其关联信息就从哪个层级(除运维层外)向上传输。在设备层,监控类系统中的终端设备内置故障探针,具备故障自诊断能力,检测到故障后将关联信息缓存,并通过RS485、以太网及其他各类通道上传至网络层。网络层收到设备层传来的故障信息时,先对设备层故障信息进行缓存,再连同网络层产生的故障信息一起打包上传至系统层[5]。系统层部署的故障信息采集软件可通过内存接口、数据库或文本文件等方式从监控类系统上位机软件中获得故障信息,同时支持网络层设备故障信息直接采集,故障信息缓存后通过有线网络、2G/3G/4G无线网络、人工拷贝等方式传输至运维层[6-7]。运维层将接收的故障信息存入故障信息中心库,其基本业务功能包括故障信息管理、故障统计分析、故障信息推送、设备固件管理、故障处理向导、故障编码管理等,其他业务功能可以插件模块的形式加载运行。

3 平台关键技术

3.1 故障信息采集

故障信息采集分为按需采集和固定采集2种方式:按需采集的一般是系统特征信息,如硬件版本、软件版本等;固定采集的一般是系统运行时的异常信息、关键点连续监测信息等。

从设备层到系统层,故障信息采集协议遵循监控类系统原有的传输协议执行。故障信息采集软件需要根据系统的接口类型配置采集方法,例如要获得安全监控系统的故障信息,需要从以下方面进行采集:① 通过实时数据接口[8]获得井下设备当前故障信息;② 从配置文件中获得系统各类固定配置信息;③ 从日志文件中获得系统各类未处理异常信息。

故障信息采集软件设计为插件模式,包括采集主控模块、执行插件模块、自动更新模块。采集主控模块控制采集流程,实现对执行插件的卸载和加载,根据用户的配置执行数据采集工作;执行插件模块负责各类故障信息具体采集功能的执行,按实际情况一般每种采集接口封装为一个DLL(Dynamic Link Library,动态链接库)插件;自动更新模块负责软件版本检测和补丁下载。

3.2 故障信息多层缓存

故障信息在层级间传输时,若遇到线路不稳定[9]、断电、设备复位等情况,可能会丢失故障信息。为了在后期查询时保持故障信息的连续性,需要尽可能将故障信息就近缓存。因此,设计故障信息多层缓存机制。一般在井下可设置1~2种临时缓存点,如设备层的传感器和网络层的分站;在系统层上位机中设置缓存点;在运维层设置故障信息中心库。

在设备层,由于大量终端设备存储空间较小,不能长时间、大量缓存故障信息,所以需要及时回收缓存空间:可配置较短的超期时间,如果故障信息在超期后仍未能上传则立即删除。在此基础上,结合故障信息分级规范,优先删除二级、三级和四级故障信息,尽可能保留一级故障信息。

在网络层,网络设备存储空间要比终端设备稍大,但仍不能大量缓存故障信息,因此在该层可优先删除三级和四级故障信息,保留一级和二级故障信息。

在系统层,上位机的存储空间较大,因此能够长时间缓存故障信息,可配置较长的超期时间,并尽可能保留所有级别的故障信息。

3.3 故障信息分析和推送

从各层传来的故障信息存入运维层的故障信息中心库后,可通过应用适当的故障信息分析方法[10],在海量信息中寻找规律、提取有用信息。故障信息分析方法包括基于多Agent的分析方法[11]、基于事实和规则可信度的推理分析方法[12]、综合判断方法[13]、基于故障征兆集与故障原因集的模糊推理方法[14]、多传感器信息融合方法[15]等。

故障信息经过分析后应及时分级推送给用户:四级故障信息、三级故障信息推送给运维人员;二级故障信息推送给运维人员、研发人员;一级故障信息推送给运维人员、研发人员、运维部门负责人、研发部门负责人等。

4 结语

煤矿监控类系统远程故障分析平台可实现设备与故障分析资源在地域上的分离:一方面,可将故障分析任务分解为不同的子问题,利用不同的故障分析资源进行分析,得到准确的分析结果;另一方面,同一故障分析资源可为不同地域的多个或多种设备提供分析服务,有利于资源共享。该平台为故障分析提供了重要的数据支撑,提高了故障分析能力,加快了故障排查进度。后续在平台中可依托大量故障信息,尝试采用人工智能等方法辅助故障诊断,在一定程度上实现自动学习故障特征、自动判别故障状态等功能。

参考文献

[1] 于雄飞,包兴.煤炭行业“两化融合”存在的问题及发展建议[J].煤炭工程,2013,45(10):139-141.

YU Xiongfei,BAO Xing.Problems and suggestions in the integration of coal enterprise industrialization and informatization[J].Coal Engineering,2013,45(10):139-141.

[2] 汪丛笑.煤矿安全监控系统智能化现状及发展对策[J].工矿自动化,2017,43(11):5-10.

WANG Congxiao.Present situation and development countermeasures of coal mine safety monitoring and control system intelligentization[J].Industry and Mine Automation,2017,43(11):5-10.

[3] 秦强,韩江.基于Internet的煤矿远程服务系统研究[J].煤炭工程,2003,35(3):57-59.

QIN Qiang,HAN Jiang.Study on the Internet remote service system for coal mines[J].Coal Engineering,2003,35(3):57-59.

[4] 张瑞.石油化工企业DCS系统故障的分类诊断[J].化工管理,2013(10):139.

[5] 贾玉芬,吕建军.计算机与单片机串口通信故障诊断程序的设计[J].工矿自动化,2008,34(3):131-133.

JIA Yufen,LYU Jianjun.Programming design of fault diagnosis of serial communication between computer and single-chip microcomputer[J].Industry and Mine Automation,2008,34(3):131-133.

[6] 陈幼平,张国辉,袁楚明,等.远程故障诊断系统体系结构研究[J].计算机应用研究,2005,22(12):88-90.

CHEN Youping,ZHANG Guohui,YUAN Chuming,et al.Research on architecture of remote fault

diagnosis system[J].Application Research of Computers,2005,22(12):88-90.

[7] 肖辉勇,李琼峰.浅析远程故障诊断与分析在设备维护的应用[J].工业控制计算机,2017,30(4):152-153.

[8] 李树梅.远程故障诊断系统在水处理自控系统中的应用[J].机械工程与自动化,2013(5):161-162.

LI Shumei.Application of remote fault diagnosis system in water treatment[J].Mechanical Engineering & Automation,2013(5):161-162.

[9] 邹哲强,张新朝,毛新展,等.煤矿监控系统主要设备的平均无故障工作时间测试与分析[J].工矿自动化,2013,39(7):1-4.

ZOU Zheqiang,ZHANG Xinchao,MAO Xinzhan,et al.Testing and analysis of MTBF of main equipments of coal mine monitoring system[J].Industry and Mine Automation,2013,39(7):1-4.

[10] 张可,周东华,柴毅.复合故障诊断技术综述[J].控制理论与应用,2015,32(9):1143-1157.

ZHANG Ke,ZHOU Donghua,CHAI Yi.Review of multiple fault diagnosis methods[J].Control Theory & Applications,2015,32(9):1143-1157.

[11] 刘传玺.基于多Agent的瓦斯监测系统故障诊断技术研究[J].中国矿业,2011,20(6):116-119.

LIU Chuanxi.Research on fault diagnosis of gas monitoring system based on multi-Agent[J].China Mining Magazine,2011,20(6):116-119.

[12] 王冬艳.基于专家系统的远程技术支持数字式服务系统[J].制造业自动化,2010,32(13):176-179.

WANG Dongyan.Remote digital service based on expert system[J].Manufacturing Automation,2010,32(13):176-179.

[13] 孔维社.主运煤流线协同控制系统的故障诊断设计[J].工矿自动化,2017,43(9):32-36.

KONG Weishe.Fault diagnosis design for coordinate control system of main coal transport route[J].Industry and Mine Automation,2017,43(9):32-36.

[14] 宋志丹,王玉森.大型机电一体化设备电控故障诊断系统设计[J].工矿自动化,2005,31(5):40-42.

SONG Zhidan,WANG Yusen.Design of fault diagnosis system of electric control system for a large-scale electromechanical incorporate equipment[J].Industry and Mine Automation,2005,31(5):40-42.

[15] 王其军,程久龙.基于信息融合技术的瓦斯传感器故障诊断研究[J].工矿自动化,2008,34(2):22-25.

WANG Qijun,CHENG Jiulong.Research of fault diagnosis of gas sensor based on information fusion technology[J].Industry and Mine Automation,2008,34(2):22-25.