基于跨模态注意力融合的煤炭异物检测方法

曹现刚; 李虎; 王鹏; 吴旭东; 向敬芳; 丁文韬

doi:10.13272/j.issn.1671-251x.2023110035

基于跨模态注意力融合的煤炭异物检测方法

曹现刚^{1, 2,},
李虎^{1, 2},
王鹏^{1, 2},
吴旭东^{1, 2},
向敬芳^{1, 2},
丁文韬^{1, 2}

1.
西安科技大学机械工程学院，西安　710054
2.
陕西省矿山机电装备智能检测重点实验室，西安　710054

基金项目: 国家自然科学基金面上项目（51975468）；陕西省重点研发计划项目（2018GY-160）；陕西省教育厅科学研究计划项目（18JC022）。

详细信息

作者简介:
曹现刚（1970—），男，山东莒南人，教授，博士，研究方向为设备健康维护与管理、机器人技术、煤矿机电装备智能化，E-mail：caoxg@xust.edu.cn

中图分类号: TD67
计量
- 文章访问数: 690
- HTML全文浏览量: 53
- PDF下载量: 69
出版历程
- 收稿日期: 2023-11-10
- 修回日期: 2024-01-20
- 网络出版日期: 2024-01-30
- 刊出日期: 2024-01-30

A coal foreign object detection method based on cross modal attention fusion

CAO Xiangang^{1, 2,},
LI Hu^{1, 2},
WANG Peng^{1, 2},
WU Xudong^{1, 2},
XIANG Jingfang^{1, 2},
DING Wentao^{1, 2}

1.
School of Mechanical Engineering, Xi'an University of Science and Technology, Xi'an 710054, China
2.
Shaanxi Provincial Key Laboratory of Intelligent Testing of Mine Mechanical and Electrical Equipment, Xi'an 710054, China

摘要

摘要: 为解决原煤智能化洗选过程中煤流中夹杂的异物对比度低、相互遮挡导致异物图像检测时特征提取不充分的问题，提出了一种基于跨模态注意力融合的煤炭异物检测方法。通过引入Depth图像构建RGB图像与Depth图像的双特征金字塔网络（DFPN），采用浅层的特征提取策略提取Depth图像的低级特征，用深度边缘与深度纹理等基础特征辅助RGB图像深层特征，以有效获得2种特征的互补信息，从而丰富异物特征的空间与边缘信息，提高检测精度；构建了基于坐标注意力与改进空间注意力的跨模态注意力融合模块（CAFM），以协同优化并融合RGB特征与Depth特征，增强网络对特征图中被遮挡异物可见部分的关注度，提高被遮挡异物检测精度；使用区域卷积神经网络（R−CNN）输出煤炭异物的分类、回归与分割结果。实验结果表明：在检测精度方面，该方法的AP相较两阶段模型中较优的Mask transfiner高3.9%；在检测效率方面，该方法的单帧检测时间为110.5 ms，能够满足异物检测实时性需求。基于跨模态注意力融合的煤炭异物检测方法能够以空间特征辅助色彩、形状与纹理等特征，准确识别煤炭异物之间及煤炭异物与输送带之间的差异，从而有效提高对复杂特征异物的检测精度，减少误检、漏检现象，实现复杂特征下煤炭异物的精确检测与像素级分割。
- 煤炭异物检测 /
- 实例分割 /
- 双特征金字塔网络 /
- 跨模态注意力融合 /
- Depth图像 /
- 坐标注意力 /
- 改进空间注意力
Abstract: The RGB image of coal foreign objects lacks target space and edge information, the color and texture between the object to be detected and the background are similar, the contrast is low, and there are overlapping and occlusion phenomena among the objects to be detected, resulting in insufficient feature extraction of coal foreign objects, and the existing foreign object detection methods are difficult to achieve ideal results. In order to solve the above problems, a coal foreign object detection method based on cross modal attention fusion is proposed. By introducing Depth images to construct a dual feature pyramid network (DFPN) for RGB images and Depth images, a shallow feature extraction strategy is adopted to extract low-level features of Depth images. Basic features such as deep edges and deep textures are used to assist deep features of RGB images, effectively obtaining complementary information between the two features. It thereby enriches the spatial and edge information of foreign object features and improves detection precision. A cross modal attention fusion module (CAFM) based on coordinate attention and improved spatial attention is constructed to synergistically optimize and fuse RGB features and Depth features. It enhances the network's attention to the visible parts of occluded foreign objects in the feature map, and improves the precision of occluded foreign object detection. Finally, regional convolutional neural network (R-CNN) is used to output the classification, regression, and segmentation results of coal foreign objects. The experimental results show that in terms of detection precision, the average segmentation precision AP of the proposed method is 3.9% higher than the better Mask transformer in the two-stage model. In terms of detection efficiency, the proposed method has a single frame detection time of 110.5 ms, which can meet the real-time requirements of foreign object detection. The coal foreign object detection method based on cross modal attention fusion can assist color, shape, and texture features with spatial features. It accurately recognizes the differences between coal foreign objects and between coal foreign objects and conveyor belts, effectively improves the detection precision of complex feature foreign objects. It reduces false alarms and missed detections, and achieves precise detection and pixel level segmentation of coal foreign objects under complex features.
- coal foreign object detection /
- instance segmentation /
- double feature pyramid network /
- cross modal attention fusion /
- Depth image /
- coordinate attention /
- improved spatial attention

HTML全文

0.   引言

当前煤矿智能化发展尚处于初级阶段^[1]，其发展理念和技术体系还不够成熟，“人、机、料、法、环”各个子系统通信协议、数据接口难以统一，数据难以融合，形成信息壁垒^[2-4]。

数据采集、融合与共享是推动煤炭行业大数据技术发展的关键环节，有利于统一智能化煤矿的建设思路，众多学者对此展开了研究。杜毅博等^[5]提出了基于位号的煤矿数据编码标准，便于后期处理过程中的数据关联分析。韩安^[6]提出了利用Kafka消息队列作为数据接入的协议，用Hadoop作为数据存储的载体；数据共享采用SDK函数接口为应用提供数据访问的方式。方乾等^[7]提出了自动化系统采用EIP，Modbus，OPC，S7协议采集数据，安全监测系统采用HTTP，WebSocket等协议接入数据；关系型数据采用MySQL存储，非关系型数据采用HBase，InfluxDB等存储；数据共享采用WebService，Restful API，WebSocket接口提供服务。

然而，随着煤矿智能化建设推进，矿山对数据融合的数量和质量要求大幅度提高。目前，基于大数据平台的数据融合系统在煤矿信息化发展过程中逐渐暴露出一定的局限性，主要表现如下。

1）采用基于位号的煤矿数据编码标准能对设备按照统一规则进行数字编码，但编码的使用是松散的，不是整体访问的方式，更适合主数据管理场景使用，且对于查询整个设备断面数据的场景中，缺少设备对象化的标准。

2）为了能够采集各种类型设备数据，数据采集支持多种通信协议，但由于通信协议格式各异，直接按照采集的格式存储数据，造成数据应用困难，大数据应用、分析数据需要多种语义解析才能实现相互理解。同时，数据采集规约实现大多基于Windows平台实现，不能满足煤炭行业基于Linux内核国产化操作系统的要求。

3）针对煤矿监控应用场景，从基于文件存储的Hadoop中获取数据为监视界面提供实时刷新，但存储方式为散点方式，不能满足监视界面秒级数据刷新的要求。

4）大部分基于互联网思想建设的煤矿大数据平台对历史数据的存储往往采用一种设备一张表模式，即为每一种设备设计一张表来存储历史数据，每一张表提供3种接口（查询、删除、修改）访问历史数据。然而，由于煤矿设备种类繁多，该模式导致数据共享接口数量众多，且对于数据的准确性和完整性缺少治理，导致数据共享效率低、效果差。

本文提出一种基于对象模型的煤矿数据采集融合共享系统，首先通过规约采集或其他采集方式接入数据，其次将松散数据经过对象化映射、数据治理后存储到数据库中，然后以对象方式提供共享接口，最后通过数据融合共享安全规范验证及调用共享接口访问数据，以实现煤矿数据高效采集、融合和共享。

1.   系统架构

基于对象模型的煤矿数据采集融合共享系统架构如图1所示。设备层和感知层为系统提供数据源；数据接入层、数据融合层、数据共享层、应用层是系统的核心。

图 1 基于对象模型的煤矿数据采集融合共享系统架构

Figure 1. Architecture of coal mine data acquisition, fusion and sharing system based on object model

下载: 全尺寸图片幻灯片

1）数据接入层。该层通过各种协议接入感知层从设备层采集的多源异构数据，向数据融合层提供原始数据源。数据接入方式：① 规约采集。采用即插即拔的工业协议库框架，支持常用的规约（如Modbus、S7、IEC101和IEC104等），可采集子系统（主要包括智能开采、智能掘进、智能主运、人员定位等系统）转发的数据或直接采集设备（主要包括PLC、采集网关、边缘终端等设备）的数据。② 其他采集。支持协议包括FTP、Restful API、视频流、文本和消息队列等，一般采集子系统（主要包括视频监控、地质保障、手工填报、故障诊断、安全监测、三维可视化、图像识别等系统）转发的数据。

2）数据融合层。该层首先对数据接入层的数据进行标准化处理，规约采集的数据按照设备对象模型进行映射，其他采集数据采用key-value方式进行映射。其次，根据数据治理标准，对对象化数据进行治理。然后，将治理后的实时数据存储到Redis实时数据库中。最后，将对象化数据进行历史存储，存储方式分为2种：① 规约对象方式。历史数据存储接口按照每个对象数据的采集周期从Redis实时数据库中遍历及存储对象数据。② key-value对象方式。将数据接入到Kafka消息队列，通过Kafka提供的组件直接存入MinIO数据库。

3）数据共享层。该层提供实时数据共享、历史数据共享和非结构数据共享3种接口，为应用层提供数据服务。实时数据共享接口从分布式Redis实时数据库获取数据，为应用层提供服务，由于实时监视对数据的访问速度要求很高，需要秒级刷新界面，而很多设备数据在1 s内基本变化不大，所以采用变化推送的方式向界面推送数据；历史数据共享接口从ClickHouse历史数据库获取数据，为应用层提供Restful API接口访问服务；非结构数据共享接口从MinIO数据库中获取数据，为应用层提供Restful API接口访问服务。根据数据融合共享规范安全要求，应用访问需通过身份校验才能登录数据共享服务，通过权限校验才能获取具有授权的数据。

4）应用层。该层是数据使用层，调用数据共享层提供的接口查询数据进行使用。

2.   系统关键技术

2.1   设备对象模型标准化

煤矿设备种类多，且每种设备生产厂家采用的工艺不同，导致设备参数存在不统一的现象^[8-10]。虽然基于位号的煤矿数据编码标准提供了设备和属性点的命名规范，但缺少软件层面的实现。为使设备能够在软件层面抽象表达，本文基于煤矿数据编码标准设计设备对象模型，如图2所示。该模型可兼容设备参数之间的差异，具有可扩展性，灵活度高。

图 2 设备对象模型

Figure 2. Device object model

下载: 全尺寸图片幻灯片

设备对象模型涵盖公共信息和扩展信息。

1）公共信息。用于定义煤矿设备的通用模型，包括基础模型、通信模型、位置模型、属性点模型：① 基础模型包括设备的名称、生产厂家、状态、版本信息、铭牌参数等。② 通信模型包括设备联网方式、网络参数等。③ 位置模型包括位置描述、经度、纬度等。④ 属性点模型包括类ID、属性点ID、名称、单位类型、数据类型、数据长度、读写标志等，其中类ID和属性点ID是固定的。固定的类ID有利于应用区分不同种类的设备，避免不同应用之间的语义转换；在工程复制的场景中，由于属性点ID是固定的，复制源工程中的设备属性生成目标工程中的设备属性，不需要修改属性点ID，减少工程开发工作量。

设备对象模型模版采用json格式实现，描述如下：

{

"uuid": "唯一ID",

"baseinfo": {

"devicename": "设备名称",

"subsystemname": "子系统名称",

"devicetype": "设备类型",

"ref": "设备关联关系",

"realtimestate": "实时状态"

},

"communication": [{

"type": "网口通信",

"info": [{

"ipaddress": "ip地址",

" subnetmask ": "子网掩码",

" DNS": "域名解释",

"protocolname": "协议名称"

}, ···]

}, {

"type": "串口通信",

"info": [{

"comaddress": "串口地址",

"BUAD": "波特率",

"databit": "数据位",

"stopbit": "停止位",

"paritybit": "奇偶检验位",

"protocolname": "协议名称"

}, ···]

}],

"position": {

"location": "地点描述",

"longitude": "经度",

"latitude": "纬度"

},

"points": [{

"count": "属性点数量",

"classid": "类唯一ID",

"data": [{

"id": "属性点ID",

"name": "属性名称",

"unitype": "单位类型",

"datatype": "数据类型",

"datalength": "数据长度",

"readorwrite": "读写标志"

}, ···]

}]

}

其中，uuid通过雪花算法自动生成，保证矿井设备的唯一性，避免设备识别错误，points以数组的方式表示。

2）扩展信息。因为不同厂家的设备除了具有公共信息模型的属性外，还有一些个性化属性，为保证设备对象模型的完整性，需将这些个性化属性存放到扩展模型中。

2.2   数据接入

数据接入的方式分为工业规约采集、Restful API问答式采集和文件数据采集。

1）工业规约采集。煤炭行业部分厂家基于Windows操作系统开发通信规约^[10]，而近年煤炭行业规定要求使用基于Linux内核的国产化操作系统，基于Windows操作系统的通信规约采集不能运行在基于Linux内核的操作系统中。本文采用跨操作系统的C++语言开发规约。工业规约采集实现关键技术：① 即插即拔机制。每一种规约封装成动态库，框架采用动态加载规约库的方式实现即插即拔，由于每种操作系统的动态库加载函数不一致，设计一个函数对描述操作系统的宏定义（如Windows的宏定义为Win32）判断，对不同的操作系统，调用对应的动态库加载函数，实现动态库的动态加载。② 报文解析。虽然每种工业规约都发布了标准，但设备厂家对不能满足其要求的标准规约进行非标扩展，导致1种规约产生多个变种。为兼容多个变种，标准部分定义基类，其他变种采用C++的继承机制，继承基类，重写非标准部分的函数，为规约扩展提供了灵活的机制。③ 报文监视。上位机作为客户端按照规约的规范从下位机采集数据，下位机作为服务端按照规约的规范为上位机提供数据转发服务。当上位机和下位机规约通信出现数据不一致的问题后，需要查看报文才能快速排查错误。规约运行在基于Linux内核的操作系统中，而报文监视工具为了方便查找问题，运行在Windows操作系统中。虽然采用跨操作系统的C++语言实现报文解析，但Windows和Linux存在字节存储大小端的问题，如果不经过转换，会导致数据不一致。为避免该错误，采用统一的网络字节序进行数据交互。网络字节序采用大端方式存储数据，Windows操作系统采用小端字节序存储数据，需要调用函数将数据转换成网络字节序，而基于Linux内核的操作系统采用大端字节序存储数据，不需要转换。工业规约采集框架如图3所示。

图 3 工业规约采集框架

Figure 3. Industrial protocol acquisition framework

下载: 全尺寸图片幻灯片

2） Restful API问答式采集。目前煤矿上位机采集下位机数据时，采用下位机向上位机post的方式推送数据，其弊端是上位机不能快速定位数据传输异常原因是网络中断还是下位机程序崩溃。为避免该问题，采用“一问一答”方式，上位机调用Restful API接口，周期查询下位机数据，根据接口各响应状态返回值（200，400，404，500等）判断通信异常情况。

3）文件数据采集。图片文件、地质保障文件、二进制文件（包括视频流）等数据一般作为一个整体采集^[10-12]，按照key-value的方式存储到MinIO数据库中。

2.3   数据融合

将接入的数据进行融合：首先对无序的数据进行设备对象模型映射，然后对模型化后的数据进行治理，最后对治理后的对象数据进行存储。

2.3.1   设备对象模型映射

由于煤矿设备数量、种类众多，数据类型多样^[13-14]，工业规约采集的数据不含描述信息，需要额外的信息来描述其语义^[15-16]，导致数据的准确性、完整性、一致性和可靠性等方面存在问题，所以需要按照对象模型映射数据，确保融合后的数据按照标准化对象模型为数据应用提供服务。

通过规约采集的数据测点杂乱无章^[17]，命名规范、数据内容、数据字典、数据格式不能在规约中体现，需要设计一个测点映射表。测点映射表包含源测点信息和目的映射信息：源测点信息包括规约的点号和数据长度；目的映射信息包括名字、映射的数据类型、数据长度、对象属性ID和单位。当数据标准化映射时，进程根据映射表的映射规则解析，将规约的点号映射到对象模型属性点的点号中，同时，将采集值按照映射的目标类型和长度进行转换，然后动态对转换后的采集值进行对象化缓存，供下一步数据治理使用。

通过Restful API采集的数据大多数是json数据格式，这类数据带有名称、值等信息，但这些信息对于设备对象模型映射来说还不够全面。需设计一个json数据映射表，增加数据描述（包括名称、数据类型、值、数据长度、单位），从而提供对象映射全量信息。当数据标准化映射时，进程根据映射表的映射规则解析，将源json中key和目标json中key匹配，将源json中属性值取出，按照映射的目标类型和长度进行转换，写入目标json中属性值，实现json格式数据的对象化采集。

设备对象模型映射过程如图4所示。

图 4 设备对象模型映射过程

Figure 4. Device object model mapping process

下载: 全尺寸图片幻灯片

2.3.2   数据治理

数据治理采用的方式主要包括公式计算和数据监视报警2种。

1）公式计算。煤矿采集的数据大多是原始数据，数据应用需要利用原始数据进行计算、统计、转换等^[18-21]。目前采用的方式是在数据使用时进行计算，但由于煤矿数据系统众多、数据来源复杂、数据类型多样，如果请求的数据量很大，会出现计算性能瓶颈问题，导致数据计算效率低。本文按照数据治理规则，在数据存储之前对统一采集的数据进行公式计算和处理，提高数据的计算性能。公式计算的关键点是在规约解析后，在存储之前对测点进行数学运算，主要包括加法、减法、乘法、除法等基本运算，以及开方、平方、取模等高级运算，还可对值进行取反计算。实现步骤：首先制定公式模板，其次将计算的采集点作为公式参数输入到模板中，然后模板调用系统集成的Python math数学库，最后实现复杂的数学计算。采集的数据在存储之前，按照配置的信息调用函数模板周期性执行计算，实现数据计算、统计、转换的目的。

2）数据监视报警。包括异常值和越限阈值报警：① 数据采集设备在长时间工作过程中可能出现异常值，此外由于网络通信故障，不能保证采集数据的完整性。对异常、不完整的数据进行报警、删除或更正，异常值不参与公式计算，确保最终结果可靠和准确^[7]。② 设备运行参数受到约束条件的影响而不能超出一定范围，如果测量参数超过了设定的极限值，需触发越限报警信号，供用户对设备工作状态进行判断。数据监视报警的步骤：先根据经验配置数据异常值或越限阈值，采集的数据在存储之前与阈值比较，如果超过阈值，产生相应的报警记录并存到报警表中，为挖掘传感器故障率和设备故障预警等分析提供数据支撑。

2.3.3   数据存储

设备数据按照对象模型的方式存储是指将采集的松散信息映射成对象模型后进行集中存储，这是一种存储海量数据的高速存储方案，将设备多个参数1次存储，减少网络访问和数据存储的操作次数，从而提高数据存储效率，节省存储空间。

数据存储分为内存存储和文件存储，对于实时性要求高的监视类应用，将采集的数据存储到内存数据库中，将文件和视频流（回放视频）等实时性要求不高的数据存储到基于文件的数据库中。

1）内存存储。针对煤矿数据量大、处理速度快的需求，内存数据库采用分布式部署的Redis。Redis分布式部署需要基于slot计算存储节点，采用CRC16算法计算存储节点，利用测点的key对16 284取模，得到的结果就是对应的slot，调用Redis分布式访问接口Jedis，根据slot位置把测点值存到Redis库中。采用Redis String数据类型（key-value方式）存储设备对象化数据：对于测点的key，利用对象模型的优点，采用四维参数（即通道号、类ID、实例号、属性点ID），同一通道的测点可分配到同一slot，提高数据访问速度，满足监控秒级数据刷新的要求；对于测点的value，则采用json格式的对象数据。为提高存储效率和节省存储空间，动态变化的属性点模型数据采用周期更新同一条记录的方式，其他基础模型、网络模型、位置模型变化频次较少，数据变化时才更新记录。

2）文件存储。包括结构化数据和非结构化数据存储：① 结构化数据一般存储在ClickHouse中， ClickHouse采用分布式部署。针对煤矿数据规模大的需求，通常采用分表（即按照每日或每月一张表）的方式来存储数据，对于跨年、跨月的数据查询需要查询多张表，效率非常低；此外，按照互联网的方式，为每一种设备设计一张表存储数据，导致数据库表数量众多，为数据使用带来麻烦。为避免该情况，所有的对象数据用一张表存储，这得益于ClickHouse分布式表具有分布式存储数据的功能。需制定分布式存储策略，采用对象模型设备ID对ClickHouse节点数取模的方法计算存储节点，将对象存储到相应的节点中。② 非结构化数据一般是文本文件、视频流、二进制文件，采用MinIO数据库以整体方式存储此类数据。MinIO通过Kafka接入流式数据，按照key-value对象化方式存储，采用分布式存储和访问的策略，提高数据存储和访问性能。

2.4   数据共享接口

系统提供对象化的数据共享接口，为应用层应用提供数据服务。鉴于非结构化的MinIO数据共享接口直接通过key-value方式访问，比较简单，所以本文重点介绍实时数据共享接口和历史数据共享接口关键技术。

如果采用一种设备一张表存储数据的方式^[20]，由于煤矿设备种类多，数据服务接口至少有200个，数据应用访问与之匹配的接口也很多，给数据使用者增加了工作量。由于本文所有的对象数据存储是基于一张表，所以对象化的数据共享接口可简化到实时数据共享接口和历史数据共享接口。

1）实时数据共享接口。输入参数为设备ID数组。首先根据设备ID进行权限校验，如果通过权限校验，对16 284取模获取数据存储的slot，然后按照slot查找到对应的Redis节点，接着遍历该节点的key获取value（对象化数据），最后返回对象化数据数组。如果设备数据不存在，用NULL表示空值返回；如果没有通过权限校验，返回“没有权限，获取数据错误”。另外，对于实时性要求高的场景，采用Web Socket服务端向客户端推送数据的方式，减少客户端和服务端的网络通信时间，提高数据访问性能。

2）历史数据共享接口。输入参数为设备ID数组、开始时间、结束时间。首先根据设备ID进行权限校验，如果通过权限校验，对ClickHouse节点数取模，然后根据取模结果得到存储节点，接着结合输入时间等条件查询历史数据，最后返回对象化数据数组。如果设备数据不存在，用NULL表示空值返回。

对象化的数据共享接口具有查询效率高的特点，仅需通过1次查询，即可将整个设备属性数据以对象方式存储到缓存中，再按照请求的属性点从对象模型中抽取解析返回需要的数据，解决了松散式数据共享接口需多次查询导致耗时长的问题。

3.   系统应用

基于对象模型的煤矿数据采集融合共享系统目前在山西天地王坡煤业有限公司进行了工程实践。在设计阶段对全矿井设备进行了对象模型规划，形成了全矿井的设备对象模型，实现了对象模型标准化建设，解决了数据采集和数据共享以对象模型交互的标准问题，显著降低了数据使用过程中语义解析的难度。

通过工业规约对综采工作面、综掘工作面、主运输系统、排水系统、通风系统、供电系统、智能污水处理系统、智能压风系统、铁路智能装车系统和汽车智能装运系统的设备进行数据采集，通过Restful API方式对安全监测设备进行数据采集，通过私有协议对人员定位系统的设备和人员进行数据采集，通过二进制流式方式对视频进行数据采集，并按照对象模型的映射标准，将各种设备数据以对象化方式进行融合和存储，为智能化业务场景的指标分析、能耗计算、故障诊断、实时监视等提供对象化共享接口，为大数据分析提供保障。

目前煤矿数据采集融合共享系统接入2 000多个生产设备，每日产生上亿条生产数据，在设备对象模型管理和数据计算、统计、转换等方面取得显著效果。

在硬件配置和运行环境相同的条件下，收集现场应用过程数据进行如下对比测试。

1）重复进行数据计算，数据存储前和数据使用时计算性能对比见表1。可看出数据存储前计算比数据使用时计算的准确率稍有提高，且计算速率提高了4倍。

表 1 数据计算性能对比

Table 1. Comparison of data calculation performance

计算方式准确率/% 每10万条数据计算用时/s

数据存储前计算 90 1
数据使用时计算 87 5

下载: 导出CSV
| 显示表格

2）重复进行数据存储，松散数据和对象数据存储性能对比见表2。可看出对象数据存储速率比松散数据存储速率有显著提升，在Redis数据库中提升了9倍，在ClickHouse中提升了49倍。

表 2 数据存储性能对比

Table 2. Comparison of data storage performance

数据库松散数据存储速率/（kbit·s⁻¹）对象数据存储速率/（kbit·s⁻¹）

Redis 200 2 000

ClickHouse 100 5 000

下载: 导出CSV
| 显示表格

3）重复进行全矿井数据查询，松散数据和对象数据查询性能对比见表3。可看出对象数据查询速率比松散数据查询速率有大幅度提升，在Redis数据库中提高了3倍，在ClickHouse中提升了9倍。

表 3 数据查询性能对比

Table 3. Comparison of data query performance

数据库松散数据查询速率/（kbit·s⁻¹）对象数据查询速率/（kbit·s⁻¹）

Redis 1 000 4 000

ClickHouse 100 1 000

下载: 导出CSV
| 显示表格

4.   结论

1）基于煤矿数据编码标准设计设备对象模型，包括基础模型、通信模型、位置模型、属性点模型、扩展模型，可兼容设备参数之间的差异，具有可扩展性强、灵活度高的优点。

2）利用跨操作系统的工业规约和Restful API问答式接口，实现了设备数据接入，满足煤矿操作系统国产化的发展趋势，解决了采用post方式采集数据不能判断数据传输过程中异常情况的弊端。

3）采集的数据经过设备对象模型映射、数据治理和数据存储后，实现了数据融合。通过无序的数据标准化，解决了数据语义不统一的问题；通过数据治理，保证了数据的可靠性、准确性；通过设备数据对象化的存储，提高了存储效率，节省了存储空间。

4）对象化的数据共享接口可简化为实时数据和历史数据共享接口，通过1次查询整个对象数据，从中提取所需的属性点，显著提高了数据访问性能。

图 1 基于跨模态注意力融合的煤炭异物检测模型

Figure 1. A coal foreign object detection model based on cross modal attention fusion

下载: 全尺寸图片幻灯片

图 2 ResNet基础结构

Figure 2. ResNet infrastructure

下载: 全尺寸图片幻灯片

图 3 CAFM结构

Figure 3. Structure of cross modal attention fusion module

下载: 全尺寸图片幻灯片

图 4 RPN结构

Figure 4. Structure of region proposal network

下载: 全尺寸图片幻灯片

图 5 ROI Align结构

Figure 5. Structure of ROI Align

下载: 全尺寸图片幻灯片

图 6 Head Architecture结构

Figure 6. Structure of Head Architecture

下载: 全尺寸图片幻灯片

图 7 煤炭异物视觉检测系统

Figure 7. Visual detection system for coal foreign object

下载: 全尺寸图片幻灯片

图 8 煤炭异物种类

Figure 8. Types of coal foreign object

下载: 全尺寸图片幻灯片

图 9 P−R曲线对比

Figure 9. Comparison of P-R curves

下载: 全尺寸图片幻灯片

图 10 煤炭异物检测效果对比

Figure 10. Comparison of coal foreign object detection effects

下载: 全尺寸图片幻灯片

表 1 RGB图像与Depth图像特征提取网络总体结构

Table 1 The overall structure of feature extraction networks for RGB and Depth images

层名	RGB分支	Depth分支	输出通道数
L1	7×7，64，stride 2		64
L2	3×3，max pool，stride 2		256
L2	Conv Block×1 Identity Block×2	Conv Block×1	256
L3	Conv Block×1 Identity Block×3	Conv Block×1	512
L4	Conv Block×1 Identity Block×22	Conv Block×1	1024
L5	Conv Block×1 Identity Block×2	Conv Block×1	2048

下载: 导出CSV

表 2 特征提取消融实验结果

Table 2 Ablation experiments results for feature extraction %

Backbone		AP	AP_0.5	AP_0.75	AP_S	AP_M	AP_L
RGB	Depth	AP	AP_0.5	AP_0.75	AP_S	AP_M	AP_L
ResNet50	ResNet50	72.2	92.3	81.7	28.1	55.6	78.1
	ResNet101	70.9	91.5	80.1	27.8	55.2	77.6
	Conv Block	76.3	93.2	86.8	29.9	59.1	79.7
ResNet101	ResNet50	74.3	93	83.7	28.7	57.4	78.6
	ResNet101	73.7	92.7	82.3	29	56.6	78.3
	Conv Block	78.5	94.1	88.1	30.4	60.7	81.7

下载: 导出CSV

表 3 特征融合消融实验结果

Table 3 Ablation experiments results for feature fusion %

融合方式	Backbone	AP	AP_0.5	AP_0.75	AP_S	AP_M	AP_L
RGB	ResNet101	70.6	91.0	79.1	27.7	54.1	76.2
数据层融合	ResNet101	64.7	87.3	72.2	25.5	50.2	69.9
特征层融合	ResNet101+Conv Block	78.5	94.1	88.1	30.4	60.4	81.7
CAFM	ResNet101+Conv Block	82.2	98.9	95.7	32.1	62.5	86.6

下载: 导出CSV

表 4 不同模型检测性能对比

Table 4 Comparison of detection performance of different models

网络模型	输入	AP/%	AP_0.5/%	AP_0.75/%	AP_S/%	AP_M/%	AP_L/%	单帧检测时间/ms
SOLOv2	RGB	72.8	91.6	82.1	28.8	57.6	78.3	72.6
BlendMask	RGB	67.1	87.5	78.5	26.8	48.7	72.6	60.7
Mask−RCNN	RGB	70.6	91.0	79.1	27.7	54.1	76.2	102.6
MS RCNN	RGB	73.5	91.8	83.2	29.9	58.5	79.1	126.4
Mask transfiner	RGB	78.3	93.9	88.3	31.5	60.3	83.2	96.3
本文模型	RGB+Depth	82.2	96.8	93.7	33.1	62.5	86.6	110.5

下载: 导出CSV

参考文献(25)

[1]	刘峰,郭林峰,赵路正. 双碳背景下煤炭安全区间与绿色低碳技术路径[J]. 煤炭学报,2022,47(1):1-15. LIU Feng,GUO Linfeng,ZHAO Luzheng. Research on coal safety range and green low-carbon technology path under the dual-carbon background[J]. Journal of China Coal Society,2022,47(1):1-15.
[2]	刘峰,曹文君,张建明,等. 我国煤炭工业科技创新进展及“十四五”发展方向[J]. 煤炭学报,2021,46(1):1-15. LIU Feng,CAO Wenjun,ZHANG Jianming,et al. Current technological innovation and development direction of the 14^(th) Five-Year Plan period in China coal industry[J]. Journal of China Coal Society,2021,46(1):1-15.
[3]	曹现刚,刘思颖,王鹏,等. 面向煤矸分拣机器人的煤矸识别定位系统研究[J]. 煤炭科学技术,2022,50(1):237-246. DOI: 10.3969/j.issn.0253-2336.2022.1.mtkxjs202201024 CAO Xiangang,LIU Siying,WANG Peng,et al. Research on coal gangue identification and positioning system based on coal-gangue sorting robot[J]. Coal Science and Technology,2022,50(1):237-246. DOI: 10.3969/j.issn.0253-2336.2022.1.mtkxjs202201024
[4]	LI Man,DUAN Yong,HE Xianli,et al. Image positioning and identification method and system for coal and gangue sorting robot[J]. International Journal of Coal Preparation and Utilization,2022,42(4/6):1759-1777.
[5]	赵跃民,张亚东,周恩会,等. 清洁高效干法选煤研究进展与展望[J]. 中国矿业大学学报,2022,51(3):607-616. DOI: 10.3969/j.issn.1000-1964.2022.3.zgkydxxb202203023 ZHAO Yuemin,ZHANG Yadong,ZHOU Enhui,et al. Research progress and prospect of clean and efficient dry coal separation[J]. Journal of China University of Mining & Technology,2022,51(3):607-616. DOI: 10.3969/j.issn.1000-1964.2022.3.zgkydxxb202203023
[6]	葛世荣,郝尚清,张世洪,等. 我国智能化采煤技术现状及待突破关键技术[J]. 煤炭科学技术,2020,48(7):28-46. GE Shirong,HAO Shangqing,ZHANG Shihong,et al. Status of intelligent coal mining technology and potential key technologies in China[J]. Coal Science and Technology,2020,48(7):28-46.
[7]	WANG Yuanbin,WANG Yujing,DANG Langfei. Video detection of foreign objects on the surface of belt conveyor underground coal mine based on improved SSD[J]. Journal of Ambient Intelligence and Humanized Computing,2023,14:5507-5516. DOI: 10.1007/s12652-020-02495-w
[8]	郝帅,张旭,马旭,等. 基于CBAM−YOLOv5的煤矿输送带异物检测[J]. 煤炭学报,2022,47(11):4147-4156. HAO Shuai,ZHANG Xu,MA Xu,et al. Foreign object detection in coal mine conveyor belt based on CBAM-YOLOv5[J]. Journal of China Coal Society,2022,47(11):4147-4156.
[9]	ZHANG Kanghui,WANG Weidong,LYU Ziqi,et al. Computer vision detection of foreign objects in coal processing using attention CNN[J]. Engineering Applications of Artificial Intelligence,2021,102. DOI: 10.1016/j.engappai.2021.104242.
[10]	任志玲,朱彦存. 改进CenterNet算法的煤矿皮带运输异物识别研究[J]. 控制工程,2023,30(4):703-711. REN Zhiling,ZHU Yancun. Research on foreign object detection of coal mine belt transportation with improved CenterNet algorithm[J]. Control Engineering of China,2023,30(4):703-711.
[11]	程德强,徐进洋,寇旗旗,等. 融合残差信息轻量级网络的运煤皮带异物分类[J]. 煤炭学报,2022,47(3):1361-1369. CHENG Deqiang,XU Jinyang,KOU Qiqi,et al. Lightweight network based on residual information for foreign body classification on coal conveyor belt[J]. Journal of China Coal Society,2022,47(3):1361-1369.
[12]	SONG Xinhang,JIANG Shuqiang,HERRANZ L,et al. Learning effective RGB-D representations for scene recognition[J]. IEEE Transactions on Image Processing,2019,28(2):980-993. DOI: 10.1109/TIP.2018.2872629
[13]	BALTRUŠAITIS T,AHUJA C,MORENCY L-P. Multimodal machine learning:a survey and taxonomy[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2019,41(2):423-443. DOI: 10.1109/TPAMI.2018.2798607
[14]	GAO Mingliang,JIANG Jun,ZOU Guofeng,et al. RGB-D-based object recognition using multimodal convolutional neural networks:a survey[J]. IEEE Access,2019,7:43110-43136. DOI: 10.1109/ACCESS.2019.2907071
[15]	LIN T-Y,DOLLAR P,GIRSHICK R B,et al. Feature pyramid networks for object detection[C]. IEEE Conference on Computer Vision and Pattern Recognition,Honolulu,2017:936-944.
[16]	HE Kaiming,ZHANG Xiangyu,REN Shaoqing,et al. Deep residual learning for image recognition[C]. IEEE Conference on Computer Vision and Pattern Recognition,Las Vegas,2016:770-778.
[17]	MA Jiayi,MA Yong,LI Chang. Infrared and visible image fusion methods and applications:a survey[J]. Information Fusion,2019,45:153-178. DOI: 10.1016/j.inffus.2018.02.004
[18]	RAMACHANDRAM D,TAYLOR G W. Deep multimodal learning:a survey on recent advances and trends[J]. IEEE Signal Processing Magazine,2017,34(6):96-108. DOI: 10.1109/MSP.2017.2738401
[19]	HOU Qibin,ZHOU Daquan,FENG Jiashi. Coordinate attention for efficient mobile network design[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,Nashville,2021:13713-13722.
[20]	REN Shaoqing,HE Kaiming,GIRSHICK R,et al. Faster R-CNN:towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6):1137-1149. DOI: 10.1109/TPAMI.2016.2577031
[21]	WANG Xinlong,ZHANG Rufeng,KONG Tao,et al. SOLOv2:dynamic and fast instance segmentation[EB/OL]. [2023-09-12]. https://arxiv.org/abs/2003.10152.
[22]	CHEN Hao,SUN Kunyang,TIAN Zhi,et al. BlendMask:top-down meets bottom-up for instance segmentation[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,Seattle,2020:8570-8578.
[23]	HE Kaiming,GKIOXARI G,DOLLÁR P,et al. Mask R-CNN[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,2017,42(2):2980-2988.
[24]	HUANG Zhaojin,HUANG Lichao,GONG Yongchao,et al. Mask scoring R-CNN[C]. IEEE Conference on Computer Vision and Pattern Recognition,Washington,2019:6409-6418.
[25]	KE Lei,DANELLJAN M,LI Xia,et al. Mask transfiner for high-quality instance segmentation[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,New Orleans,2022:4402-4411.

施引文献(1)

期刊类型引用(1)

高志誉. 一种基于GIS平台的矿山智能管控平台构建与应用. 陕西煤炭. 2024(06): 138-143 .

百度学术

其他类型引用(0)

资源附件(0)

图(10) / 表(4)

计量

文章访问数: 690
HTML全文浏览量: 53
PDF下载量: 69
被引次数: 1

0. 引言
1. 系统架构
2. 系统关键技术
2.1 设备对象模型标准化
2.2 数据接入
2.3 数据融合
2.3.1 设备对象模型映射
2.3.2 数据治理
2.3.3 数据存储
2.4 数据共享接口
3. 系统应用
4. 结论

计算方式	准确率/%	每10万条数据计算用时/s
数据存储前计算	90	1
数据使用时计算	87	5

数据库	松散数据存储速率/（kbit·s⁻¹）	对象数据存储速率/（kbit·s⁻¹）
Redis	200	2 000
ClickHouse	100	5 000

数据库	松散数据查询速率/（kbit·s⁻¹）	对象数据查询速率/（kbit·s⁻¹）
Redis	1 000	4 000
ClickHouse	100	1 000

基于跨模态注意力融合的煤炭异物检测方法

作者简介: 曹现刚（1970—），男，山东莒南人，教授，博士，研究方向为设备健康维护与管理、机器人技术、煤矿机电装备智能化，E-mail：caoxg@xust.edu.cn

计量

出版历程

A coal foreign object detection method based on cross modal attention fusion

0. 引言

1. 系统架构

2. 系统关键技术

2.1 设备对象模型标准化

2.2 数据接入

2.3 数据融合

2.3.1 设备对象模型映射

2.3.2 数据治理

2.3.3 数据存储

2.4 数据共享接口

3. 系统应用

4. 结论

期刊类型引用(1)

其他类型引用(0)

计量

出版历程

目录

0. 引言

1. 系统架构

2. 系统关键技术

2.1 设备对象模型标准化

2.2 数据接入

2.3 数据融合

2.3.1 设备对象模型映射

2.3.2 数据治理

2.3.3 数据存储

2.4 数据共享接口

3. 系统应用

4. 结论

作者简介:
曹现刚（1970—），男，山东莒南人，教授，博士，研究方向为设备健康维护与管理、机器人技术、煤矿机电装备智能化，E-mail：caoxg@xust.edu.cn