基于CED−YOLOv5s模型的煤矸识别方法研究

何凯; 程刚; 王希; 葛庆楠; 张辉; 赵东洋

doi:10.13272/j.issn.1671-251x.2023090065

基于CED−YOLOv5s模型的煤矸识别方法研究

何凯^{1, 2,},
程刚^{1, 2, ,},
王希^{1, 2},
葛庆楠¹,
张辉^{1, 2},
赵东洋^{1, 2}

1.
安徽理工大学深部煤矿采动响应与灾害防控国家重点实验室，安徽淮南　232001
2.
安徽理工大学机械工程学院，安徽淮南　232001

基金项目: 安徽高校协同创新资助项目（GXXT-2021-076）。

详细信息

作者简介:
何凯（1998—），男，安徽滁州人，硕士研究生，研究方向为煤矸光电分选，E-mail：shuaikai1998@163.com

通讯作者:
程刚（1986—），男，安徽桐城人，副教授，研究方向煤矸光电分选与光机电一体化，E-mail：gang740@126.com。

中图分类号: TD67
计量
- 文章访问数: 639
- HTML全文浏览量: 64
- PDF下载量: 63
出版历程
- 收稿日期: 2023-09-19
- 修回日期: 2024-02-21
- 网络出版日期: 2024-03-03
- 刊出日期: 2024-02-24

Research on coal gangue recognition method based on CED-YOLOv5s model

HE Kai^{1, 2,},
CHENG Gang^{1, 2, ,},
WANG Xi^{1, 2},
GE Qingnan¹,
ZHANG Hui^{1, 2},
ZHAO Dongyang^{1, 2}

1.
State Key Laboratory of Mining Response and Disaster Prevention and Control in Deep Coal Mines, Anhui University of Science and Technology, Huainan 232001, China
2.
School of Mechanical Engineering, Anhui University of Science and Technology, Huainan 232001, China

摘要

摘要: 由于煤矿井下高噪声、低照度、运动模糊的复杂工况和煤矸易聚集现象，导致煤矸目标检测模型特征提取困难及煤矸分类、定位不准确问题。针对该问题，提出一种基于CED−YOLOv5s模型的煤矸识别方法。首先，在YOLOv5s主干网络中引入坐标注意力 (CA) 机制，通过将坐标信息嵌入信道关系和长程依赖关系中对特征图进行编码，充分利用通道注意力信息和空间注意力信息，使模型更加关注重要特征，抑制无用信息。其次，在YOLOv5s的检测头部引入EIoU回归损失函数，将目标框与锚框的宽高差异最小化，以增强目标的位置和边界信息，提高模型在密集目标下的定位精度和收敛速度；最后，在YOLOv5s的检测头部引入轻量化解耦头，解耦出单独的特征通道，分别用于分类任务和回归任务，解决了原模型中耦合头部分类任务与回归任务的相互干扰问题，进一步提升了模型的并行运算效率与检测精度。实验结果表明： CED−YOLOv5s模型与其他YOLO系列目标检测模型相比，综合性能最佳，平均检测精度达94.8%，相较于YOLOv5s模型提升了3.1%，检测速度达84.8 帧/s，可充分满足煤矿井下煤矸实时检测需求。
- 煤矸识别 /
- YOLOv5s /
- 坐标注意力 /
- 损失函数 /
- 轻量化解耦头 /
- 密集目标定位
Abstract: Due to the complex working conditions of high noise, low illumination, and blurred movement in coal mines underground, as well as the phenomenon of coal gangue easily gathering, it is difficult to extract features from coal gangue object detection models. The classification and positioning of coal gangue are inaccurate. In order to solve the above problems, a coal gangue recognition method based on the CED-YOLOv5s model is proposed. Firstly, the coordinate attention (CA) mechanism is introduced into the YOLOv5s backbone network, which encodes feature maps by embedding coordinate information into channel relationships and long-range dependencies. The method fully utilizes channel attention information and spatial attention information to make the model focus more on important features and suppress irrelevant information. Secondly, the EIoU regression loss function is introduced in the detection head of YOLOv5s to minimize the width and height difference between the object box and anchor box. It enhances the position and boundary information of the object, improves the positioning precision and convergence speed of the model in dense objects. Finally, a lightweight decoupling head is introduced in the detection head of YOLOv5s, decoupling separate feature channels for classification and regression tasks. It solves the interference problem between the coupling head part of the class task and the regression task in the original model, further improving the parallel operation efficiency and detection precision of the model. The experimental results show that the CED-YOLOv5s model has the best overall performance compared to other YOLO series object detection models. It has an average detection precision of 94.8%, an improvement of 3.1% compared to the YOLOv5s model, and a detection speed of 84.8 frames/s. The results can fully meet the real-time detection requirements of coal gangue in coal mines.
- coal gangue recognition /
- YOLOv5s /
- coordinate attention /
- loss function /
- lightweight decoupling head /
- dense object positioning

HTML全文

0. 引言

煤炭开采过程中夹杂的矸石不仅影响标煤的燃烧值，还会造成严重的环境污染^[1-2]，煤矸分选是提高煤质、高效利用煤炭资源、实现绿色开采的重要途经^[3-4]。《关于“十四五”大宗固体废弃物综合利用的指导意见》中提出要大力发展绿色矿业，推广应用矸石不出井模式，实现“煤矸石井下充填+地面回填”^[5-6]。煤矿井下煤矸分选及就地填充将是未来智慧矿山建设和绿色高效生产的发展趋势。受煤矿井下空间小、开采扰动大、环境恶劣等因素的影响，传统煤矸分选方式在煤矿井下的适用性较低且不宜推广。因此，研究煤矿井下智能化分选意义重大，而煤矸的分类、识别是实现井下智能化分选的重要前提。

目前国内外学者针对煤矸智能识别、分选展开了多方面研究。Pu Yuanyuan等^[7]基于迁移学习技术改进VGG16网络识别模型，优化了全连接层参数，减少了训练时间，但煤矸识别准确率较低。雷世威等^[8]通过改进加深YOLOv3模型的网络结构，增强了煤矸特征提取能力，提高了检测精度。徐志强等^[9]基于深度神经网络构建了煤矸图像识别模型，经剪枝优化后，减小了模型大小，同时提升了识别精度。郭永存等^[10]针对小目标煤矸样本提出一种融合迁移学习与结构优化的煤矸识别方法，构建了多尺度煤矸的高效识别模型。李博等^[11]通过采集模拟生产环境下煤矸图像样本数据，研究了光照、淋水、粉尘环境对煤矸石图像特征的影响。赵明辉^[12]提出了CornerNet Squeeze网络模型，依据图像灰度直方图的三阶矩阵特征参数进行煤矸分类，提高了存在背景干扰情况下的煤矸识别准确率。沈科等^[13]提出了一种改进YOLOv5s模型，提高了煤矸识别的速度和精度。张磊等^[14]采集选煤厂生产环境中的煤矸样本图像作为输入，通过对比实验发现5种基于YOLOv5s模型的改进算法在识别具有运动模糊、低照度特征的小目标煤矸图像时，识别精确率下降明显。

基于可见光成像的煤矸识别方法在获取煤矸图像时易受到光源、噪声、震动和物料表面等不确定因素影响。而在实际煤矿井下分选场景中，普遍存在高噪声、低照度、运动模糊等干扰因素，影响获取的煤矸图像质量，导致现有的煤矸可见光图像识别方法对图像中煤矸特征的提取能力急剧下降。此外，在煤矸输送过程中易出现煤矸目标聚集与粘连问题，进一步影响算法对煤矸目标分类与定位的准确性。

针对上述问题，本文在YOLOv5s模型的基础上进行改进，提出一种基于CED−YOLOv5s模型的煤矸石识别方法。通过引入坐标注意力（Coordinate Attention，CA）模块来提高模型在煤矿复杂背景中对目标关键特征的提取能力，采用EIoU边界损失函数和轻量化解耦头（Decoupled_Detect）来提高模型在目标聚集、背景干扰情况下的分类定位能力。

1. CED−YOLOv5s模型结构

YOLOv5s是一种单阶段目标检测模型，由输入端（Input）、主干网络（Backbone）、颈部网络（Neck）与检测头（Head）4个部分组成，具有检测速度快、灵活度高、模型易部署的特点。输入端主要进行图像数据增强、自适应锚框计算等预处理操作。主干网络采用CSP−Draknet53网络进行特征提取，主要由CBL、C3、快速空间金字塔池化（Spatial Pyramid Pooling-Fast，SPPF）3个子模块组成。其中CBL模块是由卷积层（Conv）、批量归一化层（Batch Normalization，BN）、SiLU激活函数组成的基本卷积单元，用于增强网络的非线性表达能力；C3模块由3个标准卷积层及多个BottleNeck模块组成，采用残差网络框架提升模型的特征提取能力和表达能力；SPPF模块由CBL模块及串行池化层组成，用于拼接不同感受野的特征图。颈部网络采用特征金字塔网络（Feature Pyramid Network，FPN）^[15]和路径聚合网络（Path Aggregation Network，PAN）^[16]双层架构进行特征融合。检测头使用3种不同尺度的检测层对大、中、小目标进行检测，并输出目标类别与目标框回归结果。

CED−YOLOv5s模型是在YOLOv5s的基础上进行了改进。首先，在主干网络中引入CA模块，提高模型在煤矿复杂背景中对目标关键特征的提取能力；然后，在检测头部分采用EIoU作为模型回归损失函数，以加快收敛速度，提升模型的检测性能和抗干扰能力；最后，使用轻量化的解耦头替换原模型的耦合头（Coupled_Detect），以提高模型的检测精度和抗干扰能力。CED−YOLOv5s模型结构如图1所示。

图 1 CED−YOLOv5模型结构

Figure 1. CED-YOLOv5 model structure

下载: 全尺寸图片幻灯片

2. YOLOv5s模型改进

2.1 特征提取模块改进

受到煤矿井下实际分选场景的复杂工况影响，所采集到的煤矸图像丢失了大量纹理特征信息，使得YOLOv5s的主干网络难以提取到煤矸的有效特征。为提高YOLOv5s模型对煤矸目标关键特征信息的提取能力，在其主干网络中引入CA机制^[17]。CA机制是一种高效的注意力机制，通过将坐标信息嵌入信道关系和长程依赖关系中对特征图进行编码。相较于传统注意力机制，CA机制能够充分利用通道注意力信息和空间注意力信息，使模型更加关注重要特征，抑制无用信息。CA模块结构如图2所示，C_r为聚合后的通道。

图 2 CA模块结构

Figure 2. Structure of coordinate attention

下载: 全尺寸图片幻灯片

对于输入尺寸为C×H×W（通道数×高×宽）的特征图，使用尺寸为（H，1）和（1，W）的池化核分别沿横轴X和纵轴Y对每一个通道进行编码，生成水平方向尺寸为C×H×1的特征图Z^w和竖直方向尺寸为C×1×W的特征图Z^h。

$$ z_c^h(h) = \frac{1}{W}\sum\limits_{0 \leqslant i \lt W} {{x_c}(h,i)} $$

(1)

$$ z_c^w(w) = \frac{1}{H}\sum\limits_{0 \leqslant j \lt H} {{x_c}(j,w)} $$

(2)

式中：$z_c^h(h)$，$z_c^w(w)$分别为高度变量h和宽度变量w在第c个通道的特征输出；${x_c}(h,i)$为输入特征第c个通道的第h行第i列的数值；${x_c}(j,w)$为输入特征第c个通道的第j行第w列的数值。

利用一维池化操作将生成的2个特征图在空间维度上进行特征聚合，生成一对方向可知的特征图，使得注意力模块在获取一个空间方向长程关系的同时，还保留另一个空间的空间位置信息。将2个空间方向的特征图进行拼接，使用1×1卷积函数F₁对通道数C进行压缩，归一化处理后，再通过非线性激活函数δ进行特征转化，得到特征图：

$$ {\boldsymbol{f}} = \delta ({F_1}([{z_c^h\left( h \right)},{z_c^w\left( w \right)}])) $$

(3)

将特征图ƒ沿空间维度再拆分为沿水平方向和竖直方向的特征图ƒ^h，ƒ^w，分别利用1×1卷积函数F_h和F_w将通道数扩展回C，再用Sigmoid激活函数$ \sigma $得到水平和竖直方向的特征张量g^h和g^w：

$$ {{\boldsymbol{g}}^h} = \sigma ({F_h}({{\boldsymbol{f}}^h})) $$

(4)

$$ {{\boldsymbol{g}}^w} = \sigma ({F_w}({{\boldsymbol{f}}^w})) $$

(5)

将输出的g^h和g^w分别扩展、相乘并作为注意力权重，再与输入特征I相乘，得到添加CA模块后的输出特征O：

$$ \boldsymbol{O}=\boldsymbol{I}\times\boldsymbol{g}^h\times\boldsymbol{g}^w $$

(6)

坐标注意力机制强调了水平与垂直方向的位置信息，使得特征提取网络能获得更大区域的信息，避免无效冗余信息对识别准确率的影响及更多的计算开销。

2.2 损失函数改进

边界框回归损失函数是目标检测中预测边界框与真实边界框之间差异的度量指标，在目标检测中起关键作用。YOLOv5s中采用CIoU函数作为回归损失函数^[18]，其考虑了预测框和目标框之间交并比、中心距离和宽高比等因素影响，相较于传统的损失函数有良好表现，但是依赖于边界框回归指标的聚合，无法准确描述真实框和预测框宽高之间的差异，易造成预测框回归不准确，降低网络模型的收敛性和训练效率。在井下实际分选场景中，煤矸石易发生聚集与粘连现象，使得YOLOv5s模型对煤矸目标的定位能力急剧下降。为解决该问题，本文采用EIoU函数^[19]代替CIoU函数，以增强目标的位置和边界信息，提升模型对煤矸石的定位精度。EIoU计算公式为

$${L_{{\mathrm{EIoU}}}} = {L_{{\mathrm{IoU}}}} + {L_{{\text{dis}}}} + {L_{{\text{asp}}}}= 1 - {U} + \frac{{{\rho ^2_1}}}{{{s^2}}} + \frac{{{\rho ^2_2}}}{{s_w^2}} + \frac{{{\rho ^2_3}}}{{s_h^2}} $$

(7)

式中：${L_{{\mathrm{IoU}}}}$，${L_{{\mathrm{dis}}}}$，${L_{{\mathrm{asp}}}}$分别为重叠损失、距离损失和宽高损失；${U}$为预测边界框与真实边界框的交并比；s，s_w，s_h分别为能包裹两框最小外接矩形的对角线长度、宽和高；$ \rho_1 $为预测边界框与真实边界框中心点距离；$ \rho_2 $为预测边界框与真实边界框的宽的差值；$ \rho_3 $为预测边界框与真实边界框的高的差值。

EIoU损失函数将目标框与锚框的宽高差异最小化，考虑了重叠面积、中心点距离及宽、高、边长的真实差异，使模型在回归过程中专注高质量锚框，加快模型收敛速度，使回归预测更精确，同时保持较强的抗干扰能力。

2.3 检测头改进

YOLOv5s模型中，检测头采用的是耦合头部，分类任务和回归任务以共享权重的方式实现。分类任务主要考虑的是煤矸样本间的差异，而回归任务考虑更多的是煤矸图像的边界信息。这种联合处理方式会造成分类任务和回归任务之间相互干扰^[20-21]，从而造成检测模型的性能损失。为解决耦合预测头中分类任务与回归任务的矛盾，提升井下实际分选场景中算法的定位能力和识别精度，本文参考YOLOX^[22]算法中的解耦头，并对其进行轻量化改进，解耦头可解耦出单独的特征通道，分别用于分类和回归任务。轻量化解耦头结构如图3所示。

图 3 解耦头结构

Figure 3. Decoupled head structure

下载: 全尺寸图片幻灯片

解耦头首先对不同维度的输入特征图进行1×1卷积，使得多个输入特征图获得相同的通道维度；将特征图输入2个并行分支中同步进行分类与回归任务，每个分支都包含2个用于特征提取的3×3卷积；通过1个1×1卷积进行通道整合，得到分类、回归和目标3个输出。解耦头将分类和回归任务解耦，解决了传统耦合头分类与回归任务间的冲突问题，但其新增了多个卷积模块，使得模型计算量大幅提升。针对该问题，本文在YOLOX解耦头基础上进行了精简设计：删除输入部分的1×1卷积模块，采用模型主干网络与颈部网络的宽度系数对解耦头的通道维度进行共同缩放；在分类与回归分支中各删除1个3×3卷积模块，以最大程度降低网络优化难度，在不增加计算成本的情况下提高检测性能。

3. 实验验证

3.1 数据集获取与预处理

通过煤矸图像采集实验台（图4）采集分辨率为2 448×2 048的不同大小和形态的煤矸组合图像，共获取原始图像617张。为模拟井下分选现场的复杂环境，提高算法的鲁棒性与泛化性，以旋转、添加噪声、图像模糊及亮度调节等方式进行数据增强，对原始数据集进行扩充，最终得到3 085张样本图像，使用Labelimg工具对图像进行标注，将标注好的图像按照8∶2的比例划分为训练集和验证集。

图 4 煤矸图像采集实验台

Figure 4. Experimental platform for coal gangue image acquisition

下载: 全尺寸图片幻灯片

3.2 模型训练

实验硬件设备为Intel（R） Xeon（R） Platinum 8350C CPU@2.60 GHz处理器，64 GiB内存，NVIDIA GeForce RTX 3090显卡，显存大小为24 GiB。软件环境为ubuntu20.04操作系统、python3.8、pytorch1.11.0深度学习框架，cuda版本为11.3。设定训练轮次为301，批量大小为32，图像输入尺寸为640×640，采用随机梯度下降法进行模型优化，以防止模型陷入局部最优解。此外，采用余弦学习率衰减方法，初始学习率为0.01。

3.3 评价指标

为验证改进模型的有效性，选用精确率P、召回率R、平均精度均值（mean Average Precision，mAP）、每秒传输帧数（Frames Per Second，FPS）、模型权值文件体积（Volume）和平均检测时间T作为评价指标。其中P，R，mAP用于衡量模型检测性能；Volume用于衡量模型复杂程度；FPS和T用于衡量实时检测速度。相关评价指标的计算公式为

$$ P = \frac{{{\mathrm{TP}}}}{{{\mathrm{TP}} + {\mathrm{FP}}}} $$

(8)

$$ R = \frac{{{\mathrm{TP}}}}{{{\mathrm{TP}} + {\mathrm{FN}}}} $$

(9)

$$ {\mathrm{AP}} = \int_0^1 {P(R){\mathrm{d}}R} $$

(10)

$$ {\mathrm{mAP}} = \frac{1}{n}\sum\limits_{k = 1}^n {{{\mathrm{AP}}_k}} $$

(11)

$$ {\mathrm{FPS}} = \frac{{1\;000}}{T} $$

(12)

式中：TP为检测结果为正的目标数；FP为误检为正确的目标数；FN为漏检的目标数；AP为平均精度；AP_k为第k个类别下的平均精度；n为总类别数。

3.4 消融实验

为验证各改进模块对YOLOv5s模型的性能影响，设计了消融实验，各组实验采用相同的超参数设置，消融实验结果见表1。模型A为原YOLOv5s网络模型，模型B在模型A基础上引入了CA模块，模型C在模型B的基础上引入了EIoU损失函数，模型D在模型C的基础上引入了轻量化解耦头结构。模型A−D的mAP迭代收敛曲线如图5所示。

表 1 消融实验结果

Table 1. Results of ablation experiments

模型	P/%	R/%	mAP/%	T/ms
A（YOLOv5s）	89.8	86.6	91.7	11.4
B（模型 A+CA）	91.0	88.8	93.2	9.8
C（模型 B+ EIoU）	91.6	88.2	93.9	10.0
D（模型 C+ Decoupled_ Detect）	91.7	90.9	94.8	11.8

下载: 导出CSV

| 显示表格

图 5 消融实验mAP曲线

Figure 5. mAP curves of ablation experiment

下载: 全尺寸图片幻灯片

1）模型A→模型B：将CA模块添加至YOLOv5s模型中，目的是提高对图像关键信息的提取能力，避免复杂的背景信息干扰。实验结果表明，引入CA机制后，模型B的mAP曲线在50轮迭代后逐渐上升并高于模型A的mAP曲线，mAP值从91.7%提升到93.2%，精确率P和召回率R分别提升了1.2%和2.2%，平均检测时间缩短了1.6 ms，检测精度和速度都有明显提升。

2）模型B→模型C：用EIoU损失函数替换YOLOv5s模型的CIoU损失函数，目的是提高模型的定位精度和预测框收敛速度。实验结果表明，引入EIoU损失函数后，模型C的mAP曲线收敛速度明显加快，在第75轮后逐渐上升并高于模型B的mAP曲线，mAP值从93.2%提升到93.9%，有效提高了算法模型的检测精度。

3）模型C→模型D：引入轻量化解耦头的目的是拆分分类任务与回归任务，解决二者间的计算冲突；删除部分卷积层的目的是避免因参数量过度增加而影响最终检测效率。实验结果表明，引入轻量化解耦头结构后，模型D的mAP曲线在50轮迭代后逐渐上升并高于模型C的mAP曲线，mAP值从93.9%提升到94.8%，检测速度与模型A基本保持一致，在不影响检测速度的前提下，进一步提升了检测精度。

3.5 对比实验

模型改进后，复杂程度相应增加，从而造成模型Volume增加和FPS降低，为进一步验证CED−YOLOv5s模型的有效性和性能优势，在相同的数据集与实验设备下，选用5种YOLO系列目标检测模型YOLOv5n，YOLOv5s，YOLOv5l，YOLOv7−tiny，YOLOv7与CED−YOLOv5s模型进行对比实验。

为了直观展示对比模型之间的实际检测效果，分别使用6种模型对正常、运动模糊、噪声与低照度4种工况环境下的煤矸聚集样本图像进行检测，并提供初始人工标注结果（图6）作为参考，图6中煤的表面呈现黑色光亮且具有少数裂纹，用红框标注，而矸石表面则暗淡粗糙且呈现黑灰色，用蓝框标注。对比实验结果见表2。

图 6 初始人工标注结果

Figure 6. Initial manual annotation results

下载: 全尺寸图片幻灯片

表 2 对比实验结果

Table 2. Comparative experimental results

模型	mAP/%	FPS	Volume /MiB
YOLOv5n	88.8	119.5	3.9
YOLOv5s	91.7	87.7	18.4
YOLOv5l	93.1	70.4	92.9
YOLOv7−tiny	89.1	88.5	12.3
YOLOv7	93.9	58.8	74.8
CED−YOLOv5s	94.8	84.8	24.6

下载: 导出CSV

| 显示表格

从检测精度、检测速度和复杂程度3个方面对6种检测模型进行对比。

1）检测精度：CED−YOLOv5s模型的mAP值为94.8%，在6种算法中最高，相较YOLOv5n，YOLOv5s，YOLOv5l，YOLOv7−tiny，YOLOv7分别高6%，3.1%，1.7%，5.7%，0.9%，表明CED−YOLOv5s模型的检测精度具有明显优势。

2）检测速度：CED−YOLOv5s与YOLOv5s模型的FPS相差不大，检测速度快于YOLOv5l和YOLOv7模型，能充分满足实时目标检测任务需求（≥60 帧/s）。此外，虽然YOLOv5n模型检测速度较快，但检测精度远低于CED−YOLOv5s模型，难以适应复杂工况下的煤矸分选任务。

3）复杂程度：CED−YOLOv5s模型相较于YOLOv5s使用了更复杂的结构，所以在权值文件大小上有少量提升。对比mAP较高的YOLOv5l与YOLOv7模型，CED−YOLOv5s模型权值文件大小仅为YOLOv5l与YOLOv7模型的26.5%和32.8%，而FPS为YOLOv5l与YOLOv7的120.5%和144.2%，优势较为明显。

选取部分检测结果进行可视化呈现，如图7所示。正常环境下，CED−YOLOv5s模型对煤和矸石的检测置信度得分较高，检测效果最佳。在噪声环境中，YOLOv5s与YOLOv7−tiny模型均出现预测回归框不准确现象，YOLOv5n模型出现了多处误检。在低照度环境中，YOLOv5l模型出现预测回归框不准确现象。在运动模糊环境中，YOLOv5s模型出现误检与预测回归框不准确现象，YOLOv7−tiny模型在多处出现了预测回归框不准确现象。而在上述复杂工矿环境的检测任务中，CED−YOLOv5s模型均未出现误检、漏检及预测回归框不准确的问题，且置信度得分整体较高。

图 7 不同算法在4种工况环境下的部分检测结果

Figure 7. Partial detection results of different algorithms under four operating conditions

下载: 全尺寸图片幻灯片

综合衡量不同的检测模型，CED−YOLOv5s模型在少量增加模型权值文件大小的前提下，获得了显著的精度提升，兼顾了检测精度与速度，具有较大的优势。

4. 结论

1）提出一种基于CED−YOLOv5s模型的煤矸石识别方法。通过引入CA机制，提高了煤矿井下复杂分选环境中煤矸关键特征的提取能力，提升了识别精度与速度；使用EIoU回归损失函数替换CIoU损失函数，提高了模型在煤矸目标聚集情况下的定位能力，从而提高了模型的收敛速度及边界框预测回归精度；将原模型的耦合头替换为轻量化解耦头，在兼顾检测速度的前提下，显著提高了复杂背景与煤矸聚集影响下的煤矸识别精度。

2）构建不同工况下的煤矸目标数据集，进行了消融实验与对比实验。消融实验结果表明，各改进模块对模型检测精度的提升均有贡献，CED−YOLOv5s模型的平均检测精度在YOLOv5s模型的基础上提升了3.1%。对比实验结果表明，与其他5种YOLO系列检测模型相比，CED−YOLOv5s模型对不同工况下的检测任务适应性最强，综合检测性能最佳。

图 1 CED−YOLOv5模型结构

Figure 1. CED-YOLOv5 model structure

下载: 全尺寸图片幻灯片

图 2 CA模块结构

Figure 2. Structure of coordinate attention

下载: 全尺寸图片幻灯片

图 3 解耦头结构

Figure 3. Decoupled head structure

下载: 全尺寸图片幻灯片

图 4 煤矸图像采集实验台

Figure 4. Experimental platform for coal gangue image acquisition

下载: 全尺寸图片幻灯片

图 5 消融实验mAP曲线

Figure 5. mAP curves of ablation experiment

下载: 全尺寸图片幻灯片

图 6 初始人工标注结果

Figure 6. Initial manual annotation results

下载: 全尺寸图片幻灯片

图 7 不同算法在4种工况环境下的部分检测结果

Figure 7. Partial detection results of different algorithms under four operating conditions

下载: 全尺寸图片幻灯片

表 1 消融实验结果

Table 1 Results of ablation experiments

模型	P/%	R/%	mAP/%	T/ms
A（YOLOv5s）	89.8	86.6	91.7	11.4
B（模型 A+CA）	91.0	88.8	93.2	9.8
C（模型 B+ EIoU）	91.6	88.2	93.9	10.0
D（模型 C+ Decoupled_ Detect）	91.7	90.9	94.8	11.8

下载: 导出CSV

表 2 对比实验结果

Table 2 Comparative experimental results

模型	mAP/%	FPS	Volume /MiB
YOLOv5n	88.8	119.5	3.9
YOLOv5s	91.7	87.7	18.4
YOLOv5l	93.1	70.4	92.9
YOLOv7−tiny	89.1	88.5	12.3
YOLOv7	93.9	58.8	74.8
CED−YOLOv5s	94.8	84.8	24.6

下载: 导出CSV

参考文献(22)

[1]	谢和平,任世华,谢亚辰,等. 碳中和目标下煤炭行业发展机遇[J]. 煤炭学报,2021,46(7):2197-2211. XIE Heping,REN Shihua,XIE Yachen,et al. Development opportunities of the coal industry towards the goal of carbon neutrality[J]. Journal of China Coal Society,2021,46(7):2197-2211.
[2]	王国法,刘峰,孟祥军,等. 煤矿智能化(初级阶段)研究与实践[J]. 煤炭科学技术,2019,47(8):1-36. WANG Guofa,LIU Feng,MENG Xiangjun,et al. Research and practice on intelligent coal mine construction(primary stage)[J]. Coal Science and Technology,2019,47(8):1-36.
[3]	王国法,刘峰,庞义辉,等. 煤矿智能化——煤炭工业高质量发展的核心技术支撑[J]. 煤炭学报,2019,44(2):349-357. WANG Guofa,LIU Feng,PANG Yihui,et al. Coal mine intellectualization:the core technology of high quality development[J]. Journal of China Coal Society,2019,44(2):349-357.
[4]	刘峰,曹文君,张建明. 持续推进煤矿智能化促进我国煤炭工业高质量发展[J]. 中国煤炭,2019,45(12):32-36. DOI: 10.3969/j.issn.1006-530X.2019.12.006 LIU Feng,CAO Wenjun,ZHANG Jianming. Continuously promoting the coal mine intellectualization and the high-quality development of China's coal industry[J]. China Coal,2019,45(12):32-36. DOI: 10.3969/j.issn.1006-530X.2019.12.006
[5]	王国法,任世华,庞义辉,等. 煤炭工业“十三五”发展成效与“双碳”目标实施路径[J]. 煤炭科学技术,2021,49(9):1-8. WANG Guofa,REN Shihua,PANG Yihui,et al. Development achievements of China's coal industry during the 13th Five-Year Plan period and future prospects[J]. Coal Science and Technology,2021,49(9):1-8.
[6]	刘峰,曹文君,张建明,等. 我国煤炭工业科技创新进展及“十四五”发展方向[J]. 煤炭学报,2021,46(1):1-15. LIU Feng,CAO Wenjun,ZHANG Jianming,et al. Current technological innovation and development direction of the 14^(th) Five-Year Plan period in China coal industry[J]. Journal of China Coal Society,2021,46(1):1-15.
[7]	PU Yuanyuan,APEL D B,SZMIGIEL A,et al. Image recognition of coal and coal gangue using a convolutional neural network and transfer learning[J]. Energies,2019,12(9). DOI: 10.3390/en12091735.
[8]	雷世威,肖兴美,张明. 基于改进YOLOv3的煤矸识别方法研究[J]. 矿业安全与环保,2021,48(3):50-55. LEI Shiwei,XIAO Xingmei,ZHANG Ming. Research on coal and gangue identification method based on improved YOLOv3[J]. Mining Safety & Environmental Protection,2021,48(3):50-55.
[9]	徐志强,吕子奇,王卫东,等. 煤矸智能分选的机器视觉识别方法与优化[J]. 煤炭学报,2020,45(6):2207-2216. XU Zhiqiang,LYU Ziqi,WANG Weidong,et al. Machine vision recognition method and optimization for intelligent separation of coal and gangue[J]. Journal of China Coal Society,2020,45(6):2207-2216.
[10]	郭永存,王希,何磊,等. 基于TW−RN优化CNN的煤矸识别方法研究[J]. 煤炭科学技术,2022,50(1):228-236. DOI: 10.3969/j.issn.0253-2336.2022.1.mtkxjs202201023 GUO Yongcun,WANG Xi,HE Lei,et al. Research on coal and gangue recognition method based on TW-RN optimized CNN[J]. Coal Science and Technology,2022,50(1):228-236. DOI: 10.3969/j.issn.0253-2336.2022.1.mtkxjs202201023
[11]	李博,王学文,庞尚钟,等. 煤与矸石图像特征分析及试验研究[J]. 煤炭科学技术,2022,50(8):236-246. LI Bo,WANG Xuewen,PANG Shangzhong,et al. Image characteristics analysis and experimental study of coal and gangue[J]. Coal Science and Technology,2022,50(8):236-246.
[12]	赵明辉. 一种煤矸石优化识别方法[J]. 工矿自动化,2020,46(7):113-116. ZHAO Minghui. A coal-gangue optimization identification method[J]. Industry and Mine Automation,2020,46(7):113-116.
[13]	沈科,季亮,张袁浩,等. 基于改进YOLOv5s模型的煤矸目标检测[J]. 工矿自动化,2021,47(11):107-111,118. SHEN Ke,JI Liang,ZHANG Yuanhao,et al. Research on coal and gangue detection algorithm based on improved YOLOv5s model[J]. Industry and Mine Automation,2021,47(11):107-111,118.
[14]	张磊,王浩盛,雷伟强,等. 基于YOLOv5s−SDE的带式输送机煤矸目标检测[J]. 工矿自动化,2023,49(4):106-112. ZHANG Lei,WANG Haosheng,LEI Weiqiang,et al. Coal gangue target detection of belt conveyor based on YOLOv5s-SDE[J]. Journal of Mine Automation,2023,49(4):106-112.
[15]	LIN T-Y,DOLLAR P,GIRSHICK R B,et al. Feature pyramid networks for object detection[C]. IEEE Conference on Computer Vision and Pattern Recognition,Honolulu,2017:936-944.
[16]	LIU Shu,QI Lu,QIN Haifang,et al. Path aggregation network for instance segmentation[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,Salt Lake City,2018:8759-8768.
[17]	HOU Qibin,ZHOU Daquan,FENG Jiashi. Coordinate attention for efficient mobile network design[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,Nashville,2021:13708-13717.
[18]	ZHENG Zhaohui,WANG Ping,LIU Wei,et al. Distance-IoU loss:faster and better learning for bounding box regression[EB/OL]. [2023-08-12]. https://arxiv.org/abs/1911.08287v1.
[19]	ZHANG Yifan,REN Weiqiang,ZHANG Zhang,et al. Focal and efficient IOU loss for accurate bounding box regression[J]. Neurocomputing,2022,506:146-157. DOI: 10.1016/j.neucom.2022.07.042
[20]	SONG Guanglu,LIU Yu,WANG Xiaogang. Revisiting the sibling head in object detector[EB/OL]. [2023-08-12]. https://arxiv.org/abs/2003.07540.
[21]	WU Yue,CHEN Yinpeng,YUAN Lu,et al. Rethinking classification and localization for object detection[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,Seattle,2020:10183-10192.
[22]	GE Zheng,LIU Songtao,WANG Feng,et al. YOLOX:exceeding YOLO series in 2021[EB/OL]. [2023-08-12]. https://arxiv.org/abs/2107.08430.

施引文献(3)

期刊类型引用(0)

其他类型引用(3)

资源附件(0)

图(7) / 表(2)

计量

文章访问数: 639
HTML全文浏览量: 64
PDF下载量: 63
被引次数: 3

0. 引言
1. CED−YOLOv5s模型结构
2. YOLOv5s模型改进
2.1 特征提取模块改进
2.2 损失函数改进
2.3 检测头改进
3. 实验验证
3.1 数据集获取与预处理
3.2 模型训练
3.3 评价指标
3.4 消融实验
3.5 对比实验
4. 结论

基于CED−YOLOv5s模型的煤矸识别方法研究

作者简介: 何凯（1998—），男，安徽滁州人，硕士研究生，研究方向为煤矸光电分选，E-mail：shuaikai1998@163.com

通讯作者: 程刚（1986—），男，安徽桐城人，副教授，研究方向煤矸光电分选与光机电一体化，E-mail：gang740@126.com。

计量

出版历程