基于YOLOv5s−FSW模型的选煤厂煤矸检测研究

燕碧娟, 王凯民, 郭鹏程, 郑馨旭, 董浩, 刘勇

燕碧娟,王凯民,郭鹏程,等. 基于YOLOv5s−FSW模型的选煤厂煤矸检测研究[J]. 工矿自动化,2024,50(5):36-43, 66. DOI: 10.13272/j.issn.1671-251x.2023100090
引用本文: 燕碧娟,王凯民,郭鹏程,等. 基于YOLOv5s−FSW模型的选煤厂煤矸检测研究[J]. 工矿自动化,2024,50(5):36-43, 66. DOI: 10.13272/j.issn.1671-251x.2023100090
YAN Bijuan, WANG Kaimin, GUO Pengcheng, et al. Research on coal gangue detection in coal preparation plant based on YOLOv5s-FSW model[J]. Journal of Mine Automation,2024,50(5):36-43, 66. DOI: 10.13272/j.issn.1671-251x.2023100090
Citation: YAN Bijuan, WANG Kaimin, GUO Pengcheng, et al. Research on coal gangue detection in coal preparation plant based on YOLOv5s-FSW model[J]. Journal of Mine Automation,2024,50(5):36-43, 66. DOI: 10.13272/j.issn.1671-251x.2023100090

基于YOLOv5s−FSW模型的选煤厂煤矸检测研究

基金项目: 山西省重点研发计划项目(202102010101010)。
详细信息
    作者简介:

    燕碧娟(1975—),女,山西芮城人,教授,博士,主要研究方向为智能矿山视觉感知关键技术,E-mail:tyustybj@tyust.edu.cn

  • 中图分类号: TD948.9

Research on coal gangue detection in coal preparation plant based on YOLOv5s-FSW model

  • 摘要: 针对现有煤矸检测模型存在的特征提取不充分、参数量大、检测精度低且实时性差等问题,提出了一种基于YOLOv5s−FSW模型的选煤厂煤矸检测方法。该模型在YOLOv5s的基础上进行改进,首先将主干网络的C3模块替换为FasterNet Block结构,通过降低模型的参数量和计算量提高检测速度;然后,在颈部网络引入无参型SimAM注意力机制,增强模型对复杂环境下重要目标的关注,进一步提高模型的特征提取能力;最后,在输出端用Wise−IoU替换CIoU边界框损失函数,使模型聚焦普通质量锚框,提高收敛速度和边框的检测精度。消融实验结果表明:与YOLOv5s模型相比,YOLOv5s−FSW模型的平均精度均值(mAP)提高了1.9%,模型权重减少了0.6 MiB,参数量减少了4.7%,检测速度提高了19.3%。对比实验结果表明:YOLOv5s−FSW模型的mAP达95.8%,较YOLOv5s−CBC,YOLOv5s−ASA,YOLOv5s−SDE模型分别提高了1.1%,1.5%和1.2%,较YOLOv5m,YOLOv6s模型分别提高了0.3%,0.6%;检测速度达36.4帧/s,较YOLOv5s−CBC,YOLOv5s−ASA模型分别提高了28.2%和20.5%,较YOLOv5m,YOLOv6s,YOLOv7模型分别提高了16.3%,15.2%,45.0%。热力图可视化实验结果表明:YOLOv5s−FSW模型对煤矸目标特征区域更加敏感且关注度更高。检测实验结果表明:在环境昏暗、图像模糊、目标相互遮挡的复杂场景下,YOLOv5s−FSW模型对煤矸目标检测的置信度得分高于YOLOv5s模型,且有效避免了误检和漏检现象的发生。
    Abstract: A coal gangue detection method in coal preparation plant based on YOLOv5s-FSW model is proposed to address the problems of insufficient feature extraction, large parameter quantity, low detection precision, and poor real-time performance in existing coal gangue detection models. This model is improved on the basis of YOLOv5s. Firstly, the C3 module in the Backbone section is replaced with a FasterNet Block structure, which improves detection speed by reducing the number of model parameters and computation. Secondly, in the Neck section, a parameter free SimAM attention mechanism is introduced to enhance the model's attention to important targets in complex environments, further improving the model's feature extraction capability. Finally, in the Prediction layer, the CIoU bounding box loss function is replaced with Wise-IoU, and the model focuses on ordinary quality anchor boxes to improve convergence speed and bounding box detection precision. The results of the ablation experiment indicate that compared with the YOLOv5s model, The mean average precision (mAP) of the YOLOv5s-FSW model has been improved by 1.9%, the model weight has been reduced by 0.6 MiB, the number of parameters has been reduced by 4.7%, and the detection speed has been improved by 19.3%. The comparative experimental results show that the YOLOv5s-FSW model has a mAP of 95.8%, which is 1.1%, 1.5%, and 1.2% higher compared to the YOLOv5s-CBC, YOLOv5s-ASA, and YOLOv5s-SDE models, respectively, and compared to YOLOv5m, YOLOv6s improved by 0.3%, 0.6% respectively. The detection speed of the YOLOv5s-FSW reaches 36.4 frames per second, which is 28.2% and 20.5% higher than the YOLOv5s-CBC and YOLOv5s-ASA models, respectively. Compared to YOLOv5m, YOLOv6s and YOLOv7, the detection speed of the YOLOv5s-FSW has increased by 16.3%, 15.2%, and 45.0%, respectively. The visualization experiment results of the thermal map show that the YOLOv5s-FSW model is more sensitive to the target feature areas of coal gangue and has higher attention. The detection experiment results show that in complex scenes with dim environments, blurred images, and mutual occlusion of targets, the YOLOv5s-FSW model has a higher confidence score for coal gangue target detection than the YOLOv5s model, and effectively avoids the occurrence of false positives and missed detection.
  • 近年来中国的能源结构正在逐步优化升级,但煤炭依然扮演着能源保障的核心角色[1-3]。在煤炭开采过程中不可避免地会混入煤矸,这不仅会降低煤炭品质,还会影响环境与生态,并有可能触发山体滑坡等灾害。因此,准确快速地识别煤矸是进行有效分拣的基础,也是选煤厂智能化选煤技术研究的一个焦点[4-5]。传统的煤矸分选技术包括人工分拣、射线法、重介法和跳汰分选法等,这些方法通常效率较低且易造成环境污染[6-9]。随着深度学习技术的进展,基于目标检测技术的物体识别方法开始在工业领域得到广泛应用。

    目前深度学习与煤矸检测结合的研究已取得一定的成果。蔡秀凡等[10]通过修改K−means初始锚框参数与增加一个检测通道,降低了小块煤矸漏检率与误检率,但检测结果的鲁棒性有待检验。来文豪等[11]选取多光谱系统中的3个波段创建煤矸图像数据集,并基于改进的YOLOv4模型检测煤矸,但模型检测时间偏长,影响了检测的实时性。高如新等[12]对YOLOv5s模型的损失函数进行优化,提高了边界框检测的准确率,但并未提升煤矸的检测速度。郑道能[13]引入空洞卷积替代tiny YOLOv3模型中部分卷积层,扩大模型感受野,提高了模型计算速度,但对检测小块煤矸不太友好。陈彪等[14]将YOLOX−S主干网络替换为Ghost−S结构,并用SIoU边界框损失函数代替原损失函数,提高了模型的特征提取能力和准确率,但没有解决复杂环境下煤矸检测精度较低的问题。桂方俊等[15]将YOLOv5m模型的Neck部分修改为双向特征金字塔结构,提高了模型的检测速度,但特征提取不充分,降低了煤矸的检测精度。张释如等[16]通过在YOLOv5s模型的Backbone中引入空洞卷积和残差块优化空间金字塔池化(Spatial Pyramid Pooling, SPP)模块结构,强化多尺度特征融合,提高了对小目标煤矸的检测精度,降低了煤矸识别的误检率和漏检率,但网络的参数较多,对模型的检测速度影响较大。张磊等[17]在YOLOv5s中将普通卷积替换为深度可分离卷积,显著降低了模型的参数量和计算量,提高了煤矸检测速度,但降低了模型的特征提取能力,影响了模型的检测精度。

    针对上述问题,本文提出了一种基于YOLOv5s−FSW模型的煤矸检测方法。首先,在主干网络中引入FasterNet Block结构,以减少模型的参数量和计算量,从而提高检测速度。然后,在颈部网络添加无参型SimAM注意力机制来提高模型的特征提取能力,特别是复杂环境中的煤矸检测精度。最后,采用Wise−IoU(Wise-Intersection over Union)损失函数替代CIoU(Complete Intersection over Union),以提高模型的收敛速度和边界框定位精度。

    YOLOv5共有YOLOv5n,YOLOv5s,YOLOv5m,YOLOv5l,YOLOv5x 5个版本,其网络结构主要由输入端(Input)、主干网络(Backbone)、颈部网络(Neck)、输出端(Prediction)4个部分组成[18-19]。输入端主要对输入数据进行预处理。主干网络通过一系列卷积层、池化层和快速空间金字塔池化(Spatial Pyramid Pooling-Fast,SPPF)对特征图进行不同尺度的特征提取和融合,以提升模型的检测精度。颈部网络通过自顶向下传递语义信息和自底向上传递位置信息进行不同特征的融合,提高模型检测能力。输出端输出计算得到的网络预测结果。从YOLOv5n开始,模型的检测精度逐步提高,但模型深度和模型宽度也在依次增大,导致模型复杂度和参数量增大,影响了检测速度。由于采煤和运煤现场大都为算力较低的嵌入式设备,难以满足部署大模型的条件。综合对模型检测精度、速度及算力的考虑,本文选用YOLOv5s作为基础模型。

    YOLOv5s−FSW模型是在YOLOv5s基础上改进而来,其网络结构如图1所示。将主干网络中的部分C3模块替换为FasterNet Block结构,降低参数量和计算量。在颈部网络添加SimAM注意力机制,使模型聚焦目标有效特征,降低对无关信息的关注度。在输出端采用Wise−IoU替换CIoU边界框损失函数,提高模型的定位精度和收敛速度。

    图  1  YOLOv5s−FSW网络结构
    Figure  1.  YOLOv5s-FSW network structure

    在YOLOv5s中,主干网络主要包括Conv模块、SPPF模块、C3模块。Conv模块包括卷积(Conv2d)层、批量归一化(Batch Normalization,BN)层和SILU激活函数;SPPF模块可处理输入图像并获得多尺度的特征表示;C3模块可增加网络的深度和感受野,提高模型的特征提取能力,但C3模块的参数量较大、计算复杂度高,影响模型检测速度,难以满足选煤厂煤矸检测任务的实时性要求。因此,本文采用FasterNet Block结构[20]替换主干网络中部分C3模块,通过降低内存访问量和计算量来提升模型的检测速度。

    FasterNet Block为由1个部分卷积(Partial Convolution,PConv)层和2个逐点卷积(Point−Wise Convolution,PWConv)层组成的倒置残差块结构,如图2所示,其中*为卷积运算。FasterNet Block结构通过PConv层对输入特征的部分通道进行空间特征提取,维持其余通道不变,并将首个或尾个连续通道作为整个特征图的表征进行计算,在保证一般性的同时,维持输入和输出特征的通道数一致。PConv层通过减少冗余计算和内存访问实现降低计算量,从而提高模型计算速度和运行速度。为充分利用不同通道的所有信息,在PConv层后引入2个PWConv层对特征通道进行操作,第1个PWConv层用于减少特征图的通道数,降低计算成本,第2个PWConv层用于恢复特征通道数,并将空间信息和通道信息融合,以提高网络的表达能力。为保证模型的特征多样性并实现更低的延迟,将BN层和ReLU激活函数放置在2个PWConv层之间,以提高模型性能。

    图  2  FasterNet Block结构
    Figure  2.  FasterNet Block structure

    FasterNet Block中PConv层的计算量为

    $$ F = h w {k^2} c_{\mathrm{p}}^2 $$ (1)

    式中:hw分别为输入特征图的高和宽;k为PConv层的卷积核大小;cp为PConv层作用于输入特征图的通道数,cp通常取输入特征图通道数c的1/4,此时PConv层的计算量为常规卷积的1/16,同时内存访问量仅为常规卷积的1/4,其内存访问量为

    $$ f=2h w {c_{\mathrm{p}}} + {k^2} c_{\mathrm{p}}^2 \approx 2h w {c_{\mathrm{p}}}$$ (2)

    YOLOv5s提取输入图像特征时无法对不同的通道信息实行不同程度的关注,影响模型的检测精度。煤矸检测任务中目标之间特征差异小,尤其在选煤厂、煤矿井下等复杂场景中目标与背景区分度小,影响模型对煤矸目标的特征提取能力,导致模型检测精度低,甚至出现误检、漏检的现象。本文在颈部网络中添加注意力机制以增强模型的特征提取能力。深度学习中的注意力机制是一种常用的数据处理技术,通过从众多信息中选出对当前任务最关键的信息并抑制不相关的次要信息,增强网络的特征提取能力,提升模型识别的效率和准确率。常见的注意力机制如压缩和激励注意力机制(Squeeze-and-Excitation,SE)[21]、卷积块注意力机制(Convolutional Block Attention Module,CBAM)[22]和高效通道注意力机制(Efficient Channel Attention,ECA)[23]等均是基于通道维度或空间维度进行权重分配,且会在网络中带入额外的参数,既限制了注意力权重学习的灵活性,又增加了网络结构的复杂性。与传统的通道注意力和空间注意力相比,SimAM注意力机制在不向网络添加参数的情况下,可根据能量函数直接计算特征图的三维权重,其原理如图3所示[24]

    图  3  SimAM注意力机制
    Figure  3.  SimAM attention mechanism

    SimAM通过计算神经元的能量函数,为每个神经元分配唯一权重,以度量目标神经元和其他神经元的线性可分性,从而找到含有最大信息量的神经元,并依据神经元的重要性实现注意力权重的计算,具体的神经元能量函数为

    $$ e_t^* = \frac{{4\left( {{{\hat \sigma }^2} + \lambda } \right)}}{{{{(t - \hat \mu )}^2} + 2{{\hat \sigma }^2} + 2\lambda }} $$ (3)

    式中:$ \hat{\sigma } $2和$ \hat{\mu } $分别为当前通道所有神经元的方差和均值;λ为超参数;t为输入特征的目标神经元。

    $$ \hat \mu = \frac{1}{M}\sum\limits_{i = 1}^M {{x_i}} $$ (4)
    $$ {\hat \sigma ^2} = \frac{1}{M}\sum\limits_{i = 1}^M {{{\left( {{x_i} - \hat \mu } \right)}^2}} $$ (5)

    式中:M为当前通道上所有神经元个数;xi为输入特征目标神经元的第i个相邻神经元。

    由式(3)可知,$e_t^* $越小,目标神经元与其相邻神经元的差异越明显,表明该目标神经元的重要性越高,其重要性可由1/$e_t^* $表示。对输入特征进行增强处理。

    $$ \widetilde {\boldsymbol{X}} = {\text{Sigmoid}}\left(\frac{1}{{\boldsymbol{E}}}\right) \odot {\boldsymbol{X}} $$ (6)

    式中:$ \widetilde{{\boldsymbol{X}}} $为通过Sigmoid函数限制注意力权重的异常值后与输入特征相乘得到的增强特征;E为每个通道维度上的能量函数矩阵;⊙为点积运算;X为输入特征。

    目标检测中通常使用交并比(Intersection over Union,IoU)[25]判断网络预测框的准确性,但IoU无法体现预测框和真实框之间的距离信息及长宽比的相似性。YOLOv5s以CIoU为边界框损失函数[26]。CIoU使用预测框和真实框的宽高比作为惩罚项,并考虑了边界框回归时重叠面积、中心点距离及长宽比3个重要因素,使模型在边界框回归时不仅只关注边界框的大小,还关注边界框的形状,有助于更准确地定位目标的边界,但计算复杂,且默认样本的质量较高,导致模型收敛速度较慢、泛化能力较差,阻碍了模型的优化。由于煤矸目标与背景相似,且存在相互重叠与遮挡等问题,人工标注图像数据时难免会产生一些低质量标注框,影响模型的检测精度与稳定性。若低质量样本较多,一味地增强边界框回归会使模型检测性能下降。因此本文在输出端采用Wise−IoU[27]边界框损失函数(式(7))代替CIoU。Wise−IoU引入了动态聚焦机制,并能根据当前情况计算出最适合的梯度增益分配策略,通过离群度判断锚框的质量,给高质量和低质量锚框分配较小的梯度增益,从而使模型更加关注普通质量的锚框,整体提高模型的检测性能。

    $$ {{L}_{{\mathrm{WIoU}}}} = r{{R}_{{\mathrm{WIoU}}}}{\mathcal{L}_{{\mathrm{IoU}}}} $$ (7)
    $$ r = \frac{\beta }{{\delta {\alpha ^{\beta - \delta }}}} $$ (8)
    $$ {{R}_{{\mathrm{WIoU}}}} = {\mathrm{exp}}\left( {\frac{{{{\left( {x - {x_{{\mathrm{gt}}}}} \right)}^2} + {{\left( {y - {y_{{\mathrm{gt}}}}} \right)}^2}}}{{{{\left( {W_{\mathrm{g}}^2 + H_{\mathrm{g}}^2} \right)}^*}}}} \right) $$ (9)

    式中:${{L}_{{\mathrm{WIoU}}}} $为动态损失函数;r为非单调聚焦系数;RWIoU为权重系数惩罚项;$ {\mathcal{L}}_{{\mathrm{IoU}}} $为预测框和标注框重叠面积的IoU;β为描述锚框质量的离群度因子,$ \beta = \dfrac{{\mathcal{L}_{{\mathrm{IoU}}}^*}}{{ {{\overline{\mathcal{L}}_{{\mathrm{IoU}}}}} }} \in [0, + \infty ) $,$ \mathcal{L}_{{\mathrm{IoU}}}^* $为预测框和真实框之间的IoU阈值,$ {\overline{\mathcal{L}}_{{\mathrm{IoU}}}} $为$ {\mathcal{L}}_{{\mathrm{IoU}}} $的均值;δ和$ \alpha $为超参数;(xy)为预测框的中心点坐标;(xgtygt)为标注框的中心点坐标;WgHg分别为预测框和标注框最小外接矩形的宽和高。

    将式(8)和式(9)代入式(7)得

    $$ {{L}_{{\mathrm{WIoU}}}} = \frac{\beta }{{\delta {\alpha ^{\beta - \delta }}}}{\mathrm{exp}}\left( {\frac{{{{\left( {x - {x_{{\mathrm{gt}}}}} \right)}^2} + {{\left( {y - {y_{{\mathrm{gt}}}}} \right)}^2}}}{{{{\left( {W_{\mathrm{g}}^2 + H_{\mathrm{g}}^2} \right)}^*}}}} \right){\mathcal{L}_{{\mathrm{IoU}}}} $$ (10)

    为验证模型的有效性,在山西大同某煤矿井下现场和煤炭仿真实验室共采集1 263张分辨率为1 280×960的煤矸图像。图像目标中包括单块煤、单块矸石及多块煤与矸石相互遮挡等场景。为确保数据集的质量和可用性,删除不清晰及质量较差的图像,将剩余的1 133张煤矸图像用LabelImg软件进行标注,并保存为煤矸数据集,如图4所示。将自制数据集按照8∶1∶1的比例划分为训练集、验证集和测试集,其中训练集918张、验证集106张、测试集109张。为了加快训练速度,将数据集分辨率统一调整为640×480。

    图  4  数据集示例
    Figure  4.  Dataset example

    煤矸目标检测实验使用的操作系统为Windows 11,CPU为Intel(R) Xeon(R) E5−2686 v4,显卡为NVIDIA GeForce RTX 3060,显存为12 GiB。深度学习框架为PyTorch1.13.1,CUDA版本为11.6,Python版本为3.8.10。实验模型训练参数设置如下:学习率初始值为0.01,学习率周期为0.2,动量因子为0.937,权重衰减系数为0.000 5,批处理大小为32,迭代次数为300。

    为了观察模型各组件的重要性和贡献度,利用测试集进行消融实验。为了保证实验的一致性,各改进模型除了改进部分有所不同,其余部分相对YOLOv5s基础模型保持不变。改进模型1为采用FasterNet Block结构替换YOLOv5s主干网络的部分C3模块;改进模型2为在YOLOv5s的颈部网络添加SimAM注意力机制;改进模型3为用Wise−IoU代替CIoU边界框损失函数,实验结果见表1

    表  1  消融实验结果
    Table  1.  Ablation experiment results
    模型 精确率/% 召回率/% mAP/% 权重/MiB 计算量 参数量/105 检测速度/(帧·s−1
    YOLOv5s 89.9 88.6 93.9 13.7 15.8 70.2 30.5
    改进模型1 89.6 85.1 93.5 13.1 14.3 66.9 37.8
    改进模型2 89.9 89.1 94.2 13.7 15.8 70.2 29.1
    改进模型3 91.1 89.7 95.3 13.7 15.8 70.2 28.3
    YOLOv5s−FSW 91.8 90.1 95.8 13.1 14.3 66.9 36.4
    下载: 导出CSV 
    | 显示表格

    表1可看出,改进模型1的参数量、权重、计算量较YOLOv5s分别减少了4.7%,4.4%,9.5%,检测速度较YOLOv5s提高了23.9%,但模型的平均精度均值(mean Average Precision,mAP)较YOLOv5s降低了0.4%,这是由于将主干网络部分C3模块替换为FasterNet Block结构后,降低了冗余计算量和内存访问量,参数量和计算量下降,提高了模型的检测速度,但模型的检测精度略微下降。改进模型2的召回率、mAP较YOLOv5s分别提升了0.5%,0.3%,检测速度较YOLOv5s降低了4.6%,这是由于颈部网络添加SimAM注意力机制,在不增加参数量和计算量的情况下,模型能聚焦特征差异,准确地捕捉特征间的交互信息,增强网络特征提取能力,提高了模型的检测精度。改进模型3的精确率、召回率、mAP较YOLOv5s分别提高了1.2%,1.1%,1.4%,说明采用Wise−IoU代替CIoU边界框损失函数,模型聚焦普通质量的锚框回归,提高了模型定位精度、收敛速度和稳定性。YOLOv5s−FSW模型的参数量、权重、计算量较YOLOv5s分别减少了4.7%,4.4%,9.5%,mAP、检测速度较YOLOv5s分别提高了1.9%,19.3%,表明YOLOv5s−FSW模型降低了参数量和计算量,提高了检测精度和检测速度,更加适合选煤厂复杂环境下的煤矸检测任务。

    为进一步验证YOLOv5s−FSW模型对煤矸的检测性能,在同一实验环境下设置了对比实验。对比实验的检测模型选取YOLOv5算法变体YOLOv5s−CBC[12]、YOLOv5s−ASA[16]、YOLOv5s−SDE[17]及主流目标检测模型YOLOv5m,YOLOv6s,YOLOv7。YOLOv5s−CBC模型在主干网络中添加CBAM注意力机制,颈部网络采用BiFPN结构,使用CIoU替换DIoU(Distance Intersection over Union,距离交并比)损失函数;YOLOv5s−ASA模型使用残差ASPP(Atrous Spatial Pyramid Pooling,空洞空间金字塔池化)模块替换SPP模块,AdaBelief优化算法代替Adam优化算法;YOLOv5s−SDE模型在主干网络中添加SE注意力模块,在颈部网络用深度可分离卷积替换普通卷积,然后将CIoU损失函数替换为EIoU。在同一实验环境下对各目标检测模型进行多轮训练和测试,对比实验结果见表2

    表  2  不同检测模型性能对比
    Table  2.  Performance comparison of different detection models
    模型 mAP/% 权重/MiB 计算量 检测速度/(帧·s−1
    YOLOv5s−CBC 94.7 15.3 15.9 28.4
    YOLOv5s−ASA 94.3 13.4 15.6 30.2
    YOLOv5s−SDE 94.6 12.7 12.1 37.8
    YOLOv5s 93.9 13.7 15.8 30.5
    YOLOv5m 95.5 40.2 47.9 31.3
    YOLOv6s 95.2 38.7 45.2 31.6
    YOLOv7 96.1 71.3 105.2 25.1
    YOLOv5s−FSW 95.8 13.1 14.3 36.4
    下载: 导出CSV 
    | 显示表格

    表2可看出,YOLOv5s−FSW模型的mAP较YOLOv5s−CBC、YOLOv5s−ASA、YOLOv5s−SDE模型分别提高了1.1%、1.5%和1.2%,但计算量较YOLOv5s−SDE模型增大了18.2%,检测速度降低了3.7%,YOLOv5s−FSW模型的计算量较YOLOv5s−CBC和YOLOv5s−ASA模型分别减少了10.1%和8.3%,检测速度分别提高了28.2%和20.5%;YOLOv5s−FSW模型的mAP较YOLOv5m,YOLOv6s模型分别提高了0.3%,0.6%,检测速度分别提高了16.3%与15.2%,权重分别减少了27.1,25.6 MiB,计算量分别减少了70.1%与68.4%。与YOLOv7模型对比,虽然YOLOv5s−FSW模型的mAP降低了0.3%,但权重减少了58.2 MiB,计算量减少了86.4%,检测速度提高了45.0%。对比实验结果表明,针对类似改进YOLOv5模型及其他YOLO模型变体,本文提出的YOLOv5s−FSW模型在检测精度和检测速度上性能更加均衡,满足选煤厂煤矸检测需求。

    为了直观地展现模型对煤矸目标检测区域的关注度,本文分别采用YOLOv5s模型与YOLOv5s−FSW模型融合Grad−CAM算法对煤矸测试图像进行热力图可视化实验,分析模型对煤矸目标检测区域的关注,结果如图5所示。红色高亮区域表示模型提取煤矸目标特征时重点关注的区域,煤矸表面红色高亮区域颜色越深、覆盖越广,表示模型对煤矸目标区域的关注度越高。从图5可看出,YOLOv5s−FSW模型较YOLOv5s模型对煤矸目标特征区域更加敏感,且关注度更高。

    图  5  模型改进前后煤矸热力图结果对比
    Figure  5.  Comparison of thermal map results of coal-gangue before and after model improvement

    为了进一步验证YOLOv5s−FSW模型的检测实用性,收集了山西大同某煤矿井下现场拍摄的煤矸图像,并与从实验室采集的测试集图像中挑选出具有代表性的煤矸图像分别对YOLOv5s和YOLOv5s−FSW模型进行测试。本文所用的测试图像包括环境昏暗、图像模糊、目标相互遮挡3种复杂场景,模型检测效果如图6所示。可看出在环境昏暗的场景下,图像中有2块矸石和3块煤,YOLOv5s模型对煤的检测精度偏低(置信度得分小于0.8),且出现了1块煤误检为矸石(置信度得分为0.37)和漏检1块煤的情况,而YOLOv5s−FSW模型正确检测出了全部煤和矸石目标,且置信度得分较高;在图像模糊的场景下,图像中有2块矸石和2块煤,YOLOv5s模型漏检了1块煤,而YOLOv5s−FSW模型正确检测出了煤和矸石目标,且置信度得分高于YOLOv5s模型;在目标相互遮挡的场景下,图像中的目标都为煤,虽然YOLOv5s模型正确检测出了全部目标,但有一半目标数量的置信度得分小于0.9,而YOLOv5s−FSW模型不但检测出了全部目标,而且置信度得分大于0.94。综合上述分析可知,YOLOv5s−FSW模型在引入SimAM注意力机制、使用Wise−IoU损失函数后,增强了模型对复杂场景的抗干扰能力和特征提取能力,使其能够在选煤厂环境昏暗、图像模糊、目标相互遮挡等复杂场景下展现良好的检测性能,避免了误检与漏检现象的发生。

    图  6  模型改进前后煤矸检测效果对比
    Figure  6.  Comparison of coal-gangue detection results before and after model improvement

    1) 为解决煤矸检测精度低与速度慢的问题,提出了一种基于YOLOv5s−FSW模型的煤矸检测方法。在YOLOv5s的主干网络融合FasterNet Block模块,模型参数量和计算量分别降低了4.7%与9.5%,模型权重减少了4.4%,检测速度提高了23.9%;颈部网络引入无参型SimAM注意力机制,使模型聚焦煤矸目标特征的关键信息,模型mAP提高了0.3%;输出端用Wise−IoU代替CIoU边界框损失函数,使模型聚焦普通质量的锚框回归,提高了煤矸预测框的定位精度,mAP提高了1.4%,增强了模型的鲁棒性。

    2) 与同类型改进模型相比,YOLOv5s−FSW模型的mAP较YOLOv5s−CBC,YOLOv5s−ASA,YOLOv5s−SDE模型分别提高了1.1%,1.5%,1.2%。与YOLOv5s模型相比,YOLOv5s−FSW模型的精确率达到91.8%,mAP提高了1.9%,检测速度提高了19.3%,参数量减少了4.7%,模型权重降低了4.4%。与YOLOv5m与YOLOv6s模型相比,YOLOv5s−FSW模型的mAP和检测速度均有提高,参数量、计算量和模型权重有所下降;与YOLOv7相比,虽然YOLOv5s−FSW模型的mAP降低了0.3%,但计算量减少了86.4%,检测速度提高了45.0%,模型权重减少了58.2 MiB,仅为13.1 MiB,有利于模型的快速移植和部署。

    3) 热力图对比实验和煤矸石检测实验分别显示:YOLOv5s−FSW模型对煤矸目标特征区域更加敏感且关注度更高;在环境昏暗、图像模糊、目标相互遮挡的复杂场景下,采用YOLOv5s−FSW模型进行煤矸目标检测的置信度得分均高于YOLOv5s模型,并有效避免了误检和漏检现象的发生,表现出良好的检测性能。

  • 图  1   YOLOv5s−FSW网络结构

    Figure  1.   YOLOv5s-FSW network structure

    图  2   FasterNet Block结构

    Figure  2.   FasterNet Block structure

    图  3   SimAM注意力机制

    Figure  3.   SimAM attention mechanism

    图  4   数据集示例

    Figure  4.   Dataset example

    图  5   模型改进前后煤矸热力图结果对比

    Figure  5.   Comparison of thermal map results of coal-gangue before and after model improvement

    图  6   模型改进前后煤矸检测效果对比

    Figure  6.   Comparison of coal-gangue detection results before and after model improvement

    表  1   消融实验结果

    Table  1   Ablation experiment results

    模型 精确率/% 召回率/% mAP/% 权重/MiB 计算量 参数量/105 检测速度/(帧·s−1
    YOLOv5s 89.9 88.6 93.9 13.7 15.8 70.2 30.5
    改进模型1 89.6 85.1 93.5 13.1 14.3 66.9 37.8
    改进模型2 89.9 89.1 94.2 13.7 15.8 70.2 29.1
    改进模型3 91.1 89.7 95.3 13.7 15.8 70.2 28.3
    YOLOv5s−FSW 91.8 90.1 95.8 13.1 14.3 66.9 36.4
    下载: 导出CSV

    表  2   不同检测模型性能对比

    Table  2   Performance comparison of different detection models

    模型 mAP/% 权重/MiB 计算量 检测速度/(帧·s−1
    YOLOv5s−CBC 94.7 15.3 15.9 28.4
    YOLOv5s−ASA 94.3 13.4 15.6 30.2
    YOLOv5s−SDE 94.6 12.7 12.1 37.8
    YOLOv5s 93.9 13.7 15.8 30.5
    YOLOv5m 95.5 40.2 47.9 31.3
    YOLOv6s 95.2 38.7 45.2 31.6
    YOLOv7 96.1 71.3 105.2 25.1
    YOLOv5s−FSW 95.8 13.1 14.3 36.4
    下载: 导出CSV
  • [1] 金智新,曹孟涛,王宏伟. “中等收入”与新“双控”背景下煤炭行业转型发展新机遇[J]. 煤炭科学技术,2023,51(1):45-58.

    JIN Zhixin,CAO Mengtao,WANG Hongwei. New opportunities for coal industry transformation and development under the background of the level of a moderately developed country and a new "dual control" system[J]. Coal Science and Technology,2023,51(1):45-58.

    [2] 李君清,李寅琪. 煤炭产业经济走势及煤炭企业对策研究[J]. 中国煤炭,2023,49(3):16-22. DOI: 10.3969/j.issn.1006-530X.2023.03.003

    LI Junqing,LI Yinqi. Study on the development trend of coal industry economy and countermeasures of coal enterprises[J]. China Coal,2023,49(3):16-22. DOI: 10.3969/j.issn.1006-530X.2023.03.003

    [3] 周宏春. 新型能源体系破解能源保供与降碳双重压力研究与探讨[J]. 中国煤炭,2023,49(5):1-10. DOI: 10.3969/j.issn.1006-530X.2023.05.001

    ZHOU Hongchun. Research and discussion on breaking the dual pressure of energy supply guarantee and carbon reduction by the new energy system[J]. China Coal,2023,49(5):1-10. DOI: 10.3969/j.issn.1006-530X.2023.05.001

    [4] 朱吉茂,孙宝东,张军,等. “双碳”目标下我国煤炭资源开发布局研究[J]. 中国煤炭,2023,49(1):44-50. DOI: 10.3969/j.issn.1006-530X.2023.01.006

    ZHU Jimao,SUN Baodong,ZHANG Jun,et al. Research on China's coal resources development layout under the goals of carbon peak and carbon neutrality[J]. China Coal,2023,49(1):44-50. DOI: 10.3969/j.issn.1006-530X.2023.01.006

    [5] 唐珏,王俊. “双碳”目标下煤炭发展及对策建议[J]. 中国矿业,2023,32(9):22-31. DOI: 10.12075/j.issn.1004-4051.20230483

    TANG Jue,WANG Jun. Coal development and countermeasures under the carbon peaking and carbon neutrality goals[J]. China Mining Magazine,2023,32(9):22-31. DOI: 10.12075/j.issn.1004-4051.20230483

    [6] 郭静,李磊,李志明. 干法选煤技术创新进展及其节能节水降污效果分析[J]. 中国煤炭,2022,48(5):68-75. DOI: 10.3969/j.issn.1006-530X.2022.05.012

    GUO Jing,LI Lei,LI Zhiming. Innovation progress of dry coal preparation technology and analysis of its effect of energy saving,water saving and pollution reduction[J]. China Coal,2022,48(5):68-75. DOI: 10.3969/j.issn.1006-530X.2022.05.012

    [7] 刘志杰. 重介洗煤技术在选煤厂的应用[J]. 能源与节能,2023(7):136-138. DOI: 10.3969/j.issn.2095-0802.2023.07.036

    LIU Zhijie. Application of heavy medium coal washing technology in coal preparation plant[J]. Energy and Energy Conservation,2023(7):136-138. DOI: 10.3969/j.issn.2095-0802.2023.07.036

    [8]

    ZHANG Ningbo,LIU Changyou. Radiation characteristics of natural gamma-ray from coal and gangue for recognition in top coal caving[J]. Scientific Reports,2018,8(1):190. DOI: 10.1038/s41598-017-18625-y

    [9] 韩子彬,王丽宏,申志刚,等. 基于X射线分选方法在选煤厂中的应用[J]. 煤炭科学技术,2022,50(增刊1):327-332.

    HAN Zibin,WANG Lihong,SHEN Zhigang,et al. Application of X-ray separation method in coal preparation plant[J]. Coal Science and Technology,2022,50(S1):327-332.

    [10] 蔡秀凡,谢金辰. YOLOv4煤矸石检测方法研究[J]. 煤炭工程,2022,54(8):157-162.

    CAI Xiufan,XIE Jinchen. YOLOv4-based detection method of coal and gangue[J]. Coal Engineering,2022,54(8):157-162.

    [11] 来文豪,周孟然,胡锋,等. 基于多光谱成像和改进YOLOv4的煤矸石检测[J]. 光学学报,2020,40(24):72-80.

    LAI Wenhao,ZHOU Mengran,HU Feng,et al. Coal gangue detection based on multi-spectral imaging and improved YOLOv4[J]. Acta Optica Sinica,2020,40(24):72-80.

    [12] 高如新,常嘉浩,杜亚博,等. 基于改进YOLOv5s的煤矸石目标检测算法[J]. 电子测量技术,2023,46(13):95-101.

    GAO Ruxin,CHANG Jiahao,DU Yabo,et al. Coal gangue target detection algorithm based on improved YOLOv5s[J]. Electronic Measurement Technology,2023,46(13):95-101.

    [13] 郑道能. 一种改进的tiny YOLOv3煤矸石快速识别模型[J]. 工矿自动化,2023,49(4):113-119.

    ZHENG Daoneng. An improved tiny YOLOv3 rapid recognition model for coal-gangue[J]. Journal of Mine Automation,2023,49(4):113-119.

    [14] 陈彪,卢兆林,代伟,等. 基于轻量化HPG−YOLOX−S模型的煤矸石图像精准识别[J]. 工矿自动化,2022,48(11):33-38.

    CHEN Biao,LU Zhaolin,DAI Wei,et al. Accurate recognition of coal-gangue image based on lightweight HPG-YOLOX-S model[J]. Journal of Mine Automation,2022,48(11):33-38.

    [15] 桂方俊,李尧. 基于CBA−YOLO模型的煤矸石检测[J]. 工矿自动化,2022,48(6):128-133.

    GUI Fangjun,LI Yao. Coal gangue detection based on CBA-YOLO model[J]. Journal of Mine Automation,2022,48(6):128-133.

    [16] 张释如,黄综浏,张袁浩,等. 基于改进YOLOv5的煤矸识别研究[J]. 工矿自动化,2022,48(11):39-44.

    ZHANG Shiru,HUANG Zongliu,ZHANG Yuanhao,et al. Coal and gangue recognition research based on improved YOLOv5[J]. Journal of Mine Automation,2022,48(11):39-44.

    [17] 张磊,王浩盛,雷伟强,等. 基于YOLOv5s−SDE的带式输送机煤矸目标检测[J]. 工矿自动化,2023,49(4):106-112.

    ZHANG Lei,WANG Haosheng,LEI Weiqiang,et al. Coal gangue target detection of belt conveyor based on YOLOv5s-SDE[J]. Journal of Mine Automation,2023,49(4):106-112.

    [18]

    REDMON J,FARHADI A. YOLOv3:an incremental improvement[C]. IEEE Conference on Computer Vision and Pattern Recognition,Salt Lake City,2018:89-95.

    [19] 芦碧波,周允,李小军,等. 融合注意力机制的YOLOv5轻量化煤矿井下人员检测算法[J]. 煤炭技术,2023,42(10):200-203.

    LU Bibo,ZHOU Yun,LI Xiaojun,et al. YOLOv5 lightweight coal mine underground personnel detection algorithm base on attention mechanism[J]. Coal Technology,2023,42(10):200-203.

    [20]

    CHEN Jierun,KAO Shiuhong,HE Hao,et al. Run,don't walk:chasing higher FLOPS for faster neural networks[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,Vancouver,2023:12021-12031.

    [21]

    HU Jie,SHEN Li,SUN Gang. Squeeze-and-excitation networks[C]. IEEE Conference on Computer Vision and Pattern Recognition,Salt Lake City,2018:7132-7141.

    [22]

    WOO S,PARK J C,LEE J Y,et al. Cbam:convolutional block attention module[C]. European Conference on Computer Vision,Munich,2018:3-19.

    [23] 柏罗,张宏立,王聪. 基于高效注意力和上下文感知的目标跟踪算法[J]. 北京航空航天大学学报,2022,48(7):1222-1232.

    BAI Luo,ZHANG Hongli,WANG Cong. Target tracking algorithm based on efficient attention and context awareness[J]. Journal of Beijing University of Aeronautics and Astronautics,2022,48(7):1222-1232.

    [24]

    YANG Lingxiao,ZHANG Ruyuan,LI Lida,et al. Simam:a simple,parameter-free attention module for convolutional neural networks[C]. International Conference on Machine Learning,New York,2021:11863-11874.

    [25]

    JIANG Borui,LUO Ruixuan,MAO Jiayuan,et al. Acquisition of localization confidence for accurate object detection[C]. European Conference on Computer Vision,Munich,2018:816-832.

    [26]

    ZHENG Zhaohui,WANG Ping,REN Dongwei,et al. Enhancing geometric factors in model learning and inference for object detection and instance segmentation[J]. IEEE Transactions on Cybernetics,2021,52(8):8574-8586.

    [27]

    TONG Zanjia,CHEN Yuhang,XU Zewei,et al. Wise−IoU:bounding box regression loss with dynamic focusing mechanism[J]. Computer Science,2023. DOI: 10.48550/arXiv.2301.10051.

  • 期刊类型引用(4)

    1. 陈旭升,代勇,温承超,秦冠一,周智晨,吴佳欣. 基于多传感器融合的无人车定位方法. 沈阳理工大学学报. 2025(02): 34-40+47 . 百度学术
    2. 牟琦,梁鑫,郭媛婕,王煜豪,李占利. 边缘感知增强的煤矿井下视觉SLAM方法. 煤田地质与勘探. 2025(03): 231-242 . 百度学术
    3. 崔邵云,鲍久圣,胡德平,袁晓明,张可琨,阴妍,王茂森,朱晨钟. SLAM技术及其在矿山无人驾驶领域的研究现状与发展趋势. 工矿自动化. 2024(10): 38-52 . 本站查看
    4. 杨林,赵春雷. 煤矿智能化巡检机器人系统设计与现场应用. 山西焦煤科技. 2024(12): 42-46 . 百度学术

    其他类型引用(0)

图(6)  /  表(2)
计量
  • 文章访问数:  175
  • HTML全文浏览量:  52
  • PDF下载量:  39
  • 被引次数: 4
出版历程
  • 收稿日期:  2023-10-26
  • 修回日期:  2024-05-05
  • 网络出版日期:  2024-06-12
  • 刊出日期:  2024-05-29

目录

/

返回文章
返回