基于HGTC−YOLOv8n模型的煤矸识别算法研究

滕文想, 王成, 费树辉

滕文想,王成,费树辉. 基于HGTC−YOLOv8n模型的煤矸识别算法研究[J]. 工矿自动化,2024,50(5):52-59. DOI: 10.13272/j.issn.1671-251x.2024030064
引用本文: 滕文想,王成,费树辉. 基于HGTC−YOLOv8n模型的煤矸识别算法研究[J]. 工矿自动化,2024,50(5):52-59. DOI: 10.13272/j.issn.1671-251x.2024030064
TENG Wenxiang, WANG Cheng, FEI Shuhui. Research on coal gangue recognition algorithm based on HGTC-YOLOv8n model[J]. Journal of Mine Automation,2024,50(5):52-59. DOI: 10.13272/j.issn.1671-251x.2024030064
Citation: TENG Wenxiang, WANG Cheng, FEI Shuhui. Research on coal gangue recognition algorithm based on HGTC-YOLOv8n model[J]. Journal of Mine Automation,2024,50(5):52-59. DOI: 10.13272/j.issn.1671-251x.2024030064

基于HGTC−YOLOv8n模型的煤矸识别算法研究

基金项目: 机械工业联合会矿山采选装备智能化重点实验室开放基金项目(2022KLMIO4);安徽理工大学引进人才基金项目(13230411)。
详细信息
    作者简介:

    滕文想(1990—),男,江苏徐州人,讲师,博士,主要从事机械动力学、机电装备设计、物料辅运机器人以及数值求解方法的教学与研究工作,E-mail:wxtengcumt@163.com

  • 中图分类号: TD67

Research on coal gangue recognition algorithm based on HGTC-YOLOv8n model

  • 摘要: 现有基于深度学习的煤矸识别方法在煤矿井下低照度、高噪声及运动模糊等复杂工况下存在煤矸识别精度低、小目标煤矸容易漏检、模型参数量和运算量大,难以部署到计算资源有限的设备中等问题,提出了一种基于HGTC−YOLOv8n模型的煤矸识别算法。采用HGNetv2网络替换YOLOv8n的主干网络,通过多尺度特征的有效提取,提高煤矸识别效果并减少模型的存储需求和计算资源消耗;在主干网络中嵌入三重注意力机制模块Triplet Attention,捕获不同维度间的交互信息,增强煤矸图像目标特征的提取,减少无关信息的干扰;选用内容感知特征重组模块(CARAFE)来改进YOLOv8n颈部特征融合网络上采样算子,利用上下文信息提高感受视野,提高小目标煤矸识别准确率。实验结果表明:① HGTC−YOLOv8n模型的平均精度均值为93.5%,模型的参数量为2.645×106,浮点运算量为8.0×109 ,帧速率为79.36帧/s。② 平均精度均值较YOLOv8n模型提升了2.5%,参数量和浮点运算量较YOLOv8n模型分别下降了16.22%和10.11%。③ 与YOLO系列模型相比,HGTC−YOLOv8n模型的平均精度均值最高,且参数量和浮点运算量最少,检测速度较快,综合检测性能最佳。④ 基于HGTC−YOLOv8n模型的煤矸识别算法在煤矿井下复杂工况下,改善了煤矸识别精度低、小目标煤矸容易漏检等问题,满足煤矸图像实时检测要求。
    Abstract: The existing deep learning based coal gangue recognition methods have problems in complex working conditions such as low lighting, high noise, and motion blur in coal mines, such as low precision of coal gangue recognition, easy omission of small target coal gangue, large model parameter and computational complexity, and difficulty in deploying to devices with limited computing resources. A coal gangue recognition algorithm based on the HGTC-YOLOv8n model is proposed. The method replaces the backbone network of YOLOv8n with HGNetv2 network, effectively extracts multi-scale features to improve coal gangue recognition performance and reduces model storage requirements and computational resource consumption. The method embeds a Triplet Attention mechanism module in the backbone network to capture interaction information between different dimensions. The method enhances the extraction of target features in coal gangue images, and reduces the interference of irrelevant information. The method selects the content aware reassembly of features(CARAFE) to improve the upsampling operator of YOLOv8n neck feature fusion network, utilizing contextual information to enhance perceptual field of view and improve the accuracy of small target coal gangue recognition. The experimental results show the following points.① The average precision of the HGTC-YOLOv8n model is 93.5%, the parameters number of the model is 2.645×106, the number of floating-point operation is 8.0×109, and the frame rate is 79.36 frames/s. ② The average precision of the YOLOv8n model has increased by 2.5% compared to the YOLOv8n model, and the number of parameters and floating-point operations have decreased by 16.22% and 10.11%, respectively. ③ The comparison results with the YOLO series models show that the HGTC-YOLOv8n model has the highest average precision, the least number of parameters and floating-point operations, fast detection speed, and the best overall detection performance. ④ The coal gangue recognition algorithm based on the HGTC-YOLOv8n model has improved the low precision of coal gangue recognition and the easy omission of small target coal gangue under complex working conditions in coal mines. The method meets the requirements of real-time detection of coal gangue images.
  • 煤矿开采过程中常常伴随着煤矸的产生,煤矸的存在不仅影响了煤的品质,还加剧了后续处理成本及对环境的污染[1-2]。传统的分选方式为人工分选和设备分选,人工分选效率低、误差率高,设备分选易造成环境污染。因此,通过计算机视觉技术对煤矸进行识别,自动准确地检测出矸石,对煤矿智能化分选非常重要[3-4]

    目前,计算机视觉技术对煤矸识别包括传统煤矸图像识别方法和深度学习识别方法[5]。传统煤矸图像识别方法需手动提取煤矸的图像特征,存在检测精度低、实时性及泛化能力差等问题[6-7]。深度学习识别方法具有较高的准确性、实时性和鲁棒性[8-9]。李博等[10]通过模拟生产环境下的煤矸图像,研究光强、湿度、粉尘和样品种类对煤矸图像特征的影响,但试验简化模拟的生产环境与实际生产环境的识别结果有较大差异。郭永存等[11]针对煤矸小样本数据集识别率低,提出了一种迁移权重和简化神经元模型优化方法来改进预训练卷积神经网络模型,但模型泛化能力差。徐志强等[12]基于卷积神经网络对建立的煤矸识别模型进行剪枝优化,减少模型参数和计算资源消耗,但未考虑煤矸识别时的检测速度。徐慈强等[13]通过轻量化网络MobileNetV3替换YOLOv5s的主干网络,减小模型的参数量和运算量,以适应模型在移动端的部署,但模型识别效果差。张磊等[14]通过深度可分离卷积对YOLOv5s模型改进,减少了模型的参数量和运算量,但模型在小目标、运动模糊、低照度煤矸数据集识别精度不高。邓天民等[15]以YOLOv8s模型为基准网络,在颈部特征融合网络引入内容感知特征重组模块(Content Aware Reassembly of Features,CARAFE),加强对小目标显著语义信息的关注,但模型参数量和运算量大,难以部署到计算资源有限的设备中。

    针对上述问题,本文提出了一种基于HGTC−YOLOv8n模型的煤矸识别算法,结合轻量化网络HGNetv2、三重注意力机制模块Triplet Attention和CARAFE,使煤矸识别模型具有更少的参数量和浮点运算量,能够部署到资源有限的设备中,完成对煤矸快速精准识别。

    HGTC−YOLOv8n模型在YOLOv8n[16]基础上进行改进,结构如图1所示。采用HGNetv2替换YOLOv8n的主干网络,通过多尺度特征的有效提取,提高煤矸图像准确率并减少模型的存储需求和计算资源消耗,嵌入三重注意力机制模块Triplet Attention,增强煤矸特征提取,减少无用特征的干扰,提高对井下复杂环境的适应性。利用CARAFE替换颈部特征融合网络上采样算子,增强对小目标煤矸的检测,实现对煤矸的精准高效识别。

    图  1  HGTC−YOLOv8n 模型结构
    Figure  1.  HGTC-YOLOv8n model structure

    采用HGNetv2[17]改进YOLOv8n模型的主干网络,通过多尺度特征的有效提取,提高识别准确率,并降低模型计算量,实现煤矸图像高效识别。

    HGNetv2主干网络由HGStem,HGBlock,DWConv[18]组成。HGStem是网络初始预处理层,通过卷积层对输入数据进行特征提取,再经过最大池化操作进行降采样,在不同尺度上获取输入数据特征,HGStem结构如图2(a)所示。HGBlock包括多个不同滤波器大小的卷积层,主要作用是捕获数据多样化特征,HGBlock结构如图2(b)所示。使用深度可分离卷积DWConv替换传统卷积,能够减少计算负载,提高模型的推理速度,并在每个通道上能独立学习特征。

    图  2  HGStem结构和HGBlock结构
    Figure  2.  HGStem structure and HGBlock structure

    煤矿井下环境复杂,采集到的煤矸图像受多种干扰因素影响,丢失了大量纹理特征且引入了冗余特征,导致煤矸图像的有效特征难以提取[19]。为了增强有效特征的提取能力,在HGNetV2主干网络中嵌入Triplet Attention[20]图3)。Triplet Attention能够捕获不同维度间的交互信息,减少无关信息的干扰,使模型更加注重目标特征的提取,提高识别准确率。

    图  3  Triplet Attention结构
    Figure  3.  Triplet Attention structure

    Triplet Attention由3个平行的分支组成,输入张量$ X \in {{\bf{R}}^{C{{ \times }}H{{ \times }}W}} $到3个分支。第1个分支中张量X绕维度H逆时针旋转90°,得到旋转张量$\hat{X}_1 $,经过池化后张量形状为2×H×C,再由卷积运算,通过Sigmoid激活函数生成注意力权重,最后绕维度H顺时针旋转90°,输出张量$ \hat X _1^* $,完成通道C与维度H交互[21]。第2个分支中张量X绕维度W逆时针旋转90°,得到旋转张量$\hat{X}_2 $,经过池化层、卷积、Sigmoid激活函数后,绕维度W顺时针旋转90°,输出张量$\hat X _2^* $,完成通道C与维度W交互。第3个分支中张量X经过池化层、卷积、Sigmoid激活函数后,输出张量$\hat X _3^* $。最后将3个张量进行平均聚合,输出的张量为

    $$ y=\frac{1}{3}\left(\overline{\hat{X}_1^{ }\sigma(\psi_1(\hat{X}_1^*))}+\overline{\hat{X}_2^{ }\sigma(\psi_2(\hat{X}_2^*))}+X\sigma(\psi_3(\hat{X}_3^*))\right) $$ (1)

    式中:σ(·)为Sigmoid激活函数;ψ1(·),ψ2(·),ψ3(·)为标准卷积。

    YOLOv8n中的Upsample上采样层常用的方法是最近邻插值,即复制最近邻像素的值,该方法忽略了像素之间的平滑过渡,导致图像失真和模糊化,在处理大尺寸图像时易丢失重要细节信息。本文选用CARAFE[22]图4)来改进YOLOv8n颈部特征融合网络上采样算子,CARAFE主要由核预测模块和特征重组模块2个部分组成。CARAFE能够在上采样过程中保留更多的细节信息,利用上下文信息提高感受视野,更好地理解图像中的全局结构和语义信息,提高小目标煤矸识别准确率。输入张量$ X \in {{\bf{R}}^{C{{ \times }}H{{ \times }}W}} $,上采样率为a。首先,通过1×1卷积将输入特征通道数从C压缩到Cm。其次,进行内容编码,输入通道数为Cm,输出通道数为a2×k2,将通道维在空间维展开,得到形状为aH×aW×k2的上采样核。然后,对上采样核归一化,确保卷积权重总和为1。最后,对输出特征图中的每个位置,将其映射回输入特征图,提取以l=ij)为中心的k×k区域NXlk),并与预测的上采样核进行点积操作,计算出最终的aH×aW×C的输出特征图[23]

    图  4  CARAFE框架
    Figure  4.  Framework of content aware reassembly of features (CARAFE)

    对采集的不同照度、大小、摆放位置的煤矸图像进行组合,获取原始图像500张。为了模拟煤矿井下煤矸分选的复杂环境,提高模型鲁棒性和泛化能力,对煤矸图像进行添加噪声、运动模糊、镜像翻转、低照度等增强处理,最终得到1 703张煤矸图像,如图5所示。对数据集进行煤矸标注,按照9∶1的比例划分为训练集、验证集。

    图  5  煤矸数据集
    Figure  5.  Coal gangue dataset

    本文所用模型基于Pytorch深度学习框架,实验的软硬件环境:RTX3090(24GiB)的GPU、Intel(R) Xeon(R) Gold 6330的CPU,Pytorch2.0.0,Cuda11.8,Python3.8(ubuntu20.04)。训练输入图像大小为640×640,训练轮数为201,批量大小为32,训练过程中使用SGD优化器。

    为验证HGTC−YOLOv8n模型的性能,采用平均精度均值(Mean Average Precision,mAP)、参数量、浮点运算量、帧速率作为评价指标。其中,mAP表示模型的识别精度,参数量和浮点运算量分别表示模型的存储需求和计算资源消耗,帧速率表示模型的识别速度。

    HGTC−YOLOv8n模型通过随机色调增强、饱和度增强、亮度增强等数据增强方法(表1)生成多样化的训练样本,提高模型的泛化能力。数据增强方法应用于每个训练迭代中,通过对训练样本进行随机变换,确保模型每次观察到不同的样本。

    表  1  训练过程中数据增强的超参数
    Table  1.  Hyperparameters of data enhancement during training
    超参数
    色调增强 0.015
    饱和度增强 0.7
    亮度增强 0.4
    随机缩放 0.5
    水平翻转 0.5
    水平平移 0.1
    Mosic数据增强 1.0
    下载: 导出CSV 
    | 显示表格

    通过消融实验分析本文改进各模块的优化效果,结果见表2。其中,优化模型1为YOLOv8n+HGNetv2,优化模型2为YOLOv8n+Triplet Attention,优化模型3为YOLOv8n+CARAFE,优化模型4为YOLOv8n+HGNetv2+Triplet Attention,优化模型5为YOLOv8n+HGNetv2+CARAFE,优化模型6为YOLOv8n+CARAFE+Triplet Attention,优化模型7为YOLOv8n+HGNetv2+Triplet Attention+CARAFE。由表2可看出,优化模型1的参数量和浮点运算量较YOLOv8n模型分别减少了0.654×106和1.2×109,帧速率提升了2.78 帧/s,mAP提升了1%;优化模型2的参数量和浮点运算量与YOLOv8n模型持平,帧速率下降了1.96 帧/s,mAP提升了1.8%;优化模型3的参数量和浮点运算量较YOLOv8n模型分别增加了0.14×106和0.2×109,帧速率下降了1.96 帧/s,mAP提升了1.8%;优化模型4的参数量和浮点运算量较YOLOv8n模型分别减少了0.653×106和1.2×109,帧速率提升了0.68 帧/s,mAP提升了1.7%;优化模型5的参数量和浮点运算量较YOLOv8n模型分别减少了0.513×106和0.9×109,帧速率下降了0.66 帧/s,mAP提升了1.1%;优化模型6的参数量和浮点运算量较YOLOv8n模型分别增加了0.141×106和0.2×109,帧速率下降了4.45 帧/s,mAP提升了2.1%;优化模型7的参数量和浮点运算量较YOLOv8n模型分别减少了0.513×106和0.9×109,帧速率下降了2.6 帧/s,mAP提升了2.5%,满足煤矸图像实时检测的要求。

    表  2  消融实验结果
    Table  2.  Ablation experiment results
    模型 HGNetv2 Triplet Attention CARAFE mAP/% 参数量/106 浮点运算量/109 帧速率/(帧·s−1
    YOLOv8n × × × 91.0 3.157 8.9 81.96
    优化模型1 × × 92.0 2.503 7.7 84.74
    优化模型2 × × 92.8 3.157 8.9 80.00
    优化模型3 × × 92.8 3.297 9.1 80.00
    优化模型4 × 92.7 2.504 7.7 82.64
    优化模型5 × 92.1 2.644 8.0 81.30
    优化模型6 × 93.1 3.298 9.1 77.51
    优化模型7 93.5 2.644 8.0 79.36
    下载: 导出CSV 
    | 显示表格

    通过消融实验得出,添加Triplet Attention后,识别精度有较大提升,且模型的参数量和浮点运算量基本持平。值得注意的是,引入CARAFE上采样后,识别精度提升的同时模型的参数量和浮点运算量也相应增加。采用HGNetv2轻量化主干网络,在满足识别速度的条件下,提升了识别精度,减少了参数量和浮点运算量,减少了模型的存储需求和计算资源消耗。

    为进一步验证本文改进模型的有效性,与YOLOv5s,YOLOv7−tiny[24],YOLOv8n,YOLOv8s等模型进行对比,分别在正常、低照度、高噪声与运动模糊的环境下进行检测,所有实验均使用相同的训练集与验证集。不同模型的煤矸识别结果见表3,绘制不同模型的mAP曲线,如图6所示。

    表  3  不同模型的煤矸识别结果
    Table  3.  Coal gangue recognition results of different models
    模型 参数量/106 浮点运算量/109 mAP/% 帧速率/(帧·s−1
    YOLOv5s 7.025 16.0 92.7 73.52
    YOLOv7−tiny 6.018 13.2 90.8 68.96
    YOLOv8n 3.157 8.9 91.0 81.96
    YOLOv8s 11.167 28.8 91.9 78.12
    HGTC−YOLOv8n 2.645 8.0 93.5 79.36
    下载: 导出CSV 
    | 显示表格
    图  6  不同模型的mAP曲线
    Figure  6.  Mean average precision curves of different models

    表3图6可看出,HGTC−YOLOv8n模型的mAP在对比模型中最高,达到了93.5%,相较于YOLOv8n提升了2.5%;帧速率高于YOLOv8s,YOLOv7−tiny,YOLOv5s,略低于YOLOv8n,满足实时检测的要求(≥60帧/s);参数量仅为YOLOv5s的37.6%、YOLOv7−tiny的43.9%、YOLOv8n的83.7%、YOLOv8s的28.2%;浮点运算量仅为YOLOv5s的50%、YOLOv7−tiny的60.6%、YOLOv8n的89.8%、YOLOv8s的27.8%。充分说明HGTC−YOLOv8n模型在计算资源有限的情况下仍能保持高精度,更适合部署到嵌入式或移动端设备等场景,完成对煤矸的快速精准识别。

    不同模型在4种工况下煤矸石测试集部分识别结果如图7所示,其中,红色检测框标注煤块,粉色检测框标注矸石,黄色椭圆框标记类别错误,蓝色椭圆框标记漏检或重复检测。

    图  7  不同算法在4种工况下的检测结果
    Figure  7.  Detection results of different algorithms under four working conditions

    图7可看出,在正常情况下,YOLOv5s,YOLOv7−tiny,YOLOv8n等模型识别小目标煤块易发生漏检或错检;在低照度环境下,YOLOv7−tiny对小目标煤块发生了漏检,YOLOv8s发生了错检;在高噪声环境下,YOLOv7−tiny,YOLOv8n出现了检测不准确的现象;在运动模糊环境下,YOLOv5s发生了漏检,YOLOv7−tiny发生了错检。从检测结果可知,其他模型均有不同程度的漏检和错检现象,HGTC−YOLOv8n模型在低照度、高噪声、运动模糊环境下有较好的识别效果,能够对煤矸进行分类识别和位置检测,有效减少错检和漏检的情况发生。

    为了验证改进模型的可行性,以带式输送机上煤矸为例进行识别。将HGTC−YOLOv8n模型在测试集上进行检测,对单幅图像中不同类别的煤矸进行识别并计数。红字为煤矸个数,蓝字为煤块个数,绿字为矸石个数,计数结果置于左上角,如图8所示。可看出HGTC−YOLOv8n模型能够在不同场景下准确识别煤矸。

    图  8  带式输送机上煤矸识别及计数可视化
    Figure  8.  Visualization of coal gangue recognition and count on belt conveyor

    1) HGTC−YOLOv8n模型采用轻量化网络模型HGNetv2替换原模型主干网络,将Triplet Attention嵌入主干网络,特征融合网络上采样替换为CARAFE。

    2) 提出了一种基于HGTC−YOLOv8n模型的煤矸识别算法。结果表明所提模型对小目标和重叠遮挡煤矸识别有明显改善,mAP为93.5%,比YOLOv8n模型提升了2.5%,模型参数量为2.645×106,浮点运算量为8.0×109 ,比未改进前分别下降了16.22%,10.11%,表明HGTC−YOLOv8n模型在保证煤矸识别精度的同时减少了模型的存储需求和计算资源消耗。

    3) HGTC−YOLOv8n模型检测速度较快,但未部署在嵌入式或移动端等设备进行实时检测试验,未来将进行试验台搭建,以验证其在动态煤矸检测的有效性。

  • 图  1   HGTC−YOLOv8n 模型结构

    Figure  1.   HGTC-YOLOv8n model structure

    图  2   HGStem结构和HGBlock结构

    Figure  2.   HGStem structure and HGBlock structure

    图  3   Triplet Attention结构

    Figure  3.   Triplet Attention structure

    图  4   CARAFE框架

    Figure  4.   Framework of content aware reassembly of features (CARAFE)

    图  5   煤矸数据集

    Figure  5.   Coal gangue dataset

    图  6   不同模型的mAP曲线

    Figure  6.   Mean average precision curves of different models

    图  7   不同算法在4种工况下的检测结果

    Figure  7.   Detection results of different algorithms under four working conditions

    图  8   带式输送机上煤矸识别及计数可视化

    Figure  8.   Visualization of coal gangue recognition and count on belt conveyor

    表  1   训练过程中数据增强的超参数

    Table  1   Hyperparameters of data enhancement during training

    超参数
    色调增强 0.015
    饱和度增强 0.7
    亮度增强 0.4
    随机缩放 0.5
    水平翻转 0.5
    水平平移 0.1
    Mosic数据增强 1.0
    下载: 导出CSV

    表  2   消融实验结果

    Table  2   Ablation experiment results

    模型 HGNetv2 Triplet Attention CARAFE mAP/% 参数量/106 浮点运算量/109 帧速率/(帧·s−1
    YOLOv8n × × × 91.0 3.157 8.9 81.96
    优化模型1 × × 92.0 2.503 7.7 84.74
    优化模型2 × × 92.8 3.157 8.9 80.00
    优化模型3 × × 92.8 3.297 9.1 80.00
    优化模型4 × 92.7 2.504 7.7 82.64
    优化模型5 × 92.1 2.644 8.0 81.30
    优化模型6 × 93.1 3.298 9.1 77.51
    优化模型7 93.5 2.644 8.0 79.36
    下载: 导出CSV

    表  3   不同模型的煤矸识别结果

    Table  3   Coal gangue recognition results of different models

    模型 参数量/106 浮点运算量/109 mAP/% 帧速率/(帧·s−1
    YOLOv5s 7.025 16.0 92.7 73.52
    YOLOv7−tiny 6.018 13.2 90.8 68.96
    YOLOv8n 3.157 8.9 91.0 81.96
    YOLOv8s 11.167 28.8 91.9 78.12
    HGTC−YOLOv8n 2.645 8.0 93.5 79.36
    下载: 导出CSV
  • [1] 谢和平,任世华,谢亚辰,等. 碳中和目标下煤炭行业发展机遇[J]. 煤炭学报,2021,46(7):2197-2211.

    XIE Heping,REN Shihua,XIE Yachen,et al. Development opportunities of the coal industry towards the goal of carbon neutrality[J]. Journal of China Coal Society,2021,46(7):2197-2211.

    [2] 王国法,杜毅博,任怀伟,等. 智能化煤矿顶层设计研究与实践[J]. 煤炭学报,2020,45(6):1909-1924.

    WANG Guofa,DU Yibo,REN Huaiwei,et al. Top level design and practice of smart coal mines[J]. Journal of China Coal Society,2020,45(6):1909-1924.

    [3] 冯来宏,李克相,顾雷雨,等. 我国井下智能干选技术装备发展及展望[J]. 煤炭工程,2023,55(9):11-15.

    FENG Laihong,LI Kexiang,GU Leiyu,et al. Development and prospect of underground intelligent dry separation technology and equipment in China[J]. Coal Engineering,2023,55(9):11-15.

    [4] 张创业,王晓川,刘庆军,等. 近全岩保护层开采煤矸井下分选及充填一体化技术研究与应用[J]. 煤炭工程,2023,55(10):6-11.

    ZHANG Chuangye,WANG Xiaochuan,LIU Qingjun,et al. Integrated technology of coal gangue underground separation and filling in full rock protection seam mining[J]. Coal Engineering,2023,55(10):6-11.

    [5]

    WANG Yuanbin,WANG Yujing,DANG Langfei. Video detection of foreign objects on the surface of belt conveyor underground coal mine based on improved SSD[J]. Journal of Ambient Intelligence and Humanized Computing,2020,14:5507-5516.

    [6] 王家臣,李良晖,杨胜利. 不同照度下煤矸图像灰度及纹理特征提取的实验研究[J]. 煤炭学报,2018,43(11):3051-3061.

    WANG Jiachen,LI Lianghui,YANG Shengli. Experimental study on gray and texture features extraction of coal and gangue image under different illuminance[J]. Journal of China Coal Society,2018,43(11):3051-3061.

    [7] 张红,李晨阳. 基于光学图像的煤矸石识别方法综述[J]. 煤炭工程,2022,54(7):159-163.

    ZHANG Hong,LI Chenyang. Review on coal gangue identification methods based on optical images[J]. Coal Engineering,2022,54(7):159-163.

    [8] 郜亚松,张步勤,郎利影. 基于深度学习的煤矸石识别技术与实现[J]. 煤炭科学技术,2021,49(12):202-208. DOI: 10.3969/j.issn.0253-2336.2021.12.mtkxjs202112025

    GAO Yasong,ZHANG Buqin,LANG Liying. Coal and gangue recognition technology and implementation based on deep learning[J]. Coal Science and Technology,2021,49(12):202-208. DOI: 10.3969/j.issn.0253-2336.2021.12.mtkxjs202112025

    [9] 李娟莉,魏代良,李博,等. 基于深度学习轻量化的改进SSD煤矸快速分选模型[J]. 东北大学学报(自然科学版),2023,44(10):1474-1480.

    LI Juanli,WEI Dailiang,LI Bo,et al. Improved SSD rapid separation model of coal gangue based on deep learning and light-weighting[J]. Journal of Northeastern University(Natural Science),2023,44(10):1474-1480.

    [10] 李博,王学文,庞尚钟,等. 煤与矸石图像特征分析及试验研究[J]. 煤炭科学技术,2022,50(8):236-246.

    LI Bo,WANG Xuewen,PANG Shangzhong,et al. Image characteristics analysis and experimental study of coal and gangue[J]. Coal Science and Technology,2022,50(8):236-246.

    [11] 郭永存,王希,何磊,等. 基于TW−RN优化CNN的煤矸识别方法研究[J]. 煤炭科学技术,2022,50(1):228-236. DOI: 10.3969/j.issn.0253-2336.2022.1.mtkxjs202201023

    GUO Yongcun,WANG Xi,HE Lei,et al. Research on coal and gangue recognition method based on TW-RN optimized CNN[J]. Coal Science and Technology,2022,50(1):228-236. DOI: 10.3969/j.issn.0253-2336.2022.1.mtkxjs202201023

    [12] 徐志强,吕子奇,王卫东,等. 煤矸智能分选的机器视觉识别方法与优化[J]. 煤炭学报,2020,45(6):2207-2216.

    XU Zhiqiang,LYU Ziqi,WANG Weidong,et al. Machine vision recognition method and optimization for intelligent separation of coal and gangue[J]. Journal of China Coal Society,2020,45(6):2207-2216.

    [13] 徐慈强,贾运红,田原. 基于MES−YOLOv5s的综采工作面大块煤检测算法[J]. 工矿自动化,2024,50(3):42-47,141.

    XU Ciqiang,JIA Yunhong,TIAN Yuan. Large block coal detection algorithm for fully mechanized working face based on MES-YOLOv5s[J]. Journal of Mine Automation,2024,50(3):42-47,141.

    [14] 张磊,王浩盛,雷伟强,等. 基于YOLOv5s−SDE的带式输送机煤矸目标检测[J]. 工矿自动化,2023,49(4):106-112.

    ZHANG Lei,WANG Haosheng,LEI Weiqiang. Coal gangue target detection of belt conveyor based on YOLOv5s-SDE[J]. Journal of Mine Automation,2023,49(4):106-112.

    [15] 邓天民,程鑫鑫,刘金凤,等. 基于特征复用机制的航拍图像小目标检测算法[J]. 浙江大学学报(工学版),2024,58(3):437-448.

    DENG Tianmin,CHENG Xinxin,LIU Jinfeng,et al. Small target detection algorithm for aerial images based on feature reuse mechanism[J]. Journal of Zhejiang University(Engineering Science),2024,58(3):437-448.

    [16]

    WANG Gang,CHEN Yanfei,AN Pei,et al. UAV-YOLOv8:a small-object-detection model based on improved YOLOv8 for UAV aerial photography scenarios[J]. Sensors,2023,23(16). DOI: 10.3390/S23167190.

    [17]

    ZHANG Lei,ZHENG Jiachun,LI Chaopeng,et al. CCDN-DETR:a detection transformer based on constrained contrast denoising for multi-class synthetic aperture radar object detection[J]. Sensors,2024,24(6). DOI: 10.3390/S24061793.

    [18]

    VORUGUNTI C S,PULABAIGARI V,GORTHI R K S S,et al. Osvfusenet:online signature verification by feature fusion and depth-wise separable convolution based deep learning[J]. Neurocomputing,2020,409:157-172. DOI: 10.1016/j.neucom.2020.05.072

    [19] 何凯,程刚,王希,等. 基于CED−YOLOv5s模型的煤矸识别方法研究[J]. 工矿自动化,2024,50(2):49-56,82.

    HE Kai,CHENG Gang,WANG Xi,et al. Research on coal gangue recognition method based on CED-YOLOv5s model[J]. Journal of Mine Automation,2024,50(2):49-56,82.

    [20]

    SHIMAA S,KHALID A,PAWEL P,et al. Graph convolutional network with triplet attention learning for person re-identification[J]. Information Sciences,2022,617:331-345. DOI: 10.1016/j.ins.2022.10.105

    [21] 王瑞婷,王海燕,陈晓,等. 基于混合卷积与三重注意力的高光谱图像分类网络[J]. 智能系统学报,2023,18(2):260-269.

    WANG Ruiting,WANG Haiyan,CHEN Xiao,et al. Hyperspectral image classification based on hybrid convolutional neural network with triplet attention[J]. CAAI Transactions on Intelligent Systems,2023,18(2):260-269.

    [22]

    WANG Jiaqi,CHEN Kai,LIU Ziwei,et al. Carafe++:unified content-aware reassembly of features[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2021,44(9):4674-4687.

    [23] 单慧琳,王硕洋,童俊毅,等. 增强小目标特征的多尺度光学遥感图像目标检测[J]. 光学学报,2024,44(6):382-394.

    SHAN Huilin,WANG Shuoyang,TONG Junyi,et al. Multi-scale optical remote sensing image target detection based on enhanced small target features[J]. Acta Optica Sinica,2024,44(6):382-394.

    [24]

    QIU Yongsheng,LU Yuanyao,WANG Yuantao,et al. IDOD-YOLOV7:image-dehazing YOLOV7 for object detection in low-light foggy traffic environments[J]. Sensors,2023,23(3). DOI: 10.3390/S23031347.

图(8)  /  表(3)
计量
  • 文章访问数:  200
  • HTML全文浏览量:  43
  • PDF下载量:  40
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-03-25
  • 修回日期:  2024-05-23
  • 网络出版日期:  2024-06-12
  • 刊出日期:  2024-05-29

目录

/

返回文章
返回