Coal and gangue segmentation and recognition method based on YOLOv5-SEDC model
-
摘要: 现有煤矸分割识别技术参数量大、分类速度慢和识别准确度不高;YOLOv5−seg模型在上下采样操作中易造成图像表面的纹理细节和灰度特征信息丢失,降低煤矸识别效率,且在训练过程中过分侧重全局特征,而忽略了对煤矸识别至关重要的局部显著区域和特征。针对上述问题,提出了一种基于YOLOv5−SEDC模型的煤矸分割识别方法。首先接收包含煤矸形状信息的图像,并利用主干网络进行特征提取,生成特征图;其次在YOLOv5−seg模型中集成SENet模块,以保留煤与矸石表面的纹理细节和灰度特征,避免下采样带来的信息丢失;然后采用不同,膨胀率的空洞卷积策略替代传统卷积核,不仅扩大了模型的感受野,还有效减少了模型参数量;最后分割检测头对融合后的特征进行精细处理,实现对煤矸的精确分割和识别。在大柳塔煤矿实际煤矸分选现场搭建煤矸图像采集实验平台,消融实验结果表明,YOLOv5−SEDC模型的煤和矸石识别的精确率较YOLOv5−seg模型平均提高1.3%,参数量减少0.7×106个,检测速度提高了1.4 帧/s。对比实验结果表明:① YOLOv5−SEDC模型的精确率较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了10.7%,2.7%,1.9%,达到95.8%。② YOLOv5−SEDC模型的召回率较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了3.0%,2.1%,0.9%,达到89.1%。③ YOLOv5−SEDC模型的平均精度均值较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了6.4%,6.3%,1.8%,达到95.5%。④ YOLOv5−SEDC模型的F1较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了5.2%,4.2%,2.1%,达到92.2%。⑤ YOLOv5−SEDC模型的检测速度较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别降低了1.9,1.4,2.7 帧/s。可视化结果表明,YOLOv5−SEDC模型对煤和矸石的检测准确度较YOLOv5−seg和Mask−RCNN模型更高,说明了YOLOv5−SEDC模型在煤矸分割识别上具有较好性能。
-
关键词:
- 煤矸分割 /
- 煤矸识别 /
- 压缩激励网络 /
- YOLOv5−SEDC /
- YOLOv5−seg /
- 注意力网络 /
- 空洞卷积
Abstract: The existing coal and gangue segmentation and recognition technology has a large number of parameters, slow classification speed, and low recognition accuracy. The YOLOv5-seg model is prone to losing texture details and grayscale feature information on the image surface during up and down sampling operations, which reduces the efficiency of coal and gangue recognition. The YOLOv5-seg model overly focuses on global features during training, while neglecting the locally significant regions and features that are crucial for coal and gangue recognition. In order to solve the above problems, a coal and gangue segmentation and recognition method based on YOLOv5-SEDC model is proposed. Firstly, the method receives an image containing the shape information of coal and gangue, and uses the backbone network for feature extraction to generate a feature map. The method integrates the SENet module into the YOLOv5-seg model to preserve the texture details and grayscale features of coal and gangue surfaces, avoiding information loss caused by down sampling. The method adopts a dilated convolution strategy with different dilation rates instead of traditional convolution kernels. It not only expands the receptive field of the model, but also effectively reduces the number of model parameters. Finally, the segmentation detection head finely processes the fused features to achieve precise segmentation and recognition of coal and gangue. A coal and gangue image acquisition experimental platform is established at the actual coal and gangue sorting site of Daliuta Coal Mine. The ablation experiment results show that the accuracy of coal and gangue recognition of YOLOv5-SEDC model is improved by an average of 1.3% compared to YOLOv5-seg model. The parameter quantity is reduced by 0.7×106, and the detection speed is increased by 1.4 frames/s. The comparative experimental results show the following points. ① The accuracy of the YOLOv5-SEDC model is improved by 10.7%, 2.7%, 1.9% compared to the YOLOv3-tiny, YOLOv5-seg, and Mask-RCNN models, respectively, reaching 95.8%. ② The recall rate of the YOLOv5-SEDC model has increased by 3.0%, 2.1%, and 0.9% compared to the YOLOv3-tiny, YOLOv5-seg, and Mask-RCNN models, respectively, reaching 89.1%. ③ The mAP of the YOLOv5-SEDC model has increased by 6.4%, 6.3%, and 1.8% compared to the YOLOv3-tiny, YOLOv5-seg, and Mask-RCNN models, respectively, reaching 95.5%. ④ The F1 value of the YOLOv5-SEDC model has increased by 5.2%, 4.2%, 2.1% compared to the YOLOv3-tiny, YOLOv5-seg, and Mask-RCNN models, respectively, reaching 92.2%. ⑤ The detection speed of the YOLOv5-SEDC model is reduced by 1.9, 1.4, and 2.7 frames/s compared to the YOLOv3-tiny, YOLOv5-seg, and Mask-RCNN models, respectively. The visualization results show that the YOLOv5-SEDC model has higher detection accuracy for coal and gangue than the YOLOv5-seg and Mask-RCNN models. It indicates that the YOLOv5-SEDC model has good performance in coal gangue segmentation and recognition. -
0. 引言
煤炭作为中国的主要能源,占据能源生产和消费总量的66%左右[1-2]。由于采煤机截割角度等问题,原煤中会混入许多杂物,其中含量最多的就是矸石。矸石的颜色、形态与原煤十分接近,不易区分,当二者大量混合时会影响煤炭的热值,降低煤炭资源利用率。在燃烧过程中,煤矸石会产生大量有害气体,严重污染环境[3]。传统的煤矸分离技术包括人工选煤、重介法[4]、干法重介[5]、复合式干法分选法[6],这些方法依赖人工操作,存在效率低下、成本高、劳动强度大等问题。随着技术的发展,目前煤矿企业主要采用计算机视觉技术检测和识别煤矸[7-8]。Li Deyong等[9]提出了一种基于变形卷积YOLOv3的煤矸检测识别算法,利用变形卷积、多K−means聚类结果平均法和数据增强技术,构建了一种高效的网络模型,虽然该算法达到一定的识别精度,但在参数量方面仍有待提高。Song Qingjun等[10]提出了一种改进YOLOv5的煤矸识别算法,采用加权特征金字塔融合方法使得网络具有更强的鲁棒性,但大大增加了模型参数量,导致模型实时性不高。Gui Fangjun等[11]利用YOLOv5和注意力机制对煤矸进行识别,但识别速度较慢,不能满足实际矿山生产需求。Fu Chengcai等[12]利用梯度增强像素聚类方法对煤矸图像进行分割研究,并验证了煤矸分割识别的可行性,但该方法在复杂环境下的鲁棒性尚需提高。Lai Wenhao等[13]提出了一种改进的Mask RCNN(Mask Region-based Convolutional Neural Network,基于区域的卷积神经网络掩模)方法,结合多光谱成像技术进行煤矸分割识别,并通过实验精准获得了煤矸形状,但该方法分割识别速度较慢,难以满足矿山实际生产需求。Lü Ziqi等[14]基于YOLOv3和YOLOv4模型对煤矸分割任务进行性能分析,并获得较高的准确率和测试速度,验证了现有的目标检测网络可以实现分类和定位的任务,但其测试的煤矸数据集较为单一。上述模型的共同目标是在图像上实现对目标的像素级分类,从而精确捕捉图像中煤矸的形状信息[15-16]。虽然这些模型以高准确率和快速响应在煤矸分割中捕捉目标形状,展现了目标检测网络在图像处理上的强大能力[17],但参数量过多导致这些模型复杂度高、识别速度慢,无法满足实时性或实际生产需求。
针对上述问题,本文提出了一种基于YOLOv5−SEDC模型的煤矸分割识别模型。首先在YOLOv5−seg语义分割模型上引入SENet (Squeeze-and-Excitation Networks,压缩激励网络)模块,以增强模型对煤矸特征的分割识别能力。然后采用DC(Dilated Convolution,空洞卷积)替代传统卷积核,通过设计不同大小的膨胀率,扩大分割识别的感受野,同时减小模型的参数量,以优化计算效率。最后在自建煤矸数据集上进行模型验证。
1. YOLOv5−seg模型
YOLOv5−seg模型由主干网络、颈部网络和分割层组成[18]。主干网络由Conv层、C3层和SPPF(Spatial Pyramid Pooling Fast,快速空间金字塔池化)层构成。Conv层集成了卷积操作、批量归一化和激活函数,用于提取有效特征。C3层由3个Conv层和1个Bottleneck模块组成,进一步增强特征提取能力。SPPF层通过多尺度特征的并行计算,提升模型对不同尺度特征的捕捉能力。颈部网络利用FPN(Feature Pyramid Network,特征金字塔网络)和PAN(Path Aggregation Network,路径聚合网络)结构,将浅层的细节特征与深层的语义特征融合,以获得更全面的多尺度特征表示。分割层由一系列卷积层组成,负责将提取的多尺度特征进一步细化,生成精确的像素级分割图,将特征映射转换为分割掩码,从而实现对图像中煤矸的精确识别和定位。
2. YOLOv5−SEDC模型
2.1 SENet模块
YOLOv5−seg模型在目标分割识别中取得了良好效果,但在上下采样操作中易造成图像目标表面的纹理细节和灰度特征信息丢失,导致煤矸识别效率降低。YOLOv5−seg模型在训练过程中过分侧重于全局特征,而忽略了对煤矸识别至关重要的局部显著区域和特征。为解决上述问题,本文在YOLOv5−seg模型中引入SENet模块,以增强前几层特征图各通道之间的联系,强调煤和矸石特征之间的差异性。
SENet模块包含2个全连接层,第1个全连接层以系数为超参数进行降维,第2个全连接层用于恢复原维数,如图1所示。首先,采用转换函数将输入特征H×W×C1转换为特征图H×W×C2,其中H和 W 分别为特征图的高度和宽度,C1为输入特征通道数,C2为转换后的特征通道数。其次,通过压缩函数对特征图进行全局平均池化,将特征维度H×W×C2压缩为1×1×C2。然后,通过 Sigmoid 激活函数将学习到的权重w应用于特征图的相应通道上,通过激发函数实现特征的重分配和增强。最后,通过合并函数将计算得到的权重乘以原始特征的相应通道,实现特征的重分配和增强,从而恢复到特征图维度H×W×C2,并输出。这一过程加强了模型对煤与矸石特征的推理能力,并提升了主干网络的特征提取能力。
2.2 DC
传统的卷积核通常为了提高性能而加深网络层,但由于梯度反向传播的存在,梯度可能会不断减小甚至消失,而且网络深度的加深也导致了学习权值参数和训练时间显著增加,不利于网络效率的提高。DC[19-20]在卷积核之前插入r−1(r为膨胀率)空洞,在不增加网络权重参数和损失分辨率的情况下以指数扩大感受野。因此,本文采用DC替代传统卷积核。
当所有DC使用相同的膨胀率时会产生网格效应,导致感受野出现间隙,可能遗漏图像中的连续信息和小目标,影响分割的准确性,如图2(a)所示。为了克服这一局限,本文采用了不同膨胀率的DC策略,以捕获多尺度的特征并实现更全面的图像覆盖,从而提高对煤矸不同尺寸和形状的分割识别精度,如图2(b)所示。此外,通过减少YOLOv5−seg模型的参数量,可以提升检测速度,这与矿山实际生产环境对效率的需求相契合。选择合适的膨胀率对于实现有效的感受野覆盖至关重要。根据理论分析和实验验证,本文选择1,2,5作为膨胀率,以确保感受野能够无缝覆盖整个图像区域,避免发生网格效应。
2.3 YOLOv5−SEDC模型结构
YOLOv5−SEDC模型结构如图3所示。首先接收包含煤矸形状信息的图像,并利用主干网络进行特征提取,生成特征图。在此基础上,为了增强特征信息的利用并抑制无效特征,在进入颈部网络之前引入SENet模块。该模块通过重新加权特征通道,显著提升了特征表达能力。同时,颈部网络的FPN和PAN结构协同工作,整合多尺度特征,确保模型在处理不同尺寸目标时的灵活性和准确性。此外,DC技术的引入有效扩大了卷积的感受野,使得模型能够捕获更全面的图像上下文信息。最终,分割检测头对融合后的特征进行精细处理,实现了对煤矸的精确分割和识别。
3. 实验结果与分析
3.1 煤矸分割数据集制作
3.1.1 实验数据集采集
目前的智能煤矸图像识别系统还不够完善,将整个系统直接安装在选煤厂进行实验的条件还不成熟。因此,本实验在国家能源集团神东大柳塔煤矿实际煤矸分选现场,搭建煤矸图像采集实验平台[21]。大柳塔煤矿选煤作业现场环境恶劣、光源较差,因此采用海康威视MV−CE013−50GC型彩色工业相机。整个过程受工业相机和光源的分布影响,在相机视域中需要完整出现带式输送机,因此需提前计算相机距带式输送机的距离(本实验为1.8 m)。相机和光源的安装位置如图4所示。
3.1.2 数据预处理
图像预处理可以减少环境对图像质量的影响,并增加煤和矸石之间的特征差异[22-23]。所拍摄煤矸数据集图像为6 861张,其中标签为矸石的数量为3 983张,煤的数量为2 878张,通过Labelme图像标注工具对煤矸数据集进行手动分割标签标注,并通过随机抽样将数据集按8∶1∶1的比例划分为训练集、测试集和验证集。为了避免因煤矸数据集中的高相关性导致过拟合问题,采取图像灰度化、几何变换、图像增强等操作去除图像中的冗余信息,提升特征提取的准确性和图像分割识别精度,从而提高模型的整体性能。
3.2 实验环境及评估指标
本实验的硬件环境见表1,通过Pycharm软件搭建python3.7+torch1.9+CUDA11.1运行环境,训练集图像batch设置为16,迭代100次,学习率为0.001,优化算法为自适应梯度下降法,损失函数为二元交叉熵函数。
表 1 硬件环境配置Table 1. Hardware environment configuration硬件 参数 CPU AMD Ryzen 75800 H GPU RTX3070 内存 16 GiB 煤矸分割识别实际上为二分类,因此本文采用精确率、召回率、平均精度均值(mean Average Precision,mAP)和F1来评估模型的性能。
$$ P = \frac{{{N_{\rm{TP}}}}}{{{N_{\rm{TP}}} + {N_{{\mathrm{FP}}}}}} $$ (1) $$ R = \frac{{{N_{\rm{TP}}}}}{{{N_{\rm{TP}}} + {N_{{\mathrm{FN}}}}}} $$ (2) $$ F_1=\frac{2PR}{P+R} $$ (3) $$ {\text{mAP}} = \frac{1}{M}\sum\limits_{i = 1}^M {{\mathrm{AP}}_i} $$ (4) 式中:P为精确率;$ {N}_{\mathrm{T}\mathrm{P}} $为被预测为正样本的正样本数量;$ {N}_{\mathrm{F}\mathrm{P}} $为被预测为正样本的负样本数量;R为召回率,即正确预测为正样本的数量占全部实际为正样本的比例;$ {N}_{\mathrm{F}\mathrm{N}} $为把正样本预测为负样本的数量;i为标签数;M 为标签总数,本文中M=2;${\mathrm{AP}}_i $为平均精度。
3.3 实验结果分析
为验证YOLOv5−SEDC模型对煤矸的分割识别检测效果,对模型进行100次迭代训练,在训练过程中记录模型的精确率、回归率、mAP和F1指标,如图5所示。可看出4个指标在迭代20次时,可以稳定达到0.85以上,随后经历一段细小的波动,在第80次迭代后趋于稳定,证明YOLOv5−SEDC模型对煤矸具有良好的识别性能。
为验证YOLOv5−SEDC模型的可行性,分别采用不同改进策略进行消融实验,将YOLOv5−seg网络作为基础网络,实验结果见表2。可看出在基础网络中加入SENet,可以有效提升模型对煤和矸石识别的精确率,相较于YOLOv5−seg平均提高0.85%;将YOLOv5−seg模型中的传统卷积核替换为DC后,模型参数量减少0.8×106个,同时检测速度提高26.3%;YOLOv5−SEDC模型的煤和矸石识别的准确率较YOLOv5−seg模型平均提高1.3%,参数量减少0.7×106个,检测速度提高1.4帧/s。
表 2 消融实验结果Table 2. Ablation experiment results模型 精确率/% 参数量/106个 检测速度/(帧·s−1) 煤 矸石 YOLOv5−seg 92.9 93.5 7.2 3.8 YOLOv5−seg+SENet 94.3 93.8 7.3 3.6 YOLOv5−seg+DC 93.8 93.9 6.4 2.8 YOLOv5−SEDC 95.1 95.8 6.5 2.4 为验证YOLOv5−SED模型的优越性,将其与YOLOv3−tiny模型、YOLOv5−seg模型和Mask−RCNN模型进行分割性能评估对比,结果见表3。可看出YOLOv5−SEDC模型的精确率较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了10.7%,2.7%,1.9%,达到95.8%;YOLOv5−SEDC模型的召回率较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了3.0%,2.1%,0.9%,达到89.1%;YOLOv5−SEDC模型的mAP较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了6.4%,6.3%,1.8%,达到95.5%;YOLOv5−SEDC模型的F1较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别提高了5.2%,4.2%,2.1%,达到92.2%。在分割识别实时性方面,YOLOv5−SEDC利用网络结构和轻量化的优势,检测速度较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别降低了1.9,1.4,2.7 帧/s,更符合矿山生产实际应用场景要求。
表 3 模型性能对比结果Table 3. Models performance comparison results精确率/% 召回率/% $ {\mathrm{mAP}}/\text{%} $ $F_1/ {\text{%}}$ 检测速度/(帧·s−1) YOLOv3−tiny 85.1 86.1 89.1 87.0 4.3 YOLOv5−seg 93.1 87.0 89.2 88.0 3.8 Mask−RCNN 93.9 88.2 93.7 90.1 5.1 YOLOv5−SEDC 95.8 89.1 95.5 92.2 2.4 为直观验证YOLOv5−SEDC模型的有效性,将YOLOv5−SEDC模型与YOLOv5−seg和Mask−RCNN模型在煤矸数据集和煤矸分选现场进行煤矸分割识别测试,可视化结果如图6所示。
由图6可看出,YOLOv5−SEDC模型对煤和矸石的检测准确性更高,说明YOLOv5−SEDC模型在煤矸识别分割上具有较好的性能。
4. 结论
1) 在YOLOv5−seg模型的主干网络中,引入SENet模块以增强特征图的表达能力,这有助于保留煤和矸石表面的纹理细节和灰度特征。通过在卷积后添加SENet,能够有效减少下采样过程中的信息损失。此外,在预测层采用空洞卷积替换传统卷积,不仅扩大了卷积的感受野,还减少了模型的总体复杂度,从而在不牺牲性能的前提下,提高了模型的分割识别能力和分类精度。
2) 在基础网络中加入SENet,可以有效提升模型对煤和矸石识别的精确率,相较于YOLOv5−seg平均提高0.85%;将YOLOv5−seg模型中的传统卷积核替换为DC后,模型参数量减少0.8×106个,同时检测速度提高26.3%;YOLOv5−SEDC模型的煤和矸石识别的精确率较YOLOv5−seg模型平均提高1.3%,参数量减少了0.7×106个,检测速度提高了1.4 帧/s。
3) YOLOv5−SEDC模型的精确率、召回率、mAP、F1分别为95.8%,89.1%,95.5%,92.2%,检测速度较YOLOv3−tiny,YOLOv5−seg,Mask−RCNN模型分别降低了1.9,1.4,2.7 帧/s,更符合矿山生产实际应用场景需求。
4) YOLOv5−SEDC模型对煤和矸石的检测准确性较YOLOv5−seg和Mask−RCNN模型更高,说明YOLOv5−SEDC模型在煤矸识别分割上具有较好性能。
-
表 1 硬件环境配置
Table 1 Hardware environment configuration
硬件 参数 CPU AMD Ryzen 75800 H GPU RTX3070 内存 16 GiB 表 2 消融实验结果
Table 2 Ablation experiment results
模型 精确率/% 参数量/106个 检测速度/(帧·s−1) 煤 矸石 YOLOv5−seg 92.9 93.5 7.2 3.8 YOLOv5−seg+SENet 94.3 93.8 7.3 3.6 YOLOv5−seg+DC 93.8 93.9 6.4 2.8 YOLOv5−SEDC 95.1 95.8 6.5 2.4 表 3 模型性能对比结果
Table 3 Models performance comparison results
精确率/% 召回率/% $ {\mathrm{mAP}}/\text{%} $ $F_1/ {\text{%}}$ 检测速度/(帧·s−1) YOLOv3−tiny 85.1 86.1 89.1 87.0 4.3 YOLOv5−seg 93.1 87.0 89.2 88.0 3.8 Mask−RCNN 93.9 88.2 93.7 90.1 5.1 YOLOv5−SEDC 95.8 89.1 95.5 92.2 2.4 -
[1] 袁亮,张农,阚甲广,等. 我国绿色煤炭资源量概念、模型及预测[J]. 中国矿业大学学报,2018,47(1):1-8. YUAN Liang,ZHANG Nong,KAN Jiaguang,et al. The concept,model and reserve forecast of green coal resources in China[J]. Journal of China University of Mining & Technology,2018,47(1):1-8.
[2] 钱鸣高,许家林,王家臣. 再论煤炭的科学开采[J]. 煤炭学报,2018,43(1):1-13. QIAN Minggao,XU Jialin,WANG Jiachen. Further on the sustainable mining of coal[J]. Journal of China Coal Society,2018,43(1):1-13.
[3] LI Jianping,DU Changlong,BAO Jianwei,et al. Direct-impact of sieving coal and gangue[J]. Mining Science and Technology,2010,20(4):611-614.
[4] DUAN Chenlong,ZHOU Chenyang,DONG Liang,et al. A novel dry beneficiation technology for pyrite recovery from high sulfur gangue[J]. Journal of Cleaner Production,2018,172(3):2475-2484.
[5] MOHANTA S,MEIKAP B C. Influence of mediumparticle size on the separation performance of an air dense medium fluidized bed separator for coal cleaning[J]. Journal of the South African Institute of Mining and Metallurgy,2015,115:761-766.
[6] 李思维,常博,刘昆轮,等. 煤炭干法分选的发展与挑战[J]. 洁净煤技术,2021,27(5):32-37. LI Siwei,CHANG Bo,LIU Kunlun,et al. Development and challenge of dry coal separation[J]. Clean Coal Technology,2021,27(5):32-37.
[7] 曹现刚,李莹,王鹏,等. 煤矸石识别方法研究现状与展望[J]. 工矿自动化,2020,46(1):38-43. CAO Xiangang,LI Ying,WANG Peng,et al. Research status of coal-gangue identification method and its prospect[J]. Industry and Mine Automation,2020,46(1):38-43.
[8] MCCOY J T,AURET L. Machine learning applications in minerals processing:a review[J]. Minerals Engineering,2019,132:95-109.
[9] LI Deyong,WANG Guofa ,ZHANG Yong,et al. Coal gangue detection and recognition algorithm based on deformable convolution YOLOv3[J]. IET Image Processing,2022,16(1):134-144.
[10] SONG Qingjun,LIU Zhijiang,JIANG Haiyan. Coal gangue detection method based on improved YOLOv5[C]. International Conference on Big Data,Artificial Intelligence and Internet of Things Engineering,Xi'an,2022. DOI: 10.1109/ICBAIE56435.2022.9985920.
[11] GUI Fangjun,YU Shuo,ZHANG Hailan,et al. Coal gangue recognition algorithm based on improved YOLOv5[C]. 2nd International Conference on Information Technology,Big Data and Artificial Intelligence,Chongqing,2021.DOI: 10.1109/ICIBA52610.2021.9687869.
[12] FU Chengcai,LU Fengli,ZHANG Guoying. Gradient- enhanced waterpixels clustering for coal gangue[J]. International Journal of Coal Preparation and Utilization,2023,43(4):677-690.
[13] LAI Wenhao,HU Feng,KONG Xixi,et al. The study of coal gangue segmentation for location and shape predicts based on multispectral and improved Mask R-CNN[J]. Powder Technology,2022,407. DOI: 10.1016/J.POWTEC.2022.117655.
[14] LYU Ziqi,WANG Weidong,ZHANG Kanghui,et al. A synchronous detection-segmentation method for oversized gangue on a coal preparation plant based on multi-task learning[J]. Minerals Engineering,2022,187. DOI: 10.1016/J.MINENG.2022.107806.
[15] TAGHANAKI S A,ABHISHEK K,COHEN J P,et al. Deep semantic segmentation of natural and medical images:a review[J]. Artificial Intelligence Review,2021,54(1):137-178.
[16] HAO Shijie,ZHOU Yuan,GUO Yanrong. A brief survey on semantic segmentation with deep learning[J]. Neurocomputing,2020,406:302-321.
[17] 陈彪,卢兆林,代伟,等. 基于轻量化HPG−YOLOX−S模型的煤矸石图像精准识别[J]. 工矿自动化,2022,48(11):33-38. CHEN Biao,LU Zhaolin,DAI Wei,et al. Accurate recognition of coal-gangue image based on lightweight HPG-YOLOX-S model[J]. Journal of Mine Automation,2022,48(11):33-38.
[18] 郝俊峰,李玉涛,来博文. 基于YOLOv5−seg的多模型电石检测分割系统[J]. 现代计算机,2023,29(16):1-7,14. DOI: 10.3969/j.issn.1007-1423.2023.16.001 HAO Junfeng,LI Yutao,LAI Bowen. Multi-model calcium carbide detection and segmentationsystem based on YOLOv5−seg[J]. Modern Computer,2023,29(16):1-7,14. DOI: 10.3969/j.issn.1007-1423.2023.16.001
[19] 许灿辉,史操,陈以农. 基于膨胀卷积网络的端到端文档语义分割[J]. 中南大学学报(英文版),2021,28(6):1765-1774. XU Canhui,SHI Cao,CHEN Yinong. End-to-end dilated convolution network for document image semantic segmentation[J]. Journal of Central South University,2021,28(6):1765-1774.
[20] YU Fisher,KOLTUN V. Multi-scale context aggregation by dilated convolutions[C]. International Conference on Learning Representation,Washington,2016. DOI: 10.48550/arXiv.1511.07122.
[21] 饶中钰,吴景涛,李明. 煤矸石图像分类方法[J]. 工矿自动化,2020,46(3):69-73. RAO Zhongyu,WU Jingtao,LI Ming. Coal-gangue image classification method[J]. Industry and Mine Automation,2020,46(3):69-73.
[22] FERNANDO P G,RACHEL S,SEBASTIEN O. TorchIO:a Python library for efficient loading,preprocessing,augmentation and patch-based sampling of medical images in deep learning[J]. Computer Methods and Programs in Biomedicine,2021,208. DOI: 10.1016/J.CMPB.2021.106236.
[23] 赵杰,孙伟,徐中达,等. 基于形态学预处理的数字图像相关方法研究[J]. 实验力学,2022,37(5):629-637. ZHAO Jie,SUN Wei,XU Zhongda,et al. Study on the method of digital image correlation based morphological pre-processing[J]. Journal of Experimental Mechanics,2022,37(5):629-637.