基于SD−YOLOv5s−4L的煤矿井下无人驾驶电机车多目标检测

赵伟, 王爽, 赵东洋

赵伟,王爽,赵东洋. 基于SD−YOLOv5s−4L的煤矿井下无人驾驶电机车多目标检测[J]. 工矿自动化,2023,49(11):121-128. DOI: 10.13272/j.issn.1671-251x.2023070100
引用本文: 赵伟,王爽,赵东洋. 基于SD−YOLOv5s−4L的煤矿井下无人驾驶电机车多目标检测[J]. 工矿自动化,2023,49(11):121-128. DOI: 10.13272/j.issn.1671-251x.2023070100
ZHAO Wei, WANG Shuang, ZHAO Dongyang. Multi object detection of underground unmanned electric locomotives in coal mines based on SD-YOLOv5s-4L[J]. Journal of Mine Automation,2023,49(11):121-128. DOI: 10.13272/j.issn.1671-251x.2023070100
Citation: ZHAO Wei, WANG Shuang, ZHAO Dongyang. Multi object detection of underground unmanned electric locomotives in coal mines based on SD-YOLOv5s-4L[J]. Journal of Mine Automation,2023,49(11):121-128. DOI: 10.13272/j.issn.1671-251x.2023070100

基于SD−YOLOv5s−4L的煤矿井下无人驾驶电机车多目标检测

基金项目: 国家自然科学基金项目(52274152);安徽省高校杰出青年科研项目(2022AH020056)。
详细信息
    作者简介:

    赵伟(2000—),男,安徽桐城人,硕士研究生,研究方向为矿山智能化装备与技术,E-mail:zhaow201105@126.com

    通讯作者:

    王爽(1991—),女,安徽马鞍山人,副教授,博士,研究方向为煤矿机器人,E-mail:chk0519@126.com

  • 中图分类号: TD64

Multi object detection of underground unmanned electric locomotives in coal mines based on SD-YOLOv5s-4L

  • 摘要: 为解决煤矿井下无人驾驶电机车由于光照不均、高噪声等复杂环境因素导致的多目标检测精度低及小目标识别困难问题,提出一种基于SD−YOLOv5s−4L的煤矿井下无人驾驶电机车多目标检测模型。在YOLOv5s基础上进行以下改进,构建SD−YOLOv5s−4L网络模型:引入SIoU损失函数来解决真实框与预测框方向不匹配的问题,使得模型可以更好地学习目标的位置信息;在YOLOv5s头部引入解耦头,增强网络模型的特征融合与定位准确性,使得模型可以快速捕捉目标的多尺度特征;引入小目标检测层,将原三尺度检测层增至4层,以增强模型对小目标的特征提取能力和检测精度。在矿井电机车多目标检测数据集上进行实验,结果表明:SD−YOLOv5s−4L网络模型对各类目标的平均精度均值(mAP)为97.9%,对小目标的平均检测精度(AP)为98.9%,较YOLOv5s网络模型分别提升了5.2%与9.8%;与YOLOv7,YOLOv8等其他网络模型相比,SD−YOLOv5s−4L网络模型综合检测性能最佳,可为实现矿井电机车无人驾驶提供技术支撑。
    Abstract: Due to complex environmental factors such as uneven illumination and high noise, unmanned electric locomotives in coal mines have low accuracy in multi object detection and difficulty in recognizing small objects. In order to solve the above problems, a multi object detection model for underground unmanned electric locomotives in coal mines based on SD-YOLOv5s-4L is proposed. On the basis of YOLOv5s, the following improvements are made to construct the SD-YOLOv5s-4L network model. The model introduces the SIoU loss function to solve the problem of mismatch between the direction of the real box and the predicted box, so that the model can better learn the position information of the object. The model introduces decoupled heads at the head of YOLOv5s to enhance the feature fusion and positioning accuracy of the network model. It enables the model to quickly capture multi-scale features of the object. The model introduces a small object detection layer to increase the original three scale detection layer to four scale. It enhances the model's feature extraction capability and detection precision for small objects. The experiment is conducted on a multi object detection dataset of the mine electric locomotives. The results show the following points. The mean average precision (mAP) of the SD-YOLOv5s-4L network model for various types of objects is 97.9%, and the average precision (AP) for small objects is 98.9%. Compared with the YOLOv5s network model, it improves by 5.2% and 9.8%, respectively. Compared with other network models such as YOLOv7 and YOLOv8, the SD-YOLOv5s-4L network model has the best comprehensive detection performance and can provide technical support for achieving unmanned driving of the mine electric locomotives.
  • 利用卫星、无人机等拍摄的矿区遥感图像广泛用于矿区生产管理与监测,如道路规划、无人驾驶、塌陷区扰动识别、矿山植被修复监测、土壤侵蚀估算、地质滑坡监测与识别、污染物识别等[1-5]。受设备稳定性、电子元件安装、成像及计算误差、信号传输等因素影响,矿区遥感图像会出现噪声污染、模糊化等情况,导致后续难以获得较好的视觉处理效果。因此,去噪成为遥感图像得以有效应用的重要预处理步骤。

    现有的遥感图像去噪方法大致可分为基于统计方法、基于域变换方法、基于学习方法3类。基于统计方法根据含噪图像本身的统计特征完成去噪,主要包括MF (Mean Filtering,均值滤波)、NLM (Non−Local Mean,非局部均值)滤波、BF (Bilateral Filter,双边滤波)等。文献[6]采用BF进行结构特征保持,实现了矿区遥感图像初步去噪。基于域变换方法是将图像数据转换到频域[7-9],通过阈值函数得到合适的图像分割及处理频率系数,然后进行逆变换重构,得到保留了大部分能量的低频数据对应的去噪图像,主要包括 WT (Wavelet Transform,小波变换)、FT (Fourier Transform,傅里叶变换)等。文献[10]采用提升小波与双参数阈值函数完成矿区遥感图像去噪,结合边缘算子重构了清晰的图像。基于学习方法主要包括2类:① 生成式去噪模型,如字典学习及稀疏表示等,通过学习含噪图像的过完备字典,将图像表示为字典原子稀疏的线性组合,达到去噪目的;② 判别式去噪模型,如深度RNN (Recursive Neural Network,递归神经网络)、CNN (Convolutional Neural Network,卷积神经网络)、GAN (Generative Adversarial Network,生成对抗网络)等,通过学习大量的噪声图像,形成数据映射式的去噪模型[11-13]。文献[14]提出一种基于聚类的组稀疏字典学习方法,并将其用于多光谱遥感图像去噪。文献[15]采用平移不变性的K−SVD (K−Singular Value Decomposition,K奇异值分解)完成字典学习,结合稀疏表示理论,将去噪过程转换为一个L1范数非凸函数优化问题,实现遥感图像去噪。文献[16]针对残差网络提出空洞卷积方法,并扩大神经网络的感知野,提高了遥感图像去噪性能。文献[17]创新性地结合传统WT和GAN进行遥感图像去噪和超分辨率重建,克服了在非GAN下细节趋于平滑的问题。

    上述方法均具有较好的遥感图像去噪效果,但普遍存在细节过度平滑、纹理保持不足等缺点,而纹理细节是遥感图像应用中的重要信息。本文基于引导滤波良好的边缘保持特性,提出了迭代引导滤波方法,可增强遥感图像边缘特征提取效果;将迭代引导滤波与传统去噪方法结合,可提高图像去噪效果;采用迭代引导滤波与BM3D(Block Matching 3D,三维块匹配)融合方法对矿区遥感图像进行去噪处理,结果表明融合方法可在提升去噪性能的同时,很好地保持细节特征。

    引导滤波用1张引导图像对输出图像中像素进行线性表达[18],即

    $$ \begin{array}{c}{q}_{i}={a}_{k}{I}_{i}+{b}_{k} \qquad \forall i\in {w}_{k} \end{array} $$ (1)

    式中:$ {w}_{k} $为以引导图像中任意像素点k为中心的窗口;$ {q}_{i} $为输出图像中窗口$ {w}_{k} $内像素点i的值;$ {a}_{k} $$ {b}_{k} $为线性表达参数;$ {I}_{i} $为引导图像中窗口$ {w}_{k} $内像素点i的值。

    $ {I}_{i} $为待优化输入图像时,输出图像与输入图像之间的梯度存在倍数关系,因此输出图像能够很好地保留输入图像的边缘部分。设待优化输入图像$ {p}_{i} $含有加性噪声$ {n}_{i} $,则其与输出图像的关系为

    $$ \begin{array}{c}{p}_{i}={q}_{i}+{n}_{i} \end{array} $$ (2)

    在窗口$ {w}_{k} $中关于参数$ {a}_{k} $$ {b}_{k} $的引导滤波最小二乘损失函数为

    $$ \begin{array}{c}{L}{\left({a}_{k}\mathrm{,}{b}_{k}\right)}=\displaystyle \sum _{i\in {w}_{k}}\left[{\left({a}_{k}{I}_{i}+{b}_{k}-{p}_{i}\right)}^{2}+\epsilon{{a}_{k}}^{2}\right] \end{array} $$ (3)

    $式中 \epsilon$为输入图像一阶边缘参数约束项的权重。

    式(3)中,ϵak2为输入图像的一阶边缘参数约束项。根据式(3)得

    $$ \begin{array}{c}{a}_{k}=\dfrac{\dfrac{1}{m}\displaystyle \sum _{i\in {w}_{k}}\left({I}_{i}{p}_{i}-{\mu }_{k}{\bar p}_{k}\right)}{{{\sigma }_{k}}^{2}+\epsilon} \end{array} $$ (4)
    $$ \begin{array}{c}{b}_{k}={\bar p}_{k}-{a}_{k}{\mu }_{k} \end{array} $$ (5)

    式中:$ m $为窗口$ {w}_{k} $内的像素个数;$ {\mu }_{k} $$ {{\sigma }_{k}}^{2} $分别为输入图像在窗口$ {w}_{k} $中像素值的均值及方差;$ {\bar p}_{k} $为输入图像在窗口$ {w}_{k} $内的像素均值。

    对输出图像中包含任意像素点i的窗口wi的线性表达参数取均值,得到式(1)的输出结果:

    $$ \begin{array}{c}{q}_{i}=\dfrac{1}{m}\displaystyle \sum\limits_{k:i\in {w}_{k}}\left({a}_{k}{I}_{i}+{b}_{k}\right)={\bar a}_{i}{I}_{i}+{\bar b}_{i} \end{array} $$ (6)
    $$ \begin{array}{c}{\bar a}_{i}=\dfrac{1}{m}\displaystyle \sum \limits_{k\in {w}_{i}}{a}_{k} \end{array} $$ (7)
    $$ \begin{array}{c}{\bar b}_{i}=\dfrac{1}{m}\displaystyle \sum\limits _{k\in {w}_{i}}{b}_{k} \end{array} $$ (8)

    在引导滤波基础上,引入迭代引导滤波,其主要思想是将引导滤波结果与输入图像作差,得到残差图像(主要为输入图像与引导滤波输出图像在边缘上的内容差值及噪声),再对残差图像进行引导滤波,所得结果与最初的引导滤波结果相加,得到最终输出图像,并将该图像作为下一次引导滤波的输入,直至满足迭代条件。迭代引导滤波过程如图1所示。

    图  1  迭代引导滤波过程
    Figure  1.  Iterative guided filtering process

    迭代过程中$ \epsilon $大小会影响$ {a}_{k} $,进而影响$ {\bar a}_{i} $。图像质量随着迭代次数增加不断提高,为了得到更好的边缘保持效果,应增大$ {a}_{k}{I}_{i} $在损失函数中的权重,因此对$ \epsilon $进行更新:

    $$ \begin{array}{c}{\epsilon}_{j}=\dfrac{{\epsilon}_{j-1}}{\sqrt{n}} \end{array} $$ (9)

    式中:$\epsilon_{j} $$\epsilon $在第$j( {j = 1,2}, $$, n)$ 次迭代中的值;$ n $为迭代次数。

    迭代引导滤波具体步骤如下。

    (1) 初始化约束参数$ \epsilon $、迭代次数n及其他结束条件(如图像块梯度变化量、PSNR(Peak Sgnal to Noise. Ratio,峰值信噪比)变化值、残差图像像素二范数等)。

    (2) 输入残差图像。

    (3) 根据式(3)—式(8)进行引导滤波,并将滤波结果与输入残差图像作差,得到残差结果。

    (4) 对残差结果进行引导滤波并输出结果。

    (5) 将步骤(4)中输出结果与输入残差图像相加。

    (6) 判断是否满足迭代次数或其他迭代要求,若是则停止迭代,否则根据式(9)更新参数$ \epsilon $,并转至步骤(2)继续迭代。

    选取1张典型的含高斯噪声图像进行迭代引导滤波,设置窗口半径为1,$ \epsilon $=0.64,n=7,滤波结果如图2所示。可看出经7次迭代引导滤波后,取得了较好的去噪效果。对比首次引导滤波后的残差图像及末次迭代引导滤波后的残差图像(为便于观察,对图像进行了像素值翻转处理),可看出经首次引导滤波后,残差图像中仍存在大量边缘数据,导致滤波结果较为平滑,而末次迭代引导滤波后的残差图像中边缘数据较少,多为离散的噪声数据。以最终输出图像的PSNR为衡量标准,不同迭代次数下PSNR如图3所示。与单次引导滤波相比,迭代引导滤波处理后的图像PSNR提升了2.3 dB。

    图  2  噪声图像迭代引导滤波结果
    Figure  2.  Iterative guided filtering results of noise image
    图  3  迭代引导滤波处理后图像PSNR
    Figure  3.  PSNR of the image processed by iterative guided filtering

    上述研究表明,迭代引导滤波对于具有稀疏特性的残差数据具有很好的边缘保持效果。本文将迭代引导滤波分别与K−SVD字典学习、小波软阈值、NLM滤波、BM3D滤波相结合,用于提升上述方法的去噪性能。在计算机参数为Intel I5−7200U,4 GB RAM,实验平台为Matlab R2016条件下,以图2(a)所示噪声图像为例,采用上述方法进行去噪处理,将去噪结果与输入图像作差,得到残差数据,对其进行迭代引导滤波。以PSNR,SSIM(Structural Similarity,结构相似性)为指标,迭代引导滤波对不同方法去噪性能的提升结果见表1

    表  1  迭代引导滤波对于典型去噪方法的提升结果
    Table  1.  Improvement results of iterative guided filtering to typical denosing methods
    指标K−SVD字典学习小波软阈值NLM滤波BM3D滤波
    PSNR增大值/dB 0.6 1.9 3.1 3.0
    SSIM 0.1 0.2 0.4 0.4
    运算时间增加值/s 0.5 0.7 1.0 1.2
    下载: 导出CSV 
    | 显示表格

    表1可看出:迭代引导滤波对4种方法的去噪性能均有所提升,对BM3D滤波、NLM滤波的提升效果明显,对K−SVD字典学习提升效果稍差,主要原因是K−SVD字典学习根据系数稀疏性实现去噪,而残差图像中的边缘数据不够突出;融合迭代引导滤波后,4种方法的运算时间增加值均较小。

    鉴于迭代引导滤波对BM3D滤波的去噪性能有较好的提升效果,本文采用迭代引导滤波与BM3D滤波融合,对矿区遥感图像进行去噪。BM3D滤波在NLM滤波基础上发展而来,结合了基于统计和基于域变换的图像去噪方法,具有信噪比高、视觉效果好、计算复杂度低等优点。

    BM3D滤波主要包括基础估计和最终估计[19]。基础估计如下。

    (1) 相似块聚类。在输入图像中进行$ {W}_{1} $尺寸网格划分,并在$ {W}_{2} $大小的空间内寻找相似块,将所有相似块组成一个三维块数据。

    (2) 对三维块中第二维块数据进行小波变换,并对第三维数据进行Hadamard一维变换。针对变换结果,采用硬阈值函数进行第三维数据的一维反变换及第二维块数据的二维反变换。

    (3) 将步骤(2)中反变换结果聚合为原位置的同尺寸图像,每个像素点值等于其所在相似块值的加权和。

    最终估计步骤如下。

    (1) 对含噪图像及基础估计处理后得到的图像分别进行相似块聚类,得到2组三维块数据。

    (2) 对得到的2组三维块数据进行与基础估计中步骤(2)相同的变换处理,并对含噪图像三维块数据的变换系数进行维纳滤波缩放。

    (3) 对变换结果加权聚合到原位置,得到输出图像。

    某矿区遥感图像大小为1 206×765,对其进行方差为$ 20 $的高斯处理,模拟成像及信号传输噪声。分别采用小波软阈值、K−SVD字典学习、非局部相似性K−SVD字典学习、BM3D滤波、迭代引导滤波与BM3D滤波融合方法对含噪图像进行处理。其中,小波软阈值中小波基为经验小波;K−SVD字典学习区域划分大小为$ \sqrt{M}\times \sqrt{N} $($ M $,$ N $分别为图像长度和宽度),重建方法为OMP(Orthogonal Matching Pursuit,正交匹配追踪),重建原子个数为20;迭代引导滤波与BM3D滤波融合方法中窗口半径取2,$ \epsilon $=0.64,n=30。图像去噪结果如图4所示,性能指标见表2。可看出迭代引导滤波与BM3D滤波融合方法较其他方法恢复了更多的图像边缘特征,纹理更加丰富,且PSNR更大、SSIM更高。

    图  4  遥感图像去噪结果
    Figure  4.  Denoising results of remote sensing images
    表  2  不同方法的去噪性能对比
    Table  2.  Comparison of denosing performance of different methods
    指标小波软阈值K−SVD
    字典学习
    非局部相似性
    K−SVD字典学习
    BM3D
    滤波
    融合方法
    PSNR/dB 23.6 25.2 27.3 28.2 30.8
    SSIM 0.76 0.72 0.75 0.86 0.92
    下载: 导出CSV 
    | 显示表格

    以煤矸石场识别及矿区滑坡区域分割为例,验证迭代引导滤波与BM3D滤波融合方法的应用效果。某矿区煤矸石场遥感图像如图5所示。针对原始图像及采用融合方法去噪后的图像,采用文献[20]中方法进行煤矸石场识别,将识别结果与人工标注结果进行对比,可看出采用融合方法去噪后区域识别准确率更高。贵州省毕节地区某矿区附近滑坡区域遥感图像如图6所示,采用Canny算子对经融合方法去噪前后的图像边缘进行识别,进而完成区域分割,结果表明去噪后的图像区域划分更接近实际滑坡区域。

    图  5  煤矸石场识别应用效果
    Figure  5.  Application effect of coal gangue yard identification
    图  6  滑坡区域边缘识别应用效果
    Figure  6.  Application effect of landslide area edge recognition

    (1) 在引导滤波基础上,提出了迭代引导滤波。通过对残差信息进行引导映射,并迭代进行引导滤波及超参数收缩,在有效去除图像噪声的同时,更好地保持边缘数据,提升去噪效果。

    (2) 将迭代引导滤波分别与传统的K−SVD字典学习、小波软阈值、NLM滤波、BM3D滤波相结合对图像进行去噪,结果表明输出图像的PSNR、SSIM均得到提升,NLM、BM3D滤波的去噪性能提升效果更明显。

    (3) 将迭代引导滤波与BM3D滤波融合方法应用于矿区遥感图像去噪,结果表明融合方法较其他方法提升了图像PSNR及SSIM,并可获得更好的局部纹理视觉,用于矿区煤矸石场识别及滑坡区域边缘识别场景中取得了较好的效果。

  • 图  1   YOLOv5s网络结构

    Figure  1.   YOLOv5s network structure

    图  2   解耦头结构

    Figure  2.   Decoupled head structure

    图  3   SD−YOLOv5s−4L网络结构

    Figure  3.   SD-YOLOv5s-4L network structure

    图  4   部分数据集图像

    Figure  4.   Partial dataset images

    图  5   不同网络模型检测效果对比

    Figure  5.   Comparison of detection results of different algorithms

    图  6   各组消融实验mAP对比

    Figure  6.   Comparison of mAP in each ablation experiment

    图  7   不同网络模型的mAP对比

    Figure  7.   Comparison of mAP for different network models

    表  1   实验环境

    Table  1   Experimental environment

    实验环境 参数
    操作系统 Ubuntu 18.04
    CPU Intel(R) Xeon(R) Platinum 8350C CPU@2.6 GHz
    GPU RTX 3090(24 GiB)
    深度学习框架 PyTorch 1.9.0
    编程语言 Python 3.8
    CUDA 11.1
    下载: 导出CSV

    表  2   超参数设置

    Table  2   Hyper-parameter setting

    参数名称 数值
    batch-size 32
    momentum 0.937
    decay 0.0005
    learning rate 0.01
    epochs 301
    下载: 导出CSV

    表  3   消融实验结果

    Table  3   Ablation experiment results

    实验网络模型APmAP
    personsignal lightstone
    1YOLOv5s0.9450.9450.8910.927
    2YOLOv5s+ SIoU0.9460.9420.9310.940
    3YOLOv5s+解耦头0.9560.9500.9230.943
    4YOLOv5s+小目标检测层0.9720.9590.9710.968
    5YOLOv5s+SIoU+
    小目标检测层+解耦头
    0.9800.9670.9890.979
    下载: 导出CSV

    表  4   对比实验结果

    Table  4   Comparative experimental results

    实验网络模型APF1mAP
    personsignal lightstone
    1YOLOv5n0.9000.9130.9230.890.912
    2YOLOv5m0.9650.9600.9350.930.954
    3YOLOv5s0.9450.9450.8910.910.927
    4YOLOv70.9670.9500.9210.940.946
    5YOLOv80.9480.9260.9850.920.953
    6SD−YOLOv5s−4L0.9800.9670.9890.960.979
    下载: 导出CSV
  • [1] 王国法,赵国瑞,任怀伟. 智慧煤矿与智能化开采关键核心技术分析[J]. 煤炭学报,2019,44(1):34-41. DOI: 10.13225/j.cnki.jccs.2018.5034

    WANG Guofa,ZHAO Guorui,REN Huaiwei. Analysis on key technologies of intelligent coal mine and intelligent mining[J]. Journal of China Coal Society,2019,44(1):34-41. DOI: 10.13225/j.cnki.jccs.2018.5034

    [2] 孙继平. 煤矿智能化与矿用5G[J]. 工矿自动化,2020,46(8):1-7.

    SUN Jiping. Coal mine intelligence and mine-used 5G[J]. Industry and Mine Automation,2020,46(8):1-7.

    [3] 于骞翔,张元生. 井下电机车轨道障碍物图像处理方法的智能识别技术[J]. 金属矿山,2021(8):150-157. DOI: 10.19614/j.cnki.jsks.202108024

    YU Qianxiang,ZHANG Yuansheng. Track obstacle intelligent recognition technology of mine electric locomotive based on image processing[J]. Metal Mine,2021(8):150-157. DOI: 10.19614/j.cnki.jsks.202108024

    [4] 韩江洪,卫星,陆阳,等. 煤矿井下机车无人驾驶系统关键技术[J]. 煤炭学报,2020,45(6):2104-2115.

    HAN Jianghong,WEI Xing,LU Yang,et al. Driverless technology of underground locomotive in coal mine[J]. Journal of China Coal Society,2020,45(6):2104-2115.

    [5] 胡青松,孟春蕾,李世银,等. 矿井无人驾驶环境感知技术研究现状及展望[J]. 工矿自动化,2023,49(6):128-140. DOI: 10.13272/j.issn.1671-251x.18115

    HU Qingsong,MENG Chunlei,LI Shiyin,et al. Research status and prospects of perception technology for unmanned mining vehicle driving environment[J]. Journal of Mine Automation,2023,49(6):128-140. DOI: 10.13272/j.issn.1671-251x.18115

    [6] 李程,车文刚,高盛祥. 一种用于航拍图像的目标检测算法[J]. 山东大学学报(理学版),2023,58(9):59-70.

    LI Cheng,CHE Wengang,GAO Shengxiang. A object detection algorithm for aerial images[J]. Journal of Shandong University(Natural Science),2023,58(9):59-70.

    [7]

    GIRSHICK R,DONAHUE J,DARRELL T,et al. Rich feature hierarchies for accurate object detection and semantic segmentation[C]. 2014 IEEE Conference on Computer Vision and Pattern Recognition,Columbus,2014:580-587.

    [8]

    HE Kaiming,GKIOXARI G,DOLLAR P,et al. Mask R-CNN[C]. 2017 IEEE International Conference on Computer Vision,Venice,2017:2980-2988.

    [9]

    REDMON J,DIVVALA S,GIRSHICK R,et al. You only look once:unified,real-time object detection[C]. IEEE Conference on Computer Vision and Pattern Recognition,Las Vegas,2016:779-788.

    [10]

    LIU Wei,ANGUELOV D,ERHAN D,et al. SSD:single shot multi-box Detector[C]. European Conference on Computer Vision,2016:21-37.

    [11] 李伟山,卫晨,王琳. 改进的Faster RCNN煤矿井下行人检测算法[J]. 计算机工程与应用,2019,55(4):200-207. DOI: 10.3778/j.issn.1002-8331.1711-0282

    LI Weishan,WEI Chen,WANG Lin. Improved faster RCNN approach for pedestrian detection in underground coal mine[J]. Computer Engineering and Applications,2019,55(4):200-207. DOI: 10.3778/j.issn.1002-8331.1711-0282

    [12]

    HE Deqiang,LI Kai,CHEN Yanjun,et al. Obstacle detection in dangerous railway track areas by a convolutional neural network[J]. Measurement Science and Technology,2021,32(10). DOI: 10.1088/1361-6501/abfdde.

    [13]

    HE Kaiming,ZHANG Xiangyu,REN Shaoqing,et al. Identity mappings in deep residual networks[C]. European Conference on Computer Vision,2016:630-645.

    [14] 郝帅,张旭,马旭,等. 基于CBAM−YOLOv5的煤矿输送带异物检测[J]. 煤炭学报,2022,47(11):4147-4156.

    HAO Shuai,ZHANG Xu,MA Xu,et al. Foreign object detection in coal mine conveyor belt based on CBAM-YOLOv5[J]. Journal of China Coal Society,2022,47(11):4147-4156.

    [15] 郑玉珩,黄德启. 改进MobileViT与YOLOv4的轻量化车辆检测网络[J]. 电子测量技术,2023,46(2):175-183.

    ZHENG Yuheng,HUANG Deqi. Lightweight vehicle detection network based on MobileViT and YOLOv4[J]. Electronic Measurement Technology,2023,46(2):175-183.

    [16] 杨艺,付泽峰,高有进,等. 基于深度神经网络的综采工作面视频目标检测[J]. 工矿自动化,2022,48(8):33-42.

    YANG Yi,FU Zefeng,GAO Youjin,et al. Video object detection of the fully mechanized working face based on deep neural network[J]. Journal of Mine Automation,2022,48(8):33-42.

    [17] 葛淑伟,张永茜,秦嘉欣,等. 基于优化SSD−MobileNetV2的煤矿井下锚孔检测方法[J]. 采矿与岩层控制工程学报,2023,5(2):66-74.

    GE Shuwei,ZHANG Yongqian,QIN Jiaxin,et al. Rock bolt borehole detection method for underground coal mines based on optimized SSD-MobileNetV2[J]. Journal of Mining and Strata Control Engineering,2023,5(2):66-74.

    [18]

    GEVORGYAN Z. SIoU loss:more powerful learning for bounding box regression[EB/OL]. [2023-05-12]. https://arxiv.org/abs/2205.12740.

    [19]

    ZHENG Zhaohui,WANG Ping,REN Dongwei,et al. Enhancing geometric factors in model learning and inference for object detection and instance segmentation[J]. IEEE Transactions on Cybernetics,2021,52(8):8574-8586.

    [20]

    WU Yue,CHEN Yinpeng,YUAN Lu,et al. Rethinking classification and localization for object detection[C]. 2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition,Seattle,2020:10183-10192.

    [21]

    LIN T-Y,DOLLAR P,GIRSHICK R B,et al. Feature pyramid networks for object detection[C]. 2017 IEEE Conference on Computer Vision and Pattern Recognition,Honolulu,2017:936-944.

    [22]

    LIU Shu,QI Lu,QIN Haifang,et al. Path aggregation network for instance segmentation[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition,Salt Lake City,2018:8759-8768.

    [23]

    KARAKAYA M,CELEBI M F,GOK A E,et al. Discovery of agricultural diseases by deep learning and object detection[J]. Environmental Engineering and Management Journal,2022,21(1):163-173. DOI: 10.30638/eemj.2022.016

  • 期刊类型引用(10)

    1. 胡志峰,吴龙华,陈竹安. 基于自组织迁移算法小波阈值矿区遥感图像去噪研究. 江西科学. 2025(01): 59-64 . 百度学术
    2. 裴丹,房坤,庆宇东,陈沛. 基于改进YOLOv5的矿山遥感图像去噪方法. 工矿自动化. 2025(03): 148-155 . 本站查看
    3. 李亦珂,王春梅. 基于离散小波域深度残差学习的矿区遥感图像增强算法. 金属矿山. 2024(04): 215-220 . 百度学术
    4. 徐浩哲,李鑫雨,闫钰亭,王蓁,常远. 基于优化Canny-Ostu算法的爆破块度识别. 有色金属(矿山部分). 2024(03): 50-55 . 百度学术
    5. 樊培利,王建军,艾薇. 基于生成对抗残差学习的矿山远程监控图像去噪算法. 金属矿山. 2024(05): 286-292 . 百度学术
    6. 沈丹萍,赵爽. 基于轻量化YOLOX-S与多阈值分割的矿山遥感图像去噪算法. 金属矿山. 2024(09): 175-180 . 百度学术
    7. 戴文祥,陈雷,闫鹏飞,王利欣,李波,袁鹏喆. 基于三维激光扫描的煤矿巷道形变监测方法. 工矿自动化. 2023(10): 61-67+95 . 本站查看
    8. 樊华,王文旭,李晓阳,陈睿,韩贞辉. 结合非下采样剪切波变换的BM3D去除图像噪声方法研究. 震灾防御技术. 2023(03): 651-663 . 百度学术
    9. 李清运,车守全,王浪威. 基于字典学习的遥感图像去噪方法研究. 山东工业技术. 2022(04): 77-81 . 百度学术
    10. 刘晓明,白宗化. 基于滤波方法的遥感图像去噪算法. 中国电子科学研究院学报. 2022(10): 952-958 . 百度学术

    其他类型引用(2)

图(7)  /  表(4)
计量
  • 文章访问数:  1300
  • HTML全文浏览量:  33
  • PDF下载量:  63
  • 被引次数: 12
出版历程
  • 收稿日期:  2023-07-27
  • 修回日期:  2023-11-16
  • 网络出版日期:  2023-11-26
  • 刊出日期:  2023-11-24

目录

/

返回文章
返回