基于改进YOLOv5s的矿工排队检测方法

郝明月, 闵冰冰, 张新建, 赵作鹏, 吴晨, 王欣

郝明月,闵冰冰,张新建,等. 基于改进YOLOv5s的矿工排队检测方法[J]. 工矿自动化,2023,49(11):160-166. DOI: 10.13272/j.issn.1671-251x.2023030058
引用本文: 郝明月,闵冰冰,张新建,等. 基于改进YOLOv5s的矿工排队检测方法[J]. 工矿自动化,2023,49(11):160-166. DOI: 10.13272/j.issn.1671-251x.2023030058
HAO Mingyue, MIN Bingbing, ZHANG Xinjian, et al. A miner queue detection method based on improved YOLOv5s[J]. Journal of Mine Automation,2023,49(11):160-166. DOI: 10.13272/j.issn.1671-251x.2023030058
Citation: HAO Mingyue, MIN Bingbing, ZHANG Xinjian, et al. A miner queue detection method based on improved YOLOv5s[J]. Journal of Mine Automation,2023,49(11):160-166. DOI: 10.13272/j.issn.1671-251x.2023030058

基于改进YOLOv5s的矿工排队检测方法

基金项目: 国家自然科学基金资助项目(61976217)。
详细信息
    作者简介:

    郝明月(1978—),男,河南永城人,工程师,现主要从事煤矿安全技术管理工作,E-mail:312518453@qq.com

  • 中图分类号: TD76

A miner queue detection method based on improved YOLOv5s

  • 摘要: 传统的目标检测算法识别矿工排队异常行为时需人工提取特征,检测时间长、检测精度低;基于卷积神经网络的目标检测算法在检测速度和精度上有所提升,但在遮挡、昏暗和光照不均等场景下的检测效果难以保障。针对上述问题,提出了一种改进YOLOv5s(HPI−YOLOv5s)模型,并将其用于矿工排队检测。HPI−YOLOv5s模型在YOLOv5s模型的基础上对路径聚合网络(PANet)进行改进,通过删除单个输入边节点、增加双向交叉路径,构建了一种双向交叉特征金字塔网络(BCrFPN)进行多尺度特征融合。鉴于手动设置阈值的标签分配策略鲁棒性不高,在自适应训练样本选择(ATSS)动态设置阈值的基础上,提出动态标签分配策略(ATSS_PLUS),更合理地评估候选样本的质量,动态设定每个真实目标的阈值,具有更高的检测精度和鲁棒性。通过半平面交法计算人脸框与所划定排队区域的相交面积,并将相交面积和人脸框面积之比与设置的阈值比较以判断矿工是否有序排队。实验结果表明:HPI−YOLOv5s模型比YOLOv5s模型的准确率提高了1.9%,权重大小减少了32%,参数量减少了6.9%,检测速度提高了7.8%,且针对遮挡、昏暗、光照不均的矿井图像,能够更准确地识别矿工排队情况。
    Abstract: Traditional object detection algorithms require manual feature extraction when recognizing abnormal behavior of miners queuing, resulting in long detection time and low detection precision. The object detection algorithm based on convolutional neural networks has improved detection speed and precision. But its detection performance is difficult to guarantee in scenarios of obstruction, dimness, and uneven illumination. In order to solve the above problems, an improved YOLOv5s (HPI YOLOv5s) model is proposed. It is used for miner queue detection. The HPI-YOLOv5s model improves the path aggregation network (PANet) on the basis of the YOLOv5s model. By deleting a single input edge node and adding bidirectional crossing paths, a bidirectional cross feature pyramid network (BCrFPN) is constructed for multi-scale feature fusion. Considering the low robustness of label allocation strategies with manually set thresholds, a dynamic label allocation strategy (ATSS-PLUS) is proposed based on adaptive training sample selection (ATSS) to dynamically set thresholds. It can reasonably evaluate the quality of candidate samples and dynamically set thresholds for each real object, resulting in higher detection precision and robustness. The method calculates the intersection area between the face frame and the designated queue area using the half plane intersection method. The method compares the ratio of the intersection area to the face frame area with the set threshold to determine whether the miners are queuing in an orderly manner. The experimental results show that the HPI-YOLOv5s model has an accuracy improvement of 1.9%, a weight reduction of 32%, a parameter reduction of 6.9%, and a detection speed improvement of 7.8% compared to the YOLOv5s model. Moreover, it can more accurately recognize the queuing situation of miners in obstruction, dimness, and uneven illumination mine images.
  • 规范的生产秩序是煤矿安全生产的必然要求。“三班倒”的群体矿工在候罐、候车和等候矿山架空乘人索道时需要排队,若出现秩序混乱的情况,将影响工作效率、破坏生产秩序,进而产生安全问题[1-2]

    人工监管矿工排队行为,难以做到对多时段、多场所排队行为的全覆盖管理。随着人工智能技术的不断发展,深度学习在实时监测矿工排队秩序方面日益重要[3]。目前,常用的煤矿井下目标检测算法有传统的目标检测算法和基于卷积神经网络(Convolutional Neural Networks,CNN)的目标检测算法[4]。传统的目标检测算法识别排队异常行为时需人工提取特征,工作量大,易对插队等异常情况产生误检。如张海彬等[5]提出了一种基于背景差分法的室内排队检测方法,在室内背景变化不大的场所采用固定的摄像头,对室内场景进行背景建模,应用背景差分法处理当前捕捉到的彩色图像与彩色背景模型,根据处理后图像中队伍所占画面的比例计算出当前排队人数。该方法虽然能够准确识别室内排队行为,但准确度会受图像质量的影响,无法适用于井下光照不均、昏暗的场景。基于CNN的目标检测算法可提取层与层之间的连接和空间信息,且可表示图像内的相关特征[6-7],从而有效进行排队检测。如陈国栋等[8]采用OpenPose提取人体骨架序列,采用OpenCV测量人体骨架关键点距离,能够在光线良好的环境中检测异常排队行为。但该方法对于视频质量要求较高,需要精准地测量出前后2个人的眼部距离和手部距离,不能满足煤矿井下光线受限的环境检测需求。

    YOLOv5s作为CNN在目标检测领域的代表性模型,能够在简单场景检测中实现较高的准确率,具有较高的稳定性和可泛化能力,且计算量小,确保在资源受限的环境中也能进行有效部署[9-10]。但对于井下高粉尘、低光照等复杂环境导致的图像质量较差时,YOLOv5s模型检测效果难以保证。因此,本文在YOLOv5s模型基础上进行改进,融合双向交叉特征金字塔网络(Bidirectional Cross Feature Pyramid Network,BCrFPN)和自适应训练样本选择(Adaptive Training Sample Selection,ATSS)动态标签分配策略(ATSS_PLUS),构建了一种更高性能的YOLOv5s(Higher Performance Improvement-YOLOv5s,HPI−YOLOv5s)模型用于矿工排队检测,针对遮挡、昏暗、光照不均等煤矿井下环境具有较高的检测精度和速度。

    HPI−YOLOv5s结构如图1所示。使用ImageNet对骨干网络进行预训练,并将BCrFPN作为特征网络,从骨干网络中获取每层特征,反复进行自上而下和自下而上的双向交叉特征融合。这些融合的特征被输入到分类预测网络和回归预测网络,进行类别预测和边界框参数回归。分类预测网络和回归预测网络的权重在每一层网络中共享[11]

    图  1  HPI−YOLO5s结构
    Figure  1.  Higher performance improvement-YOLO5s structure

    YOLOV5s使用路径聚合网络(Path Aggregation Network,PANet)[12]代替特征金字塔网络(Feature Pyramid Network,FPN)[13],改善了传统FPN单向信息流限制的问题,具有更好的精度,但需要更多的参数和计算成本。为解决该问题,提出了一种结构简单、高效的BCrFPN。如果1个节点只有1条输入边,不利于进行多尺度特征融合,因此删除该节点;如果输入到输出节点处于同一级别,则添加1条额外的边,使其在不增加太多成本的情况下融合更多特征;与PANet只有1个自上而下和1个自下而上的路径不同,BCrFPN将每个双向(自上而下和自下而上)路径作为1个特征网络层,并多次重复同一层,以实现更高级的特征融合。

    BCrFPN在重复应用自上向下和自下向上的多尺度特征融合时,由于不同的输入特征具有不同的分辨率,引入可学习权重来学习每个输入特征的重要性。本文采用快速归一化融合方法:

    $$ O=\sum _{i}\frac{{w}_{i}}{\varepsilon +{\displaystyle\sum }_{j}{w}_{j}}{I}_{i} $$ (1)

    式中:$ O $为输出特征;$ {w}_{i} $,wj为第ij个特征的可学习权重,ij∈[1,n],n为权重个数,ijε为极小值,以避免数值不稳定,本文取0.000 1;$ {I}_{i} $为输入特征。

    通过在每个wi之后应用ReLU来保证wi≥0。类似地,每个标准化权重范围为0~1,由于没有Softmax操作,计算速度更快。

    YOLOv5s的标签分配策略与之前YOLO系列[14-15]的标签分配策略不同,不再使用预定义的锚框和真实框的交并比(Intersection of Union,IoU)作为判断标准,而是使用锚框和真实框的宽高比例来判断锚框是否适合作为正样本,当宽高比小于手动设置的阈值时,则判定该锚框为正样本。但这种标签分配策略存在一定的局限:① 忽略了网络的预测结果,不能很好地评估样本的质量。② 为每个真实目标增加正样本数量的方式过于简单,仅在匹配网格的临近网格进行选择。③ 手动设置阈值的方式鲁棒性不高,需根据数据集精细调整阈值。

    因此,本文引进ATSS标签分配策略[16],并为了更好地选取高质量的正样本,对ATSS标签分配策略进行优化,将其命名为ATSS_PLUS。具体来说:对于候选区域,本文将样本候选区域设置为真实目标的中心部分;对于正样本的判定标准,结合网络预测的分类结果和定位结果来评估候选样本的质量;对于阈值设置,使用ATSS中动态指定阈值的方式。

    $$ t=s+{\lambda }G $$ (2)
    $$ T={t}_{\mathrm{m}\mathrm{e}\mathrm{a}\mathrm{n}}+{t}_{\mathrm{s}\mathrm{t}\mathrm{d}} $$ (3)

    式中:t为正样本的质量得分;s为网络预测的候选样本与真实目标对应的类别得分;λ为平衡因子;G为网络预测的回归框与真实框的IoU;T为正样本选取的阈值;tmeantstd分别为t的平均值和方差。

    在所有候选样本中选取t大于T的样本为正样本。由于这种标签分配方式对预定义的锚框数量不敏感,所以对于每个网格,本文只设置1个预定义锚框。这种基于ATSS改进的标签分配策略相比于YOLOv5s的标签分配策略,使用了网络的预测结果,更合理地评估了每个候选样本的质量,且阈值是针对每个真实目标动态设定的,因此具有更高的检测精度和鲁棒性。

    通过人脸识别准确捕捉到人脸后,计算人脸框与所划定排队区域的相交面积,并将相交面积与人脸框面积之比与设置的阈值进行比较,以判断矿工是否有序地站在队列中[17]

    矿工排队时通常分散且难以形成规整的队列。若采用规则的矩形(图2(a)中绿色框)作为排队区域,其尺寸难以与矿工实际排队的形态相匹配,因此选择多边形作为排队区域(图2(b)中绿色框)。

    图  2  排队区域
    Figure  2.  Queue area

    当排队区域为凸多边形时,使用半平面交法计算人脸框与排队区域的相交面积;当排队区域为凹多边形时,先将凹多边形分解为多个凸多边形,再计算人脸框与排队区域的相交面积。

    半平面交法先把每个凸多边形的点按照逆时针排序,再将每个凸多边形的边放入边集L。求半平面交的面积,需先求边集L的半平面交,过程如图3所示。首先选取一个正方向(一般为逆时针),以保证核在有向线段的左边;然后将有向线段通过极角排序,排序之后的线段是有序的,可以在双端队列里进行操作;最后按顺序遍历每条线段,取左边区域,删右边区域,剩下的蓝色部分就是多边形的和,即所有直线的半平面交。在此过程中,需使用叉积求出两平面的交点,从而判断直线X是否处于直线Y的逆时针方向。

    图  3  求解半平面交过程
    Figure  3.  Process of solving the half-plane intersection
    $$ X\times Y=\left|X\right|\times \left|Y\right|\mathrm{sin}\;\theta $$ (4)

    式中:$ \times $为叉积操作;$ \theta $为直线XY之间的夹角。

    在计算人脸框与排队区域的相交面积后,根据相交面积来判断队列的有序性。若相交面积与人脸框面积之比小于阈值,则认为异常排队,否则认为正常排队。

    $$ M=\left\{ \begin{array}{c}0\quad \dfrac{f}{q} < Q\\ 1\quad \dfrac{f}{q}\geqslant Q\end{array}\right. $$ (5)

    式中:M=0代表异常排队,M=1代表正常排队;f为人脸框与排队区域的相交面积;q为人脸框面积;Q为阈值。

    实验环境为Ubuntu 18.04操作系统,配置Intel(R) Core(TM) i5−7400 CPU @ 3.00 GHz的CPU处理器,24 GiB的运行内存,GeForce RTX 3090的GPU。实验使用PyTorch框架对井下矿工排队行为进行检测。

    实验使用Wider Face数据集、MAFA数据集和自建井下矿工人脸检测数据集对模型进行训练。

    由于井下矿工排队需要对矿工人脸进行检测,所以选择Wider Face数据集进行训练。Wider Face数据集标注了393 703张人脸数据。对于每张人脸都附带更加详细的信息,包括模糊程度、表情、光照、遮挡、姿态。在数据集中,根据事件场景的类型分为61个类,每个类别按照70%,10%,20%的比例划分到训练集、验证集及测试集中。

    MAFA数据集共有30 811张图像,该数据集标注出了有遮挡的人脸面部,但没有遮挡的面部没有标出,因此在实验前用LabelImg重新对MAFA数据集进行标注,并选取70%作为训练集,10%作为验证集,20%作为测试集。

    自建井下矿工人脸检测数据集中所有图像均由河南龙宇能源股份有限公司陈四楼煤矿视频监控系统提供。系统提供矿工排队视频300段,每段视频中都包含正确排队和插队的情况。在这些视频中提取10 000张图像,并使用LabelImg进行人工标注。本实验选取8 000张图像作为训练集,2 000张图像作为测试集。其中正常排队7 563张图像,异常排队2 437张图像。为了优化排队检测性能,除了使用常用的数据增强手段(如图像平移、缩放、剪切、翻转)外,本文还使用了数据增强方法Mosaic[18]。随机将4张训练图像按一定比例拼接成一幅新的图像,能够丰富训练集,避免过拟合。由于井下环境昏暗,不利于模型训练,所以利用 Python脚本实现暗光增强技术[19],对自建井下矿工人脸检测数据集中图像的暗光区域进行亮度增强。

    采用不同的目标检测模型SSD、YOLOv3、YOLOv4、YOLOv5s、Deit及本文提出的HPI−YOLOv5s模型进行对比实验。为保证公平性,采用最高权重分别在MAFA、Wider Face和自建井下矿工人脸检测数据集上进行实验。

    选取准确率A、召回率R、精确率P、特异性S来评估模型在数据集上表现的优劣[20-21]

    $$ A= \frac{{N}_{\mathrm{T}\mathrm{P}}+{N}_{\mathrm{T}\mathrm{N}}}{{N}_{\mathrm{T}\mathrm{P}}+{N}_{\mathrm{F}\mathrm{N}}+{N}_{\mathrm{F}\mathrm{P}}+{N}_{\mathrm{T}\mathrm{N}}} $$ (6)
    $$ R= \frac{{N}_{\mathrm{T}\mathrm{P}}}{{N}_{\mathrm{T}\mathrm{P}}+{N}_{\mathrm{F}\mathrm{N}}} $$ (7)
    $$ P= \frac{{N}_{\mathrm{T}\mathrm{P}}}{{N}_{\mathrm{T}\mathrm{P}}+{N}_{\mathrm{F}\mathrm{P}}} $$ (8)
    $$ S= \frac{{N}_{\mathrm{T}\mathrm{N}}}{{N}_{\mathrm{F}\mathrm{P}}+{N}_{\mathrm{T}\mathrm{N}}} $$ (9)

    式中:$ {N}_{\mathrm{T}\mathrm{P}} $为分类器识别正确,分类器认为该样本是正样本;$ {N}_{\mathrm{T}\mathrm{N}} $为分类器识别正确,分类器认为该样本是负样本;$ {N}_{\mathrm{F}\mathrm{N}} $为分类器识别结果错误,分类器认为该样本是负样本,实际上该样本是正样本;$ {N}_{\mathrm{F}\mathrm{P}} $为分类器识别结果错误,分类器认为该样本是正样本,实际上该样本是负样本。

    不同模型在MAFA数据集、Wider Face数据集和自建井下矿工人脸检测数据集上的性能见表1表3。可看出HPI−YOLOv5s模型在3个数据集上的准确率、精确率、特异性均最优,仅在MAFA数据集和自建井下矿工人脸检测数据集上,HPI−YOLOv5s模型的召回率分别比YOLOv5s模型、Deit模型略低。

    表  1  不同模型在MAFA数据集上的性能
    Table  1.  Performance of different models on MAFA dataset %
    模型准确率精确率召回率特异性
    SSD59.3460.9258.6058.56
    YOLOv469.0072.2068.5068.44
    YOLOv5s70.0072.0071.6070.34
    HPI−YOLOv5s72.9073.1070.8071.00
    下载: 导出CSV 
    | 显示表格
    表  2  不同模型在Wider Face数据集上的性能
    Table  2.  Performance of different models on Wider Face dataset %
    模型 准确率 精确率 召回率 特异性
    SSD 58.24 61.10 59.56 58.20
    YOLOv3 67.50 71.34 69.30 65.80
    YOLOv4 69.66 72.12 68.98 67.70
    YOLOv5s 71.40 72.50 70.60 71.80
    HPI−YOLOv5s 73.20 73.10 71.80 72.00
    下载: 导出CSV 
    | 显示表格
    表  3  不同模型在自建井下矿工人脸检测数据集上的性能
    Table  3.  Performance of different models on self-built miner face detection dataset %
    模型准确率精确率召回率特异性
    SSD58.4057.2058.0056.80
    YOLOv359.3459.4058.5656.70
    YOLOv459.3858.6058.3059.67
    YOLOv5s60.1060.6061.4061.90
    Deit60.0060.2062.9061.18
    HPI−YOLOv5s61.9062.0061.8062.65
    下载: 导出CSV 
    | 显示表格

    为验证BCrFPN和ATSS_PLUS的有效性,在自建井下矿工人脸检测数据集上进行消融实验,结果见表4。可看出在YOLOv5s模型中添加BCrFPN后,显著减少了网络冗余,降低了计算复杂度,但准确率降低了0.1%;在YOLOv5s模型中添加ATSS后,相比原始YOLOv5s模型准确率提高了0.4%;对ATSS进行优化后,在YOLOv5s模型中添加ATSS_PLUS比ATSS的准确率提高了1.6%,比YOLOv5s模型的准确率提高了2%,弥补了引入BCrFPN造成的精度损失;将BCrFPN和ATSS_PLUS合并到YOLOv5s模型中,比YOLOv5s模型的准确率提高了1.9%,权重大小减少了32%,参数量减少了6.9%,检测速度提高了7.8%。

    表  4  消融实验结果
    Table  4.  Ablation experiment results
    模型 准确率/% 权重大
    小/MiB
    每秒浮点运
    算次数/109
    参数量/
    106
    检测速度/
    (帧·s−1
    YOLOv5s 60.1 15.3 15.9 7.020 92 115
    YOLOv5s
    (BCrFPN)
    60.0 9.7 8.5 4.683 97
    YOLOv5s
    (ATSS)
    60.5 14.2 10.7 5.098 05
    YOLOv5s
    (ATSS_PLUS)
    62.1 12.9 9.7 6.452 74
    HPI−YOLOv5s 62.0 10.4 9.0 6.530 91 124
    下载: 导出CSV 
    | 显示表格

    为了选择合适的阈值,实验选择正常排队图像682张,异常排队图像318张,对不同阈值下的检测效果进行比较。当阈值分别为0.4,0.5,0.6时,检测准确率分别为82.1%,85.4%,83.8%,因此设置阈值为0.5。

    在自建井下矿工人脸检测数据集上的矿工排队检测结果如图4所示。在所选区域内,绿色框表示正常排队,蓝色框表示异常排队。从图4(a)可看出,矿工均在正常排队;从图4(b)可看出,异常排队人员被检测出来,并用蓝色框标注。

    图  4  矿工排队检测结果
    Figure  4.  Miner queue detection results

    为直观验证HPI−YOLOv5s模型的有效性,选择YOLOv3,YOLOv4,YOLOv5s 3种主流模型在自建井下矿工人脸检测数据集(选择遮挡、光照不均、昏暗3种场景)上进行矿工排队检测对比实验,结果如图5所示。

    图  5  煤矿不同场景下不同模型排队检测效果对比
    Figure  5.  Comparison of queue detection effect of different models in different scenarios of coal mines

    图5可看出,在出现矿工遮挡的情况时,YOLOv3,YOLOv4,YOLOv5s模型识别矿工时置信度偏低,但HPI−YOLOv5s模型由于引入了ATSS_PLUS,更好地选取高质量的正样本,因此能更精确地检测矿工人脸,置信度较高。在光照严重不均的情况下,YOLOv3和YOLOv4模型均出现误检和检测不全的情况,虽然YOLOv5s模型未出现这种情况,但检测结果的置信度极低,而HPI−YOLOv5s模型通过BCrFPN可高效进行多尺度特征融合,比其他模型具有更高的检测精度。在昏暗环境下,虽没有出现误检和漏检的情况,但由于光照不足,导致图像质量下降,影响YOLOv3和YOLOv4模型的检测精度,而HPI−YOLOv5s模型能更好地适应昏暗环境,具有较高的检测精度。

    1) 针对井下矿工不按规定排队的现象,提出了一种HPI−YOLOv5s模型用于矿工排队检测。该模型在YOLOv5s模型基础上,构建了一种高效的BCrFPN作为特征网络,能够进行多尺度特征融合,提高检测效率;对ATSS标签分配策略进行改进,可更好地选取高质量的正样本,有效提高检测精度;通过计算人脸框与所划定排队区域的相交面积,并将相交面积与人脸框面积之比与阈值进行比较来判断队列的有序性。

    2) 与YOLOv5s模型相比,HPI−YOLOv5s模型的准确率提高了1.9%,权重大小减少了32%,参数量减少了6.9%,检测速度提高了7.8%,且针对遮挡、昏暗、光照不均的矿井图像,能够更准确地识别矿工排队情况。

  • 图  1   HPI−YOLO5s结构

    Figure  1.   Higher performance improvement-YOLO5s structure

    图  2   排队区域

    Figure  2.   Queue area

    图  3   求解半平面交过程

    Figure  3.   Process of solving the half-plane intersection

    图  4   矿工排队检测结果

    Figure  4.   Miner queue detection results

    图  5   煤矿不同场景下不同模型排队检测效果对比

    Figure  5.   Comparison of queue detection effect of different models in different scenarios of coal mines

    表  1   不同模型在MAFA数据集上的性能

    Table  1   Performance of different models on MAFA dataset %

    模型准确率精确率召回率特异性
    SSD59.3460.9258.6058.56
    YOLOv469.0072.2068.5068.44
    YOLOv5s70.0072.0071.6070.34
    HPI−YOLOv5s72.9073.1070.8071.00
    下载: 导出CSV

    表  2   不同模型在Wider Face数据集上的性能

    Table  2   Performance of different models on Wider Face dataset %

    模型 准确率 精确率 召回率 特异性
    SSD 58.24 61.10 59.56 58.20
    YOLOv3 67.50 71.34 69.30 65.80
    YOLOv4 69.66 72.12 68.98 67.70
    YOLOv5s 71.40 72.50 70.60 71.80
    HPI−YOLOv5s 73.20 73.10 71.80 72.00
    下载: 导出CSV

    表  3   不同模型在自建井下矿工人脸检测数据集上的性能

    Table  3   Performance of different models on self-built miner face detection dataset %

    模型准确率精确率召回率特异性
    SSD58.4057.2058.0056.80
    YOLOv359.3459.4058.5656.70
    YOLOv459.3858.6058.3059.67
    YOLOv5s60.1060.6061.4061.90
    Deit60.0060.2062.9061.18
    HPI−YOLOv5s61.9062.0061.8062.65
    下载: 导出CSV

    表  4   消融实验结果

    Table  4   Ablation experiment results

    模型 准确率/% 权重大
    小/MiB
    每秒浮点运
    算次数/109
    参数量/
    106
    检测速度/
    (帧·s−1
    YOLOv5s 60.1 15.3 15.9 7.020 92 115
    YOLOv5s
    (BCrFPN)
    60.0 9.7 8.5 4.683 97
    YOLOv5s
    (ATSS)
    60.5 14.2 10.7 5.098 05
    YOLOv5s
    (ATSS_PLUS)
    62.1 12.9 9.7 6.452 74
    HPI−YOLOv5s 62.0 10.4 9.0 6.530 91 124
    下载: 导出CSV
  • [1] 饶天荣,潘涛,徐会军. 基于交叉注意力机制的煤矿井下不安全行为识别[J]. 工矿自动化,2022,48(10):48-54.

    RAO Tianrong,PAN Tao,XU Huijun. Identification of unsafe behaviors in coal mines based on cross-attention mechanism[J]. Journal of Mine Automation,2022,48(10):48-54.

    [2] 李琰,刘珍,陈南希. 基于矿工大数据的不安全行为主题挖掘与语义分析[J]. 煤矿安全,2023,54(9):254-257.

    LI Yan,LIU Zhen,CHEN Nanxi. Topic mining and semantic analysis of unsafe behavior based on miner big data[J]. Safety in Coal Mines,2023,54(9):254-257.

    [3] 崔丽珍,张清宇,郭倩倩,等. 基于CNN−LSTM的井下人员行为模式识别模型[J]. 无线电工程,2023,53(6):1375-1381. DOI: 10.3969/j.issn.1003-3106.2023.06.017

    CUI Lizhen,ZHANG Qingyu,GUO Qianqian,et al. Underground personnel behavior pattern recognition model based on CNN-LSTM[J]. Radio Engineering,2023,53(6):1375-1381. DOI: 10.3969/j.issn.1003-3106.2023.06.017

    [4] 王科平,连凯海,杨艺,等. 基于改进YOLOv4的综采工作面目标检测[J]. 工矿自动化,2023,49(2):70-76.

    WANG Keping,LIAN Kaihai,YANG Yi,et al. Target detection of the fully mechanized working face based on improved YOLOv4[J]. Journal of Mine Automation,2023,49(2):70-76.

    [5] 张海彬,黄晶,宋志强,等. 一种基于背景差分法的室内排队人数检测方法[J]. 电子测量技术,2019,42(14):123-126.

    ZHANG Haibin,HUANG Jing,SONG Zhiqiang,et al. Detection method of the number of people of indoor queues based on background difference method[J]. Electronic Measurement Technology,2019,42(14):123-126.

    [6]

    ZHU Di,ZHANG Fan,WANG Shengyin,et al. Understanding place characteristics in geographic contexts through graph convolutional neural networks[J]. Journal of Planning Literature,2020,35(3):362-363.

    [7]

    JATI A,GEORGIOU P. Neural predictive coding using convolutional neural networks toward unsupervised learning of speaker characteristics[J]. IEEE/ACM Transactions on Audio,Speech,and Language Processing,2019,27(10):1577-1589. DOI: 10.1109/TASLP.2019.2921890

    [8] 陈国栋,严铮,赵志峰,等. 一种基于OpenPose和OpenCV的公共场所排队异常行为检测方法:CN202111251971. X[P]. 2022-01-28.

    CHEN Guodong,YAN Zheng,ZHAO Zhifeng,et al. A method for detecting abnormal queuing behavior in public places based on OpenPose and OpenCV:CN202111251971. X[P]. 2022-01-28.

    [9] 侯公羽,陈钦煌,杨振华,等. 基于改进YOLOv5的安全帽检测算法[J/OL]. 工程科学学报:1-15[2023-11-03]. http://kns.cnki.net/kcms/detail/10.1297.TF.20231103.1351.004.html.

    HOU Gongyu,CHEN Qinhuang,YANG Zhenhua,et al. Safety helmet detection algorithm based on improved YOLOv5[J/OL]. Chinese Journal of Engineering:1-15[2023-11-03]. http://kns.cnki.net/kcms/detail/10.1297.TF.20231103.1351.004.html.

    [10] 张释如,黄综浏,张袁浩,等. 基于改进YOLOv5的煤矸识别研究[J]. 工矿自动化,2022,48(11):39-44.

    ZHANG Shiru,HUANG Zongliu,ZHANG Yuanhao,et al. Coal and gangue recognition research based on improved YOLOv5[J]. Journal of Mine Automation,2022,48(11):39-44.

    [11]

    LIN T Y,GOYAL P,GIRSHICK R,et al. Focal loss for dense object detection [C]. IEEE International Conference on Computer Vision,Venice,2017:2999-3007.

    [12] 张倩,刘紫燕,陈运雷,等. 融合Transformer和改进PANet的YOLOv5s交通标志检测[J]. 传感技术学报,2023,36(2):232-241.

    ZHANG Qian,LIU Ziyan,CHEN Yunlei,et al. Fusion transformer and improved PANet for YOLOv5s traffic sign detection[J]. Chinese Journal of Sensors and Actuators,2023,36(2):232-241.

    [13] 郭宝鑫,谢晓尧,刘嵩. 改进ResNet50和FPN的多尺度目标检测算法研究[J/OL]. 贵州师范大学学报(自然科学版):1-9[2023-11-03]. http://kns.cnki.net/kcms/detail/52.5006.N.20230925.1017.006.html.

    GUO Baoxin,XIE Xiaoyao,LIU Song. Research on improved multiscale object detection algorithm of ResNet50 and FPN[J/OL]. Journal of Guizhou Normal University(Natural Sciences):1-9[2023-11-03]. http://kns.cnki.net/kcms/detail/52.5006.N.20230925.1017.006.html.

    [14]

    REDMON J,DIVVALA S,GIRSHICK R,et al. You only look once:unified,real-time object detection[EB/OL]. [2023-02-25]. https://arxiv.org/abs/1506.02640.

    [15]

    REDMON J,FARHADI A. YOLO9000:better,faster,stronger[C]. IEEE Conference on Computer Vision and Pattern Recognition,Honolulu,2017:7263-7271.

    [16]

    ARION N,MASSA F,SYNNAEVE G,et al. End-to-end object detection with transformers[C]. Proceedings of the Computer Vision ,Glasgow,2020:213–229.

    [17] 邵文泽,胡洪明,李金叶,等. 一种适应不同距离的低清人脸深度识别算法[J]. 南京邮电大学学报(自然科学版),2023,43(1):1-10.

    SHAO Wenze,HU Hongming,LI Jinye,et al. Deep recognition of low-res faces in varying different distances[J]. Journal of Nanjing University of Posts and Telecommunications (Natural Science Edition),2023,43(1):1-10.

    [18] 王星,白尚旺,潘理虎,等. 一种矿井图像增强算法[J]. 工矿自动化,2017,43(3):48-52.

    WANG Xing,BAI Shangwang,PAN Lihu,et al. A mine image enhancement algorithm[J]. Industry and Mine Automation,2017,43(3):48-52.

    [19] 姚超修,蒋泽,胡亚磊. 基于改进EnlightenGAN的煤矿井下图像增强算法[J]. 煤炭技术,2023,42(9):219-222.

    YAO Chaoxiu,JIANG Ze,HU Yalei. Improved image enhancement algorithm for underground coal mine based on enlightenGAN[J]. Coal Technology,2023,42(9):219-222.

    [20] 彭章龙. 基于YOLOX的低光照条件下目标检测算法研究[D]. 荆州:长江大学,2023.

    PENG Zhanglong. Research on object detection algorithm under low light conditions based on YOLOX [D]. Jingzhou:Yangtze University,2023.

    [21] 邵小强,李鑫,杨涛,等. 改进YOLOv5s和DeepSORT的井下人员检测及跟踪算法[J/OL]. 煤炭科学技术:1-12[2023-11-03]. https://doi.org/10.13199/j.cnki.cst.2022-1933.

    SHAO Xiaoqiang,LI Xin,YANG Tao,et al. Detection and tracking algorithm for underground personnel of improved YOLOv5s and DeepSORT[J/OL]. Coal Science and Technology:1-12[2023-11-03]. https://doi.org/10.13199/j.cnki.cst.2022-1933.

  • 期刊类型引用(2)

    1. 李海川,贺星亮,贾仟国,李利. 基于S3DD-YOLOv8n的矿工行为检测算法. 矿业安全与环保. 2024(05): 96-104 . 百度学术
    2. 王欣怡,王传真,蒋凤成. 基于视频分帧和YOLO算法的煤泥水浊度识别研究. 选煤技术. 2024(05): 20-26 . 百度学术

    其他类型引用(0)

图(5)  /  表(4)
计量
  • 文章访问数:  172
  • HTML全文浏览量:  87
  • PDF下载量:  35
  • 被引次数: 2
出版历程
  • 收稿日期:  2023-03-16
  • 修回日期:  2023-11-11
  • 网络出版日期:  2023-11-26
  • 刊出日期:  2023-11-24

目录

/

返回文章
返回