井下矿工多目标检测与跟踪联合算法

周孟然, 李学松, 朱梓伟, 黄凯文

周孟然,李学松,朱梓伟,等. 井下矿工多目标检测与跟踪联合算法[J]. 工矿自动化,2022,48(10):40-47. DOI: 10.13272/j.issn.1671-251x.2022060040
引用本文: 周孟然,李学松,朱梓伟,等. 井下矿工多目标检测与跟踪联合算法[J]. 工矿自动化,2022,48(10):40-47. DOI: 10.13272/j.issn.1671-251x.2022060040
ZHOU Mengran, LI Xuesong, ZHU Ziwei, et al. A joint algorithm of multi-target detection and tracking for underground miners[J]. Journal of Mine Automation,2022,48(10):40-47. DOI: 10.13272/j.issn.1671-251x.2022060040
Citation: ZHOU Mengran, LI Xuesong, ZHU Ziwei, et al. A joint algorithm of multi-target detection and tracking for underground miners[J]. Journal of Mine Automation,2022,48(10):40-47. DOI: 10.13272/j.issn.1671-251x.2022060040

井下矿工多目标检测与跟踪联合算法

基金项目: 国家重点研发计划项目(2018YFC0604503);安徽省自然科学基金资助项目(2008085UD06)。
详细信息
    作者简介:

    周孟然(1965—),男,安徽淮南人, 教授,博士,博士研究生导师,研究方向为矿山机电系统监测、光电信息处理、煤矿安全监测监控,E-mail:mrzhou8521@163.com

  • 中图分类号: TD67

A joint algorithm of multi-target detection and tracking for underground miners

  • 摘要: 针对现有的煤矿井下矿工多目标跟踪算法检测速度慢、识别精度低等问题,提出了一种基于改进YOLOv5s模型与改进Deep SORT算法的多目标检测与跟踪联合算法。多目标检测部分,在YOLOv5s的基础上进行改进,得到YOLOv5s−GAD模型:引入幻象瓶颈卷积(GhostConv)模块和深度可分离卷积(DWConv)模块,分别替换YOLOv5s模型骨干网络和路径聚合网络中的BottleneckCSP模块,以提高特征提取速度;针对井下光线暗、图像噪点多等特点,在最小特征图中引入高效通道注意力神经网络(ECA−Net)模块,以提高模型整体精度。多目标跟踪部分,使用全尺度网络(OSNet)替换Deep SORT中的浅层残差网络进行全方位特征学习,以更好地实现行人重识别,提高目标跟踪的准确性。实验结果表明:在自定义数据集Miner21上,YOLOv5s−GAD模型的平均精度(交并比为0.5时)达97.8%,帧率达140.2 帧/s,多目标检测效果优于常用的Faster RCNN,YOLOv3,YOLOv5s模型;在公开行人数据集MOT17上,多目标检测与跟踪联合算法的速度与准确率等综合性能优于IOU17,Deep SORT等常用多目标跟踪算法,人员身份转换次数最少,行人重识别效果最好;采用井下矿工多目标检测与跟踪联合算法能够及时检测并跟踪井下矿工,多目标跟踪效果良好。
    Abstract: The existing multi-target tracking algorithms for underground miners has the problems of slow detection speed and low recognition precision. In order to solve the above problems, a joint algorithm of multi-target detection and tracking algorithm based on the improved YOLOv5s model and the improved Deep SORT algorithm is proposed. In the part of multi-target detection, the YOLOv5s-GAD model is obtained by improving YOLOv5s model. The GhostConv module and the depthwise separable convolution (DWConv) module are introduced to replace the BottleneckCSP module in the YOLOv5s model backbone network and path aggregation network respectively. Therefore, the feature extraction speed is improved. Considering the characteristics of dark underground light and many noisy images, the efficient channel attention neural network (ECA-Net) module is introduced into the minimum feature map to improve the model's overall precision. In the part of multi-target tracking, the omni-scale network (OSNet) is used to replace the shallow residual network in Deep SORT to carry out omni-directional feature learning. Therefore, pedestrian re-identification and target tracking precision are improved. The experimental result shows that on the custom dataset Miner21, the YOLOv5s-GAD model average preciscom (when the intersection of union ratio is 0.5) reaches 97.8%, and the frame rate reaches 140.2 frames/s. The multi-target detection effect is better than the commonly used Faster RCNN, YOLOv3 and YOLOv5s models. On the public miners dataset MOT17, the speed and accuracy of the multi-target detection and tracking joint algorithm are better than those of IOU17, Deep SORT and other common multi-target tracking algorithms. The proposed model has the least number of personnel identity conversions and the best miner re-recognition effect. The joint algorithm of multi-target detection and tracking for underground miners can detect and track underground miners in time, and the multi-target tracking effect is good.
  • 随着我国煤炭开采量的持续增长,矿井开采深度逐渐增大,井下风温升高,许多矿井的开采条件恶化,热害问题日益突出,严重制约着深部煤炭资源的安全高效开采。为准确评估矿井热害程度,制定科学合理的降温措施,改善井下高温作业环境,矿井风温预测至关重要。

    近年来机器学习在岩爆指标预测[1-2]、瓦斯涌出量预测[3-4]、瓦斯渗透率预测[5-6]等方面广泛应用,取得了较好的成果,在矿井风温预测方面也有学者进行了研究。高佳南等[7]通过粒子群优化(Particle Swarm Optimization,PSO)算法对支持向量回归(Support Vector Regression,SVR)参数进行优化,建立了矿井淋水井筒风温预测模型,提高了风温预测精度。纪俊红等[8]使用网格搜索算法和K折交叉验证优化XGBoost模型,建立了井底风温预测模型,解决了XGBoost模型参数多、复杂性大的问题。吕品等[9]首次建立了基于BP神经网络的矿井淋水井筒风温预测模型,为矿井风温预测提供了新思路。张翔等[10]建立了基于PSO−BP的淋水井筒风温预测模型,通过PSO算法优化BP神经网络,解决了BP神经网络易陷入局部最优的问题。马恒等[11]结合模糊方法和人工神经网络,建立了淋水井筒的T−S模糊神经网络风温预测模型,提高了预测模型的精度。段艳艳[12]利用支持向量机(Support Vector Machine, SVM)强大的非线性能力,建立了基于SVM的矿井风温预测模型。张群[13]建立了基于改进BP神经网络的井底风温预测模型,通过trainlm函数对 BP 神经网络进行优化,解决了BP神经网络收敛速度慢的问题。

    上述研究为井下热害防治提供了理论依据。在井下风温预测过程中,大多数学者采用具有强大非线性处理能力的BP神经网络,但其预测精度受学习样本数量的影响,且容易陷入局部最优。Elman神经网络是一种动态的前馈性神经网络,其隐含层中增加了一个承接层,可认为是延时算子,主要用于隐含层前一时刻输出值的记忆和存储。与BP神经网络相比,延时算子使Elman神经网络具备局部记忆能力,提高了神经网络的稳定性和动态适应能力。但Elman神经网络仍然存在收敛速度过慢、易陷入局部最优的问题。本文采用PSO算法对Elman神经网络的权重和阈值进行优化调整,建立了基于PSO−Elman神经网络的井底风温预测模型,并通过19个矿井的实测数据[8,10-11,14]进行验证。

    Elman神经网络主要由输入层、隐含层、承接层和输出层构成,如图1所示。承接层属于内部反馈连接,其神经元与隐含层神经元一一对应。

    图  1  Elman神经网络结构
    Figure  1.  Elman neural network structure

    Elman神经网络的非线性空间函数为[15-18]

    $$ x\left(k\right)=f\left({{\boldsymbol{w}}}_{1}{x}_{{\mathrm{c}}}\left(k\right)+{{\boldsymbol{w}}}_{2}u\left(k-1\right)+{b}_{1}\right) $$ (1)
    $$ y\left(k\right)=h\left({{\boldsymbol{w}}}_{3}x\left(k\right)+{b}_{2}\right) $$ (2)
    $$ {x}_{{\mathrm{c}}}\left(k\right)=x\left(k-1\right) $$ (3)

    式中:$ x\left(k\right) $为第k次循环隐含层输出;$ f\left( \cdot \right) $为隐含层的激励函数;$ {{\boldsymbol{w}}}_{1} $,$ {{\boldsymbol{w}}}_{2} $分别为输入层到隐含层、承接层到隐含层的连接权重矩阵;$ {x}_{{\mathrm{c}}}\left(k\right) $为第k次循环承接层输出,对应第k−1次循环隐含层输出;$ u\left(k-1\right) $为网络输入;$ {b}_{1} $,$ {b}_{2} $分别为输入层到隐含层、隐含层到输出层的阈值;${\boldsymbol{w}}_3 $为输出层的权重矩阵; $ y\left(k\right) $为输出层输出,即预测的风温;$ h\left( \cdot \right) $为输出层的激励函数。

    PSO 算法是一种全局优化算法,通过个体间相互作用对可行解空间进行迭代搜索,最终获得最优解[19-21]。PSO算法流程如图2所示。首先对参数和粒子进行初始化,计算适应度,更新粒子速度和位置,更新种群;然后引入变异算子,重新初始化粒子,计算新粒子适应度;最后确定个体最优解和全局最优解,当达到设定的迭代次数时结束迭代。

    图  2  PSO算法流程
    Figure  2.  Flow of particle swarm optimization algorithm

    粒子速度和位置更新公式为

    $$ v_i^t = \omega v_i^{t - 1} + {c_1}{r_1}\left( {l_{{{\mathrm{pbest}}}_i^t} - X_i^t} \right) + {c_2}{r_2}\left( {l_{{{\mathrm{gbest}}^t}} - X_i^t} \right) $$ (4)
    $$ X_i^{t + 1} = X_i^t + X_i^t $$ (5)

    式中:$ {v}_{i}^{t} $为第$ i $个粒子在第$ t $次迭代时的速度;$ \omega $为惯性权重,$ \omega $∈[0,1.4];$ {c}_{1} $,$ {c}_{2} $为学习因子;$ {r}_{1} $,$ {r}_{2} $为[0,1]的随机数,用于增加搜索的随机性;$ l_{{\mathrm{{pbest}}}_{i}^{t}} $为第$ i $个粒子在第$ t $次迭代时经过的最好位置,即局部最优解;$ {X}_{i}^{t} $为第$ i $个粒子在第$ t $次迭代时的位置;$ l_{{{\mathrm{gbest}}}^{t}} $为所有粒子在第$ t $次迭代时经过的最好位置,即全局最优解。

    利用PSO算法优化Elman神经网络,建立井底风温预测模型,其流程如图3 所示。

    图  3  PSO−Elman模型流程
    Figure  3.  Flow of PSO−Elman model

    1) 确定Elman网络各层结构。影响井底风温的主要因素有4个,分别为入风相对湿度、入风温度、地面大气压力和井筒深度,因此输入数据为4维。输出为井底风温,因此输出数据为1维。设计Elman网络结构为4−9−1,即输入层节点个数为4,隐含层节点个数为9,输出层节点个数为1。

    2) 归一化处理。对样本数据进行归一化处理,生成模型训练样本集。

    3) 新建Elman网络。训练函数选用traingdm,输入层和输出层的传递函数分别选用tansig,purelin。算法参数设置:PSO算法最大迭代次数为100,种群数目为20,惯性权重$ {\omega }={1.2} $,学习因子$ {{c}}_{\text{1}}{=}{{c}}_{\text{2}}{=2} $,最大更新速度为1,最小更新速度为−1。

    4) 产生初始粒子。产生一个初始种群,初始化粒子的速度,计算适应度,并初始化粒子全局最优解和局部最优解。

    5) 迭代寻优。更新粒子速度和位置,更新种群;引入变异算子,重新初始化粒子,计算新粒子适应度,确定局部最优解和全局最优解,将每代最优解记录到数组中。

    6) 训练Elman神经网络。设置最大迭代次数为100,训练目标最小误差为10−5,学习速率为0.1。

    7) 预测井底风温。用训练好的模型进行井底风温预测。

    采用平均绝对误差(Mean Absolute Error,MAE)、平均绝对百分比误差(Mean Absolute Percentage Error,MAPE)、均方误差(Mean−Square Error,MSE)和决定系数R2对井底风温的预测结果进行评价。

    MAE是预测值误差实际情况的反映,其计算公式为

    $$ E_{{\mathrm{MA}}} = \frac{1}{n}\sum\limits_{j = 1}^n {\left| {{P_j} - {A_j}} \right|} $$ (6)

    式中:$ n $为数据个数;$ {P}_{j} $为预测值;$ A_j $为测量值。

    MAPE是相对误差度量值,其计算公式为

    $$ E_{\mathrm{MAP}} = \frac{1}{n}\sum\limits_{j = 1}^n {\left| {\frac{{{P_j} - {A_j}}}{{{A_j}}}} \right|} \times 100{\text{%}} $$ (7)

    MSE是预测值与测量值之差的平方的期望值,其值越小,表示预测模型的精度越高。MSE计算公式为

    $$ E_{\mathrm{MS}} = \frac{1}{n}{\sum\limits_{j = 1}^n {\left( {{P_j} - {A_j}} \right)} ^2} $$ (8)

    决定系数反映测量值与预测值的分布趋势,其值越接近1,表示相关性越强。决定系数计算公式为

    $$ {R^2} = 1 - \frac{{\displaystyle\sum\limits_{j = 1}^n {{{\left( {{A_j} - {P_j}} \right)}^2}} }}{{\displaystyle\sum\limits_{j = 1}^n {{{\left( {{A_j} - \overline A } \right)}^2}} }} $$ (9)

    式中$\overline A $为测量值的平均值。

    将入风相对湿度、入风温度、地面大气压力和井筒深度作为模型的输入数据。风流自井口流入井下,地面风流温度和地面大气压力影响井筒风温。自压缩热是井底最主要的热源,空气的自压缩热对井筒风温影响较大,井筒深度与风流压缩密切相关,因此,井筒深度也影响井筒风温。井筒一般有淋水现象,风流和井筒淋水间存在热湿交换。地面入风的相对湿度影响风流与淋水巷道的湿交换程度。

    选用19个矿井的65 组数据作为样本数据。其中前55组数据作为训练集,用于构建预测模型;后10组数据作为测试集,用于检验模型预测效果。部分样本数据见表1

    表  1  样本数据
    Table  1.  Sample data
    序号 地面大气
    压力/Pa
    入风
    温度/℃
    入风相对
    湿度/%
    井筒
    深度/m
    井底
    风温/℃
    1 99862.8 26.8 80.23 558.90 25.6
    2 99936.2 27.7 76.78 558.90 27.8
    3 99868.9 26.5 80.05 552.50 26.5
    4 99982.3 27.6 74.26 552.50 27.6
    5 99965.1 26.8 78.88 673.20 25.3
    $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $ $\vdots $
    63 92240.0 14.0 51.70 417.54 16.2
    64 91860.0 13.8 58.40 417.54 16.0
    65 91420.0 12.2 67.60 417.54 15.2
    下载: 导出CSV 
    | 显示表格

    在相同的训练集下,比较Elman模型与PSO−Elman模型的收敛速度,二者的进化曲线如图4所示。可看出Elman模型迭代90次后收敛,而PSO−Elman模型迭代41次后收敛,说明PSO−Elman模型收敛速度更快。

    图  4  预测模型的进化曲线
    Figure  4.  Evolution curves of prediction models

    为验证基于PSO−Elman的井底风温预测模型的预测效果,将BP神经网络模型、SVR模型、Elman模型与PSO−Elman模型进行比较。BP神经网络模型利用Matlab软件自带的BP神经网络工具箱进行预测,BP神经网络结构为4−7−1;SVR模型的惩罚因子C=22.627 4,核函数参数$g $=0.031 3;Elman模型的神经网络结构为4−8−1;PSO−Elman模型的神经网络结构为4−9−1。利用相同的训练数据集和测试数据集,比较4种模型的预测精度,结果见表2。分析可知,BP神经网络模型、SVR模型、Elman模型与PSO−Elman模型的相对误差范围分别为−6.01%~17.02%,−9.52%~1.41%,−7.91%~0.70%,−6.55%~1.12%,PSO−Elman模型的相对误差最小,预测效果最好。

    表  2  4种模型的井底风温预测结果及误差
    Table  2.  Prediction results and errors of bottom air temperature of four models
    样本
    编号
    真实
    值/℃
    BP神经网络模型 SVR模型 Elman模型 PSO−Elman模型
    预测
    值/℃
    绝对误
    差/℃
    相对误
    差/%
    预测
    值/℃
    绝对误
    差/℃
    相对误
    差/%
    预测
    值/℃
    绝对误
    差/℃
    相对误
    差/%
    预测
    值/℃
    绝对误
    差/℃
    相对误
    差/%
    1 27.9 27.2131 −0.6869 −2.46 27.8983 −0.0017 −0.01 27.7709 −0.1291 −0.46 27.8026 −0.0974 −0.35
    2 27.6 26.9595 −0.6405 −2.32 27.7180 0.1180 0.43 27.0653 0.0053 0.02 27.6048 0.0048 −0.02
    3 28.9 27.2982 −1.6018 −5.54 27.9765 −0.9235 −3.20 27.8461 −1.0539 −3.65 27.8981 −1.0019 −3.47
    4 27.4 27.1367 −0.2633 −0.96 27.6248 0.2248 0.82 27.5246 0.1246 0.45 27.6149 0.2149 0.78
    5 28.0 27.4548 −0.5452 −1.95 28.3935 0.3935 1.41 28.1950 0.1950 0.70 28.1494 0.1494 0.53
    6 16.2 16.4894 0.2894 1.79 15.2606 −0.9394 −5.80 15.1536 −1.0464 −6.46 16.3820 0.1820 1.12
    7 15.8 14.8908 −0.9092 −5.75 14.6212 −1.1788 −7.46 14.6948 −1.1052 −6.99 14.7649 −1.0351 −6.55
    8 16.2 15.2269 −0.9731 −6.01 15.0037 −1.1963 −7.38 14.9791 −1.2209 −7.54 15.4598 −0.7402 −4.57
    9 16.0 16.4385 0.4385 2.74 14.8663 −1.1337 −7.09 14.8427 −1.1573 −7.23 15.7786 −0.2214 −1.38
    10 15.2 17.7870 2.5870 17.02 13.7536 −1.4464 −9.52 13.9971 −1.2029 −7.91 15.3130 0.1130 −0.74
    下载: 导出CSV 
    | 显示表格

    4种井底风温预测模型在测试集上的预测结果和误差分别如图5图6所示。从图5可看出,相比于其他模型,PSO−Elman模型的预测值与真实值曲线更为接近,说明其预测效果更好。从图6可看出,PSO−Elman模型的预测误差最小,说明该预测模型的准确性和可靠性最高。

    图  5  4种预测模型在测试集上的预测结果
    Figure  5.  Prediction results of four prediction models on test set
    图  6  4种预测模型在测试集上的预测误差
    Figure  6.  Prediction errors of four prediction models on test set

    4种预测模型的评估指标见表3。可看出,与BP神经网络模型、SVR模型和Elman模型相比,PSO−Elman模型预测误差更低,MAE,MSE,MAPE分别为0.376 0 ℃,0.278 3,1.95%。4种模型的决定系数$ {{R}}^{\text{2}} $非常接近1,表明预测模型具有良好的预测效果。实验结果表明,PSO−Elman模型具有较高的稳定性和准确性。

    表  3  4种预测模型的评估指标
    Table  3.  Evaluation indicators of four prediction models
    模型 MAE/℃ MSE MAPE/% $ {R}^{2} $
    BP神经网络 0.8935 1.2557 4.65 0.9658
    SVR 0.7556 0.8153 4.31 0.9985
    Elman 0.7241 0.7774 4.14 0.9788
    PSO−Elman 0.3760 0.2783 1.95 0.9924
    下载: 导出CSV 
    | 显示表格

    为了进一步验证PSO−Elman模型的预测精度及通用性,于2022年10月3日实测了河南省安阳市某矿井的5组数据,利用训练好的模型进行井底风温预测。井下实测数据见表4,预测数据评估结果见表5,井底风温预测值与真实值对比如图7所示。

    表  4  井下实测数据
    Table  4.  Underground measured data
    测点位置 入风温度/℃ 入风相对
    湿度/%
    地面大气
    压力/Pa
    井筒深度/m 井底风温/℃
    副井 20.8 71.40 104610 521.5 24.3
    21.2 82.00 104660 521.5 23.0
    回风联络巷 21.6 88.00 102668 521.5 22.6
    一车场 21.8 86.90 104633 521.5 22.8
    运输大巷 22.4 78.80 106604 521.5 24.6
    下载: 导出CSV 
    | 显示表格
    表  5  井底风温预测数据评估结果
    Table  5.  Evaluation results of prediction data of bottom air temperature
    真实值/℃ 预测值/℃ 绝对误差/℃ 相对误差% MSE
    24.3 24.46 0.14 0.66 0.26
    23.0 22.82 −0.18 −0.78
    22.6 21.54 −1.06 −4.69
    22.8 23.09 0.29 1.27
    24.6 24.38 −0.22 −0.89
    下载: 导出CSV 
    | 显示表格

    分析表5图7可知,PSO−Elman模型的相对误差范围为−4.69%~1.27%,绝对误差范围为−1.06~0.29 ℃,MSE为0.26,整体预测精度可满足井下实际需要,验证了PSO−Elman模型在井底风温预测中应用具有可行性。

    图  7  井底风温预测值与真实值对比
    Figure  7.  Comparison between predicted and actual values of bottom air temperature

    1) 在相同的训练样本数据下,Elman模型迭代90次后收敛,PSO−Elman模型迭代41次后收敛,说明PSO−Elman模型收敛速度更快。

    2) BP神经网络模型、SVR模型、Elman模型与PSO−Elman模型的相对误差范围分别为−6.01%~17.02%,−9.52%~1.41%,−7.91%~0.70%,−6.55%~1.12%,PSO−Elman模型的相对误差最小,预测效果最好。

    3) 与BP神经网络模型、SVR模型和Elman模型相比,PSO−Elman模型的预测误差更低,MAE,MSE,MAPE分别为0.376 0 ℃,0.278 3,1.95%,决定系数$ {{R}}^{\text{2}} $为0.992 4,非常接近1,表明预测模型具有良好的预测效果。

    4) 实例验证结果表明,PSO−Elman模型的相对误差范围为−4.69%~1.27%,绝对误差范围为−1.06~0.29 ℃,MSE为0.26,整体预测精度可满足井下实际需要。

  • 图  1   井下矿工多目标检测与跟踪联合算法流程

    Figure  1.   Flow of joint algorithm of multi-target detection and tracking for underground miners

    图  2   YOLOv5s−GAD模型

    Figure  2.   YOLOv5s-GAD model

    图  3   标准卷积过程

    Figure  3.   Standard convolution process

    图  4   DWConv过程

    Figure  4.   Depthwise separable convolution process

    图  5   OSNet结构

    Figure  5.   Omni-scale network structure

    图  6   数据集图像

    Figure  6.   Dataset image

    图  7   各模型训练过程

    Figure  7.   Training process of each model

    图  8   各种目标检测模型效果对比

    Figure  8.   Comparison of effects of various target detection models

    图  9   井下矿工多目标检测与跟踪结果

    Figure  9.   Multi-target detection and tracking results of underground miners

    表  1   不同模型消融实验结果

    Table  1   Ablation experiment results of different models

    模型图像尺
    寸/像素
    参数量/
    106
    计算量/
    byte
    AP/%帧率/
    (帧·s−1)
    基准网络640×6407.216.596.656.3
    加入 GhostConv640×6405.59.695.998.6
    加入 GhostConv, DWConv640×6400.73.594.5165.1
    加入 ECA−Net640×6407.818.298.247.2
    加入GhostConv,
    DWConv , ECA−Net
    640×6401.24.297.8140.2
    下载: 导出CSV

    表  2   目标检测模型实验结果

    Table  2   Experimental results of target detection models

    模型图像尺
    寸/像素
    参数量/
    106
    计算量/
    byte
    AP/%帧率/
    (帧·s−1)
    Faster RCNN600×60084.0200.098.38.4
    YOLOv3640×64032.079.672.920.4
    YOLOv5s640×6407.216.596.656.3
    YOLOv5s−GAD640×6401.24.297.8140.2
    下载: 导出CSV

    表  3   多目标检测与跟踪联合算法实验结果

    Table  3   Experimental results of joint algorithms of multi-target detection and tracking

    算法A/%R/%IT/%L/%帧率/(帧·s−1)
    IOU1745.539.45 98815.740.5147.8
    MOTDT1750.952.72 47417.535.720.6
    Deep SORT60.361.22 44231.520.320.0
    FairMOT73.772.33 30343.217.325.9
    本文算法55.254.21 52320.035.588.0
    下载: 导出CSV
  • [1] 张立亚. 基于动目标特征提取的矿井目标监测[J]. 煤炭学报,2017,42(增刊2):603-610. DOI: 10.13225/j.cnki.jccs.2017.1333

    ZHANG Liya. Mine target monitoring based on feature extraction of moving target[J]. Journal of China Coal Society,2017,42(S2):603-610. DOI: 10.13225/j.cnki.jccs.2017.1333

    [2] 刘艺,李蒙蒙,郑奇斌,等. 视频目标跟踪算法综述[J]. 计算机科学与探索,2022,16(7):1504-1515. DOI: 10.3778/j.issn.1673-9418.2111105

    LIU Yi,LI Mengmeng,ZHENG Qibin,et al. Survey on video object tracking algorithms[J]. Journal of Frontiers of Computer Science and Technology,2022,16(7):1504-1515. DOI: 10.3778/j.issn.1673-9418.2111105

    [3]

    CIAPARRONE G,SANCHEZ F L,TABIK S,et al. Deep learning in video multi-object tracking:a survey[J]. Neurocomputing,2020,381:61-88. DOI: 10.1016/j.neucom.2019.11.023

    [4]

    JIANG Daihong,DAI Lei,LI Dan,et al. Moving-object tracking algorithm based on PCA-SIFT and optimization for underground coal mines[J]. IEEE Access,2019,7:35556-35563. DOI: 10.1109/ACCESS.2019.2899362

    [5] 孔丽丽,易春求. 矿用智能安全头盔的设计[J]. 中国矿业,2020,29(12):95-98,115.

    KONG Lili,YI Chunqiu. Design of mine intelligent safety helmet[J]. China Mining Magazine,2020,29(12):95-98,115.

    [6] 郭曦,谢炜,朱红秀,等. 井下目标跟踪与测距方法研究[J]. 煤炭工程,2019,51(3):117-121.

    GUO Xi,XIE Wei,ZHU Hongxiu,et al. Target tracking and ranging method in underground mine[J]. Coal Engineering,2019,51(3):117-121.

    [7]

    REN Shaoqing,HE Kaiming,GIRSHICK R,et al. Faster R-CNN:towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2017,39(6):1137-1149. DOI: 10.1109/TPAMI.2016.2577031

    [8] 王琳,卫晨,李伟山,等. 结合金字塔池化模块的YOLOv2的井下行人检测[J]. 计算机工程与应用,2019,55(3):133-139. DOI: 10.3778/j.issn.1002-8331.1710-0236

    WANG Lin,WEI Chen,LI Weishan,et al. Pedestrian detection based on YOLOv2 with pyramid pooling module in underground coal mine[J]. Computer Engineering and Applications,2019,55(3):133-139. DOI: 10.3778/j.issn.1002-8331.1710-0236

    [9]

    REDMON J, FARHADI A. Yolov3: an incremental improvement[EB/OL]. [2022-05-10]. https://arxiv.org/abs/1804.02767.

    [10]

    BOCHKOVSKIY A, WANG C Y, LIAO H Y M. Yolov4: optimal speed and accuracy of object detection[EB/OL]. [2022-05-10]. https://arxiv.org/abs/2004.10934.

    [11]

    REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]. IEEE Conference on Computer Vision and Pattern Recognition, Las Vegas, 2016: 779-788.

    [12]

    BEWLEY A, GE Z, OTT L, et al. Simple online and real-time tracking[C]. IEEE International Conference on Image Processing, Phoenix, 2016: 3464-3468.

    [13]

    WOJKE N, BEWLEY A, PAULUS D. Simple online and real-time tracking with a deep association metric[C]. IEEE International Conference on Image Processing, Beijing, 2017: 3645-3649.

    [14]

    ZHOU Kaiyang, YANG Yongxin, CAVALLARO A, et al. Omni-scale feature learning for person re-identification[EB/OL]. [2022-05-10]. https://arxiv.org/abs/1905.00953.

    [15] 孙彦景,魏力,张年龙,等. 联合DD−GAN和全局特征的井下人员重识别方法[J]. 西安电子科技大学学报,2021,48(5):201-211. DOI: 10.19665/j.issn1001-2400.2021.05.023

    SUN Yanjing,WEI Li,ZHANG Nianlong,et al. Person re-identification method combining the DD-GAN and global feature in a coal mine[J]. Journal of Xidian University,2021,48(5):201-211. DOI: 10.19665/j.issn1001-2400.2021.05.023

    [16]

    HE Kaiming,ZHANG Xiangyu,REN Shaoqing,et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence,2015,37(9):1904-1916. DOI: 10.1109/TPAMI.2015.2389824

    [17]

    LIU Shu, QI Lu, QIN Haifang, et al. Path aggregation network for instance segmentation[EB/OL]. [2022-05-10]. https://arxiv.org/abs/1803.01534.

    [18]

    HAN Kai, WANG Yunhe, TIAN Qi, et al. Ghostnet: more features from cheap operations[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, 2020: 1580-1589.

    [19]

    HOWARD A G, ZHU Menglong, CHEN Bo, et al. Mobilenets: efficient convolutional neural networks for mobile vision applications[EB/OL]. [2022-05-10]. https://arxiv.org/abs/1704.04861.

    [20]

    GUO Menghao,XU Tianxing,LIU Jiangjiang,et al. Attention mechanisms in computer vision:a survey[J]. Computational Visual Media,2022(3):331-368.

    [21]

    CHAUDHAN S,MITHAL V,POLATKAN G,et al. An attentive survey of attention models[J]. ACM Transactions on Intelligent Systems and Technology,2021,12(5):1-32.

    [22] 张宸嘉,朱磊,俞璐. 卷积神经网络中的注意力机制综述[J]. 计算机工程与应用,2021,57(20):64-72.

    ZHANG Chenjia,ZHU Lei,YU Lu. Review of attention mechanism in convolutional neural networks[J]. Computer Engineering and Applications,2021,57(20):64-72.

    [23]

    WANG Qilong, WU Banggu, ZHU Pengfei, et al. ECA-Net: efficient channel attention for deep convolutional neural networks[C]. IEEE/CVF Conference on Computer Vision and Pattern Recognition, Seattle, 2020: 11531-11539.

    [24] 陈翰林. 基于YOLO v4−tiny的煤矿职工井下违章行为识别的研究[D]. 淮南: 安徽理工大学, 2021.

    CHEN Hanlin. Identification of underground violation behavior of coal mine workers based on YOLO v4-tiny[D]. Huainan: Anhui University of Science and Technology, 2021.

    [25]

    BOVHINSKI E, EISELEIN V, SIKORA T. High-speed tracking-by-detection without using image information[C]. 14th IEEE International Conference on Advanced Video and Signal Based Surveillance, Lecce, 2017: 1-6.

    [26]

    CHEN Long, AI Haizhou, ZHUANG Zijie, et al. Real-time multiple people tracking with deeply learned candidate selection and person re-identification[C]. IEEE International Conference on Multimedia and Expo, San Diego, 2018: 1-6.

    [27]

    ZHANG Yifu,WANG Chunyu,WANG Xinggang,et al. Fairmot:on the fairness of detection and re-identification in multiple object tracking[J]. International Journal of Computer Vision,2021,129(11):3069-3087. DOI: 10.1007/s11263-021-01513-4

    [28]

    BERNARDIN K, STIEFELHAGEN R. Evaluating multiple object tracking performance: the clear mot metrics[J]. EURASIP Journal on Image and Video Processing, 2008. DOI: 10.1155/2008/246309.

  • 期刊类型引用(5)

    1. 陈湘源,饶天荣,潘涛. 基于半监督学习的煤矿井下行人检测模型. 煤炭技术. 2024(02): 231-234 . 百度学术
    2. 王娜,温静,冯佳,卢娜利,刘翠华,智佳,王子阳,黄锦. 基于人工智能深度学习算法辅助诊断早期ESCC的研究. 胃肠病学和肝病学杂志. 2024(02): 156-161 . 百度学术
    3. 罗磊,谢竹逵. 基于改进YOLOv8的交通标志检测算法. 机电工程技术. 2024(03): 205-210 . 百度学术
    4. 杨伟康,吕文生,杨鹏,张宇栋,党龙飞. 基于倒置残差的井下无人车目标检测研究. 矿业研究与开发. 2024(04): 222-227 . 百度学术
    5. 孙林,陈圣,姚旭龙,张艳博,陶志刚,梁鹏. 煤矿井下残缺信息的多目标检测方法研究. 煤炭科学技术. 2024(S2): 211-220 . 百度学术

    其他类型引用(8)

图(9)  /  表(3)
计量
  • 文章访问数:  374
  • HTML全文浏览量:  61
  • PDF下载量:  54
  • 被引次数: 13
出版历程
  • 收稿日期:  2022-06-12
  • 修回日期:  2022-09-23
  • 网络出版日期:  2022-08-11
  • 刊出日期:  2022-10-25

目录

/

返回文章
返回