经验交流
张春堂, 管利聪
(青岛科技大学 自动化与电子工程学院, 山东 青岛 266100)
摘要:针对因矿山人员流动复杂性导致监管困难及因下井人员安全意识不强导致不能有效穿戴安保设备等问题,设计了基于SSD-MobileNet的矿工安保穿戴设备检测系统。将SSD算法的特征提取网络VGG16替换成MobileNet网络,构建了SSD-MobileNet算法模型;按照VOC2007数据集标准制作矿工安保穿戴设备的照片数据集,对SSD-MobileNet算法模型进行训练;采用SSD-MobileNet算法识别矿工8件安保穿戴设备(安全帽、防尘面具、工作服、工作靴、手电筒、自救器、定位卡、防砸背夹),根据矿工多张不同角度的照片的最高置信度结果综合判定是否穿戴了某件安保设备,并将最高置信度阈值设置为75%。测试结果表明,该系统能够实时、准确地检测出矿工安保设备的穿戴情况,且具有良好的稳定性和抗干扰性。
关键词:煤炭开采; 目标检测; 安保穿戴设备; SSD-MobileNet; 置信度
为了有效约束矿工的安全生产行为,矿井管理人员需要检查下井矿工的安保设备(安全帽、防尘面具、工作服、工作靴、手电筒、自救器、定位卡、防砸背夹)是否穿戴齐全。由于煤矿企业监管力度不够、一线矿工安全开采意识不强等,往往存在下井矿工安保设备穿戴不足的情况,这种不安全行为增加了矿工开采的危险系数。因此,亟需开发一套矿工安保穿戴设备检测系统,以有效约束矿工安全生产行为,提升矿井安全管理水平。
传统的目标检测方法包括HOG(Histogram of Oriented Gradient,方向梯度直方图)特征法[1]、Haar-Like特征法[2]、LBP (Local Binary Pattern,局部二值模式)特征法[3],这些方法的检测算子涉及的特征层次较浅。深度学习算法[4-8]具有特征层次深、检测准确率高、鲁棒性好等优点,已被逐步应用到各领域的目标检测中[9]。基于深度学习的目标检测方法主要分为2类:一类是基于区域候选模型的算法,如Fast-RCNN[10]、Faster-RCNN[11]及R-FCN[12]等,这类算法的检测结果精度较高,但是速度较慢,对硬件资源的要求较高;另一类是基于回归模型的算法,典型代表有YOLO(You Only Look Once)[13]、SSD(Single Shot MultiBox Detector,单镜头多盒检测器)[14],这类算法运行速度快,对系统要求低,能够做到实时检测,但缺点是对小目标检测精度较低。
SSD是一种直接预测目标类别和边界框的多目标检测算法,它结合了Faster-RCNN算法的anchors机制及YOLO算法的回归思想,可以提取不同纵横比图像的特征并减少训练参数量,从而在保证准确度的同时提高算法实时性。为了能够在保证检测精度的同时进一步提高检测速度,本文提出了基于SSD-MobileNet的矿工安保穿戴设备检测系统,将SSD算法的特征提取网络VGG16替换成MobileNet网络,并使用SSD-MobileNet算法识别矿工8件安保穿戴设备,实现对矿工安保穿戴设备的实时检测功能。
MobileNet将传统的卷积分为深度卷积(Depthwise)和逐点卷积(Pointwise)2个部分。传统3D卷积网络与MobileNet卷积网络对比如图1所示。从图1可以看出,MobileNet的3×3深度卷积(3×3 Depthwise Conv)和1×1卷积(1×1 Conv)是2个独立的模块,在输出结果部分加入了批归一化单元BN和非线性激活单元ReLU。
(a) 传统3D卷积网络
(b) MobileNet卷积网络
图1 传统3D卷积网络与MobileNet卷积网络对比
Fig.1 Comparison of traditional 3D convolution network and MobileNet convolution network
传统3D卷积网络的计算量为
(1)
式中:Dk为卷积核的宽;M为输入通道数;N为所用卷积核的数量;DF为输入对象的宽。
MobileNet卷积网络的计算量为
(2)
比较式(1)和式(2)可知,MobileNet卷积网络的计算量大幅降低,仅为传统3D卷积网络计算量的
SSD-MobileNet算法模型结构如图2所示。模型主要分为2个部分,一部分是位于前端的MobileNet网络,其作用是提取目标初步特征;另一部分是位于后端的多尺度特征检测网络,其主要工作是对前端网络产生的特征层进行不同尺度条件下的特征提取。从图2可以看出,6个尺度的信息指向最后的检测模块(Detections),这样可以更好地预测目标位置及分类,模型的最后通过非极大值抑制(Non-Maximum Suppression,NMS)模块过滤掉重复预测的目标。通过该模型可以有效提取待识别目标的信息,准确识别矿工安保穿戴设备,且具有位移不变性及检测速度快等优点,对变化目标具有较好的鲁棒性。
由于待检测的8件安保设备比较特别,用公开的ImageNet数据集或者COCO数据集进行训练都不能满足要求,所以,需要制作一个专用数据集进行模型训练。按照VOC2007数据集标准制作矿工穿戴安保设备的照片数据集,该数据集包括训练集、验证集、测试集3个部分,其中,训练集和验证集的比例是8∶2。
由于工人进出矿井的时间不固定,所以采集照片时会有光照变化。为了提高识别算法的鲁棒性,将24 h平均分成12个阶段,每2 h作为一个阶段采集一次数据,每次采集的样本数为50~100,共采集1 000张矿工穿戴安保设备的照片。对1 000张照片进行人工标注,标注出每张照片中矿工穿戴的安保设备的最小外接矩形框信息(宽、高及中心点像素坐标),并使用python程序将标注文件转换为tfrecord格式的数据,与原始照片一起放入目标检测应用程序编程接口的结构目录,完成训练数据集的制备工作。
图2 SSD-MobileNet算法模型结构
Fig.2 Structure of SSD-MobileNet model
在Windows 10系统下,利用Python3编程语言及Tensorflow深度学习框架搭建SSD卷积神经网络,并采用深度可分离卷积MobileNet作为SSD的特征提取网络。SSD算法将检测与分类合为一体,实现端对端的训练,具体训练过程:① 将原始图像在卷积网络中向前传播,得到图像基本特征;② 抽取多层级特征图并在图中各位置选取不同大小和纵横比的默认框;③ 计算每个默认框的坐标位置偏移量和类别得分;④ 根据默认框与坐标位置偏移量计算最终边界框,再根据类别得分计算默认框的损失函数,将两者相加得到损失函数;⑤ 将损失函数反向传播,调整各网络层权值。
训练过程中损失函数变化如图3所示。从图3可看出,随着训练步数增加,损失函数逐渐下降并最终趋于一个稳定值。
图3 训练损失曲线
Fig.3 Training loss curve
矿工安保穿戴设备检测系统硬件部分包括人体感应器、摄像头及PLC闸机系统,软件部分采用PyQt5开发,主要实现SSD-MobileNet算法和界面显示。系统监控界面如图4所示,系统结构框图如图5所示。
图4 矿工安保穿戴设备检测系统监控界面
Fig.4 Monitoring interface of detection system of miner wearable security equipments
图5 矿工安保穿戴设备检测系统结构框图
Fig.5 Structure block diagram of detection system of miner wearable security equipments
系统工作流程:
(1) 下井人员到达检测平台,此时人体感应器发出识别信号, 4个摄像头采集矿工照片并传送到检测系统。
(2) 检测系统调用SSD-MobileNet算法模型对矿工安保穿戴设备8件套进行识别与判定,并将结果显示在上位机监控界面。
(3) 上位机根据检测系统输出的判定结果发送信号给PLC闸机系统,如果矿工8件套穿戴齐全,则闸机开放,允许矿工通过;反之,闸机不开放,并发出提示声音,提醒矿工对漏穿设备进行补充穿戴。
系统判定某件安保设备是否穿戴的原则:
(1) 如果算法输出的某件安保设备的最高置信度值大于或等于75%,则判定矿工有效穿戴该安保设备,否则判定矿工没有穿戴该安保设备。
(2) 根据矿工多张不同角度的照片的最高置信度结果进行综合判定,比如,当算法在矿工正面检测到安全帽的置信度是90%时,即使在背面检测到安全帽的置信度为0,也会判定矿工戴了安全帽。
在矿山现场通过3组测试来验证矿工安保穿戴设备检测系统性能。
测试1:采集一名矿工完整穿戴8件安保设备的正面和背面照片,算法输出结果如图6所示。
(a) 正面各安保设备的置信度
(b) 背面各安保设备的置信度
图6 测试1输出结果
Fig.6 Output result of test 1
测试2:采集一名矿工漏穿防尘面具、自救器及防砸背夹的单张正面图片,算法输出结果如图7所示。
图7 测试2输出结果
Fig.7 Output result of test 2
测试3:采集一名矿工漏穿防尘面具、防砸背夹、自救器及手电筒的单张正面图片,算法输出结果如图8所示。
图8 测试3输出结果
Fig.8 Output result of test 3
SSD-MobileNet算法输出的各安保设备的置信度见表1。
表1 各安保设备置信度
Table 1 Confidence of various security equipments
%
根据检测系统的判定原则,在测试1中,系统判定矿工有效穿戴8件安保设备;在测试2中,系统只检测到矿工有效穿戴5件安保设备,提醒矿工对防尘面具、自救器及防砸背夹进行补充穿戴;在测试3中,系统只检测到矿工有效穿戴4件安保设备,提醒矿工对防尘面具、手电筒、自救器及防砸背夹进行补充穿戴。3组测试的检测结果均符合真实情况,验证了基于SSD-MobileNet的矿工安保穿戴设备检测系统能够实时、准确地检测出矿工安保设备的穿戴情况。现场多次测试结果表明,该系统具有良好的稳定性和抗干扰性。
(1) 对比分析了传统3D卷积网络与MobileNet卷积网络的结构及计算量,得出MobileNet卷积网络的计算量大幅降低。构建了SSD-MobileNet算法模型,并制作专用数据集进行模型训练。
(2) 给出了基于SSD-MobileNet的矿工安保穿戴设备检测系统的工作流程和判定某件安保设备是否穿戴的原则,根据矿工多张不同角度的照片的最高置信度结果综合判定是否穿戴了某件安保设备,并将最高置信度阈值设置为75%。
(3) 在矿山现场通过3组测试来验证矿工安保穿戴设备检测系统的性能,结果表明,该系统能够实时、准确地检测出矿工安保设备的穿戴情况,且具有良好的稳定性和抗干扰性。
参考文献( References):
[1] 田仙仙,鲍泓,徐成.一种改进HOG特征的行人检测算法[J].计算机科学,2014,41(9):320-324.
TIAN Xianxian,BAO Hong,XU Cheng.Improved HOG algorithm of pedestrian detection[J].Computer Science,2014,41(9):320-324.
[2] 王庆伟,应自炉.一种基于Haar-Like T特征的人脸检测算法[J].模式识别与人工智能,2015,28(1):35-41.
WANG Qingwei,YING Zilu.A face detection algorithm based on Haar-Like T features[J].Pattern Recognition and Artificial Intelligence,2015,28(1):35-41.
[3] 何云,吴怀宇,钟锐.基于多种LBP特征集成学习的人脸识别[J].计算机应用研究,2018,35(1):292-295.
HE Yun,WU Huaiyu,ZHONG Rui.Face recognition based on ensemble learning with multiple LBP features[J].Application Research of Computers,2018,35(1):292-295.
[4] 尹宝才,王文通,王立春.深度学习研究综述[J].北京工业大学学报,2015,41(1):48-59.
YIN Baocai,WANG Wentong,WANG Lichun.Review of deep learning[J].Journal of Beijing University of Technology,2015,41(1):48-59.
[5] 孙志远,鲁成祥,史忠植,等.深度学习研究与进展[J].计算机科学,2016,43(2):1-8.
SUN Zhiyuan,LU Chengxiang,SHI Zhongzhi,et al.Research and advances on deep learning[J].Computer Science,2016,43(2):1-8.
[6] 郑胤,陈权崎,章毓晋.深度学习及其在目标和行为识别中的新进展[J].中国图象图形学报,2014,19(2):
175-184.
ZHENG Yin,CHEN Quanqi,ZHANG Yujin.Deep learning and its new progress in object and behavior recognition[J].Journal of Image and Graphics,2014,19(2):175-184.
[7] 段萌.基于卷积神经网络的图像识别方法研究[D].郑州:郑州大学,2017.
[8] 卢宏涛,张秦川.深度卷积神经网络在计算机视觉中的应用研究综述[J].数据采集与处理,2016,31(1):1-17.
LU Hongtao,ZHANG Qinchuan.Applications of deep convolutional neural network in computer vision[J].Journal of Data Acquisition and Processing,2016,31(1):1-17.
[9] 唐士宇,朱艾春,张赛,等.基于深度卷积神经网络的井下人员目标检测[J].工矿自动化,2018,44(11):32-36.
TANG Shiyu, ZHU Aichun,ZHANG Sai,et al.Target detection of underground personnel based on deep convolutional neural network[J].Industry and Mine Automation,2018,44(11):32-36.
[10] GIRSHICK R. Fast R-CNN[C]//IEEE International Conference on Computer Vision, Santiago, Chile,2015.
[11] REN S, HE K, GIRSHICK R, et al. Faster R-CNN: Towards real-time object detection with region proposal networks[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2017, 39(6): 1137-1149.
[12] DAI J, LI Y, HE K, et al. R-FCN: Object detection via region-based fully convolutional networks[C]//Advances in Neural Information Processing Systems, 2016.
[13] REDMON J, DIVVALA S, GIRSHICK R, et al. You only look once: unified, real-time object detection[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition, 2016.
[14] LIU W, ANGUELOV D, ERHAN D, et al. SSD: Single shot multibox detector [C]// European Conference on Computer Vision, 2016.
ZHANG Chuntang, GUAN Licong
(College of Automation and Electronic Engineering, Qingdao University of Science and Technology, Qingdao 266100, China)
Abstract:In view of problems of supervision difficulties caused by complexity of mine personnel flow, and that security equipments cannot be effectively worn due to weak safety awareness of underground personnel, a detection system of miners' wearable security equipments based on SSD-MobileNet was designed. Feature extraction network VGG16 of SSD algorithm is replaced by MobileNet network to construct SSD-MobileNet algorithm model. Photo data set of miners' wearable security equipments is made according to VOC2007 data set standard and used to train the SSD-MobileNet algorithm model. The SSD-MobileNet algorithm is used to identify eight wearable security equipments for miners (hardhats, dust masks, overalls, work boots, flashlights, self-rescuing devices, positioning cards, anti-back clamps). The highest confidence of photos of miner with multiple angles is used for comprehensive determination of whether a security equipment is worn and the highest confidence threshold is set at 75%. The test results show that the system can detect wearing condition of miners' security equipments in real time and accurately, and has good stability and anti-interference.
Key words:coal mining; target detection; wearable security equipment; SSD-MobileNet; confidence
中图分类号:TD67
文献标志码:A
文章编号:1671-251X(2019)06-0096-05
DOI:10.13272/j.issn.1671-251x.2019010071
收稿日期:2019-01-17; 修回日期:2019-05-13;
责任编辑:胡娴。
作者简介:张春堂(1975-),男,山东青岛人,副教授,研究方向为深度学习、检测技术与智能装置、图像处理,E-mail:zct1999@163.com。
引用格式:张春堂,管利聪.基于SSD-MobileNet的矿工安保穿戴设备检测系统[J].工矿自动化,2019,45(6):96-100.
ZHANG Chuntang,GUAN Licong.Detection system of miners' wearable security equipments based on SSD-MobileNet[J].Industry and Mine Automation,2019,45(6):96-100.