基于双目视觉的振动筛运行状态在线检测方法

杨硕, 佟建楠

杨硕,佟建楠.基于双目视觉的振动筛运行状态在线检测方法[J].工矿自动化,2018,44(6):90-95.. DOI: 10.13272/j.issn.1671-251x.2018020036
引用本文: 杨硕,佟建楠.基于双目视觉的振动筛运行状态在线检测方法[J].工矿自动化,2018,44(6):90-95.. DOI: 10.13272/j.issn.1671-251x.2018020036
YANG Shuo, TONG Jiannan. On-line detection method of operating state of vibrating screen based on binocular visio[J]. Journal of Mine Automation, 2018, 44(6): 90-95. DOI: 10.13272/j.issn.1671-251x.2018020036
Citation: YANG Shuo, TONG Jiannan. On-line detection method of operating state of vibrating screen based on binocular visio[J]. Journal of Mine Automation, 2018, 44(6): 90-95. DOI: 10.13272/j.issn.1671-251x.2018020036

基于双目视觉的振动筛运行状态在线检测方法

基金项目: 

煤炭科学研究总院科技创新基金项目(2016ZYMS017)

详细信息
  • 中图分类号: TD948

On-line detection method of operating state of vibrating screen based on binocular visio

  • 摘要: 针对现有振动筛运行状态检测方法仅能对振动筛局部运行状态进行检测,且存在精度低、时效性差等问题,提出了一种基于双目视觉的振动筛运行状态在线检测方法。首先通过双目视觉检测装置对振动筛的运动图像进行采集;然后对图像进行灰度化处理,利用多尺度Harris角点检测算法获取图像的特征点,引入图像金字塔理论改进Lucas-Kanade光流估计算法,提高图像特征点运动轨迹的在线追踪性能;最后设计BP神经网络分类器,完成对特征点运动轨迹的分析与辨识,实现对振动筛整体运行状态的检测。试验结果表明,该检测方法准确性高、时效性好,可对振动筛运动轨迹进行全方位、多角度的追踪和辨识,实现了振动筛整体运行状态的在线检测和分析。振动筛在停止、正常、疑似故障和故障4种状态下,该方法的准确率分别达到了97.917%、90.667%、96.431%和93.181%。
    Abstract: In view of problems that existing detection methods of operating state of vibrating screen can only detect local operating state of vibrating screen, and has shortcomings such as low precision and poor timeliness, an on-line detection method of whole operating state of vibrating screen based on binocular vision technology was put forward. Firstly, the method uses binocular vision detection device to capture movement images of the vibrating screen. Then it makes graying processing for the images, uses multi-scale Harris corner detection algorithm to obtain the feature points of the images, and introducing image pyramid theory to improve Lucas-Kanade optical flow estimation algorithm, so as to enhance on-line tracking ability of motion track for feature points. Finally, BP neural network classifier is designed to complete analysis and identification of motion trajectory of the feature points, so as to realize detection of whole running condition of vibrating screen. Test results show that the detection method has high accuracy and good timeliness, which can realize on-line detection and analysis of whole running state of vibrating screen with omni-directional and multi-angle tracking and identification for the trajectory of vibrating screen. Accuracy of the method respectively reached 97.917%, 90.667%, 96.431% and 93.181% when vibrating screen was in four kinds of states of stopping, normality and suspected fault and fault.
  • 带式输送机是井下煤炭运输的关键设备,在煤矿带式输送机运输煤流过程中,可能有锚杆、木条、铁块、纺织物等异物掺杂在煤块中,易造成输送带损毁甚至撕裂,引发安全事故,且这些异物还可能对煤炭的质量造成一定的影响。因此,实时、精准识别带式输送机异物对于确保煤矿安全生产尤为重要[1]

    传统的带式输送机异物检测方法主要包括人工检测法、金属探测器检测法、雷达检测法3种[2]。人工检测法效率低、工作量大;金属探测器检测法检测类型不全面,只能检测金属类异物;雷达检测法成本高、难以广泛应用。随着目标检测技术的发展,众多学者利用深度学习方法进行异物识别。基于深度学习的目标检测算法主要分为Two−stage和One−stage 2类。Two−stage代表算法有R−CNN系列,其将输入图像先经过候选框生成网络,再经过分类网络对候选框中内容进行分类[3]。吴守鹏等[4]提出了一种Faster−RCNN+双向金子塔网络的运煤输送带异物识别模型,有效提升了小尺寸异物的检测能力。One−stage代表算法有YOLO系列,该类算法直接对网络进行端对端训练,生成的结果中同时包含位置和类别信息。郝帅等[5]提出一种融合卷积注意力模型的YOLOv5煤矿输送带异物检测算法,较好地解决了异物目标检测时易受煤尘干扰、输送带高速运动影响目标检测精度等问题。任国强等[6]采用Fast YOLOv3算法,利用StiPic数据增强方法提高对胶带运输异物的平均检测精度。陈永等[7]利用稀疏化和通道剪枝方法对YOLOv3模型进行压缩,构建了轻量级异物检测模型,其检测速度分别是YOLOv3模型和Faster R−CNN模型的1.3,3.4倍。杨锦辉等[8]在YOLOv5s网络中引入GhostConv卷积减少模型参数量,实现了检测速度的提升。胡璟皓等[9]采用Focal Loss函数替代YOLOv3模型中的交叉熵损失函数及调整最佳超参数来平衡样本之间比例,有效解决了现有非煤异物图像识别法识别目标单一、模型缺乏定位等问题。

    基于深度学习的目标检测算法在异物检测中具有较好的识别效果,但模型内存需求大,检测速度慢;轻量化深度学习网络能够大幅减少模型内存需求,提升检测速度,然而,在井下弱光环境中检测精度低。为此,本文提出了一种基于Faster−YOLOv7的带式输送机异物实时检测方法。通过轻量化设计YOLOv7主干网络来降低模型的内存需求,进而提升模型对异物的检测速度;利用限制对比度自适应直方图均衡化(Contrast Limited Adaptive Histogram Equalization,CLAHE)[10]算法来提升煤矿井下弱光环境下的检测效果;设计有效通道注意力机制来缓解高层信息丢失对目标检测精度的影响;使用Alpha−IoU回归损失函数提高检测精度。

    基于Faster−YOLOv7的带式输送机异物实时检测流程如图1所示。首先,采集带式输送机运煤监控视频数据。其次,截取监控视频中包含异物的数据帧,构建异物数据集,并通过数据增强操作来提高数据集质量。然后,对Faster−YOLOv7异物检测模型进行训练,并存储最优的权重文件。最后,输入实时监控视频数据,经过图像增强预处理后,读取Faster−YOLOv7模型实现异物检测,并存储异物信息。

    图  1  带式输送机异物实时检测流程
    Figure  1.  Real-time detection process foreign body on belt conveyor

    煤矿井下弱光环境导致摄像头采集的实时图像存在模糊、异物边缘不清晰等问题,从而影响模型的推理结果,本文采用CLAHE算法对采集到的图像进行弱光增强,通过限制对比度,避免直方图中出现陡峭部分。CLAHE裁剪再分配过程如图2所示,带式输送机上运煤视频图像经过限制对比度自适应直方图均衡化处理后的效果如图3所示。可看出经过CLAHE算法处理后,在图像较暗处物体的边缘变得清晰,特征较原图更明显。

    图  2  CLAHE裁剪再分配过程
    Figure  2.  CLAHE tailoring redistribution process
    图  3  图像增强效果
    Figure  3.  Image enhancement effect

    为了客观评价CLAHE算法对煤矿井下带式输送机运煤图像弱光增强的有效性,选取Brenner梯度函数、Energy of Gradient函数、Roberts函数作为评价指标来衡量图像增强后的清晰度,评价结果见表1。可看出经过CLAHE算法处理后的Brenner函数值、Energy of Gradient函数值、Roberts函数值均大于原图,说明该算法可使煤矿井下带式输送机运煤视频图像更清晰,表明CLAHE算法可有效解决煤矿井下弱光环境导致的图像不清晰、对比度低、边缘信息模糊等问题,达到了图像增强的效果。经过弱光环境图像增强,可提高图像的对比度,使模型的推理结果更精准。

    表  1  图像增强评价结果
    Table  1.  Evaluation results of image enhancement
    评价指标原图CLAHE
    Brenner函数值81.447152.479
    Energy of Gradient函数值55.31199.494
    Roberts函数值103.655186.282
    下载: 导出CSV 
    | 显示表格

    YOLOv7模型[11]主要由Input、Backbone、Head 3个部分组成。Input部分沿用YOLOv5采取的mosaic数据增强、自适应锚框计算、图像自适应缩放等对数据进行预处理。Backbone部分用于特征提取。Head部分主要由SPPCSPC模块、ELAN−H模块、REP模块等组成,其中SPPCSCP模块[12]通过最大池化操作来获得不同的感受野,使网络适应不同分辨率的图像;ELAN−H模块[13]通过控制最短和最长梯度路径,使网络能够学习更多特征,且具有更强的鲁棒性;REP模块[14]通过结构重参数实现训练和推理时的解耦合,降低网络的计算量,提升速度。然而,YOLOv7模型内存需求大,难以满足在嵌入式设备上实现井下带式输送机异物实时、精准检测的需求。鉴此,本文设计了Faster−YOLOv7模型,其网络结构如图4所示。

    图  4  Faster−YOLOv7网络结构
    Figure  4.  Faster-YOLOv7 network structure

    YOLOv7主干网络的核心模块是ELAN结构[15],如图5所示,该结构的优势是在每个branch操作中,输入和输出的通道数保持一致,符合设计网络的高效准则之一。然而采用原始主干网络进行特征提取,所得到的模型内存需求大,难以部署在嵌入式设备上实现实时异物检测[16]。因此,本文采用MobileNetv3[17]作为主干网络来构建Faster−YOLOv7。

    图  5  ELAN结构
    Figure  5.  ELAN structure

    Bneck是MobileNetv3的核心模块,主要由通道可分离卷积、压缩与激励网络(Squeeze-and-Excitation,SE)通道注意力机制、残差连接实现,其结构如图6所示。首先经过$ 1 \times 1 $卷积操作实现升维。其次经过$ 3 \times 3 $ 深度可分离卷积保持通道数不变。再次经过SE通道注意力模块,使网络通过学习来自动获取每个特征通道的重要程度。在SE模块中,利用exp size代表第1层1×1卷积升级的维度,先对每个通道全局平均池化得到($ 1 \times 1 \times \exp {\text{ size}} $)向量,再经过全连接层、ReLU激活函数得到($ 1 \times 1 \times ( {\exp {\text{ size}}/4} ) $)向量,然后经过全连接层、h-sigmoid激活函数得到($ 1 \times 1 \times \exp {\text{ size}} $)向量,向量内元素取值为$ (0,1) $,将该向量中的每个元素乘以对应权重后,输入到与之相对应通道的特征矩阵中,得到1个与原始特征图大小相等的新特征图。最后通过$ 1 \times 1 $卷积实现降维处理。

    图  6  Bneck模块结构
    Figure  6.  Bneck module structure

    SE模块中采用的降维操作会对通道注意力的预测效果产生负面影响,低效获取所有通道之间的依赖关系。因此,本文在主干网络的末端添加有效通道注意力机制(Effective Channel Attention Mechanism,ECA)模块[18],加强整体的通道特征,提高模型性能。

    ECA模块结构如图7所示。在空间维度上,使用全局平均池化(Global Average Pooling,GAP)对维度为$ H \times W \times C $的特征图A进行特征压缩,得到一个维度为$ 1 \times 1 \times C $的特征图B。通过$ 1 \times 1 $卷积对特征图B进行通道特征学习,并将$ 1 \times 1 \times C $的通道注意力的特征图与$ H \times W \times C $原始输入特征图进行逐通道相乘,输出具有通道注意力的特征图[19]

    图  7  ECA模块结构
    Figure  7.  ECA module structure

    卷积操作中的卷积核大小会影响感受野。卷积核大小和通道数C之间存在一种映射关系(式(1)),ECA模块为了避免维度缩减,并有效捕获跨通道交互,通过一维卷积来完成跨通道间的信息交互,该卷积核的大小通过函数$ \psi (C) $自适应变化(式(2)),使通道数较大的层可以更多地进行跨通道交互。

    $$ C=2^{\gamma k-\delta} $$ (1)
    $$ k=\psi(C)=\left|\frac{{\mathrm{log}}_2C}{\gamma}+\frac{\delta}{\gamma}\right|_\mathrm{{odd}} $$ (2)

    式中:$ k $为卷积核大小;$ \gamma,\delta $为常数,$ \gamma = 2,\delta = 1 $,用于改变通道数和卷积核之间的比例;$ |\cdot {|_{{\mathrm{odd}}}} $为$ k $只能取奇数。

    在Head部分,损失函数的选取尤为重要,期望值和真实值越接近,其损失函数值越小。YOLOv7的损失函数主要包含分类损失、物体置信度损失、边界框回归损失,其中分类损失和置信度损失使用交叉熵损失,回归损失使用CIoU[20]。然而,CIoU损失函数反映纵横比的差异,而不是宽高与其置信度的真实差异,阻碍模型有效地优化相似性。因此,本文采用Alpha−IoU代替CIoU作为回归损失函数,Alpha−IoU损失函数可泛化成具有多个惩罚项的IoU损失函数[21]。当权重系数$ \alpha>1 $时,能够提升高置信度目标的损失值和梯度,获得更好的框回归效果,使得网络对异物的预测结果更精准。

    $$ {L_{\alpha - {\mathrm{CIoU}}}} = 1 - {Y^\alpha } + \frac{{{\rho ^{2\alpha }}(b,{b^{{\mathrm{gt}}}})}}{{{c^{2\alpha }}}} + {(\beta v)^\alpha } $$ (3)

    式中:$ {L_{\alpha - {\mathrm{CIoU}}}} $为Alpha−IoU损失函数;Y为交并比的值;$ \rho^{2\alpha}(b,b\mathrm{^{gt}}) $为预测框和真实框的中心点之间的欧氏距离;$ b $为预测框的中心点;$ b\mathrm{^{gt}} $为真实框的中心点;$ c $为预测框和真实框形成外接矩形的对角线长度;$\, \beta $为trade-off参数;$ v $为度量高宽比的一致性参数。

    带式输送机异物实时检测实验平台环境:Windows11操作系统,CPU为Inter i5−12400F,GPU为NVIDIA GeForce RTX 3070,Faster−YOLOv7使用Pytorch进行模型搭建。

    实验所采用的数据集来自某煤矿井下带式输送机运行时的监控视频数据。经过数据增强后,数据集由2 920张图像组成,将异物标签设置为YW,随机选取2 190张图像作为训练集,730张图像作为测试集。

    为了验证本文所提Faster−YOLOv7模型的优势,将其与YOLOv5模型、YOLOv7模型进行对比,模型训练损失函数对比如图8所示,模型检测速度、内存需求、准确率对比见表2

    图  8  损失函数曲线
    Figure  8.  Loss function curve
    表  2  检测模型性能
    Table  2.  Detection model performance
    模型 检测速度/(帧·s−1 模型内存/MiB 准确率/%
    YOLOv5 25 43 82.5
    YOLOv7 22 71 94.5
    Faster−YOLOv7 42 14 91.3
    下载: 导出CSV 
    | 显示表格

    图8可看出,YOLOv5模型在迭代次数为25时,损失值降为0.09,并最终稳定在0.069左右;YOLOv7模型的初始损失值为0.089,在迭代次数为25时,损失值降为0.053,并最终稳定在0.028左右;Faster−YOLOv7模型的初始损失值为0.143,最终稳定在0.039左右。这说明Faster−YOLOv7模型的训练效果优于YOLOv5模型;由于对YOLOv7主干网络进行轻量化设计、引入ECA机制、使用Alpha−IoU损失函数,导致训练效果略差于YOLOv7模型。

    表2可看出,Faster−YOLOv7模型的检测速度可达42帧/s,较YOLOv5模型、YOLOv7模型分别提升了17,20帧/s;Faster−YOLOv7模型内存为14 MiB,较YOLOv5模型、YOLOv7模型分别降低了29,57 MiB;检测准确率达91.3%,较YOLOv5模型提升了8.8%。这说明Faster−YOLOv7模型更加灵活,检测效率更高,便于部署在嵌入式设备上实现实时检测。

    为测试本文改进模型的效果,进行消融实验。首先,使用MobileNetv3轻量化设计YOLOv7主干网络的模型为基础模型;然后,分别测试使用CLAHE进行图像预处理、引入ECA机制、使用Alpha−IoU损失函数的效果;最后,将3种改进策略同时加入基础模型。消融实验结果见表3

    表  3  消融实验结果
    Table  3.  Ablation test results
    改进策略 准确率/% 检测速度/(帧·s−1
    CLAHE ECA Alpha−IoU
    × × × 83.4 53
    × × 85.8 49
    × × 85.9 46
    × × 85.1 48
    91.3 42
    下载: 导出CSV 
    | 显示表格

    表3可看出,在该模型中分别单独使用CLAHE进行图像预处理、引入ECA机制、使用Alpha−IoU损失函数后,模型的检测准确率分别提升了2.4%、2.5%和1.7%,检测速度分别降低了4,7,5帧/s;使用CLAHE进行图像预处理、添加ECA模块及Alpha−IoU损失函数的完整改进模型检测准确率达91.3%,检测速度保持在42 帧/s,性能提升明显。

    为验证Faster−YOLOv7优势,将Faster−YOLOv7部署到NVIDIA Jetson TX2嵌入式设备上,对煤矿井下带式输送机运煤图像及视频进行检测,并与SSD、YOLOv5、轻量化YOLOv7目标检测算法进行对比,检测结果如图9所示。

    图  9  不同模型检测结果
    Figure  9.  Test results of different models

    图9可看出,SSD模型在视频检测时发生了漏检现象,YOLO系列模型均有效地识别出待测异物,且Faster−YOLOv7识别结果的置信度更高。从SSD模型、YOLOv5模型、轻量化YOLOv7模型的检测效果来看,均发生了误检现象,而本文在引入ECA机制、使用Alpha−IoU损失函数后,使得异物具有更显著的特征表达,因此模型更关注异物,较好地避免了误检现象的发生。

    1) 为了减少井下弱光环境对轻量化神经网络模型推理造成的影响,采用CLAHE算法进行预处理后,检测精度提升了2.4%。

    2) 采用MobileNetv3轻量化设计YOLOv7的主干网络、添加ECA机制及引入Alpha−IoU损失函数,显著提升了模型的检测效率。改进后的模型与YOLOv7模型相比,内存需求降低了57 MiB,检测速度提升了20帧/s。

    3) 对Faster−YOLOv7算法的异物检测效果进行实验验证,结果表明,在检测精度达91.3%的同时,检测速度达42 帧/s,模型的内存需求仅为14 MiB,满足煤矿井下带式输送机异物实时、精准检测的需求。

    4) 将Faster−YOLOv7模型部署在嵌入式设备上,对带式输送机进行异物检测,其识别结果的置信度与SSD模型、YOLOv5模型及轻量化YOLOv7模型相比均有所提高,且有效减少了误检、漏检现象的发生。

  • 期刊类型引用(5)

    1. 陈戈,马浩然,李兵,王贵锦,彭倍,徐文俊,荣云,贺波,杨波,周阳,刘威. 四粮种检验用组合振筛机的设计与试验. 粮食储藏. 2024(02): 18-21 . 百度学术
    2. 卢军,谭兴富,成举炳,华智诚,刘畅. 基于TOF相机的振动筛上物料状态动态监测方法. 煤炭工程. 2024(09): 202-210 . 百度学术
    3. 聂龙飞. 基于无线传输的选煤厂振动设备在线监测系统研究. 山西焦煤科技. 2024(09): 46-50 . 百度学术
    4. 高鹏,杨硕,高勇,曹俊云,康宁. 基于三轴加速度计的振动筛运动状态采集装置的设计. 选煤技术. 2021(02): 88-92 . 百度学术
    5. 王导利,阮长庆,阳意峰. 基于双目视觉的气动式乒乓球发球机发球轨迹检测方法. 自动化与仪器仪表. 2020(03): 164-167 . 百度学术

    其他类型引用(3)

计量
  • 文章访问数:  153
  • HTML全文浏览量:  11
  • PDF下载量:  14
  • 被引次数: 8
出版历程
  • 刊出日期:  2018-06-09

目录

/

返回文章
返回