杨志方. 基于雷达与视觉融合的双模态煤矿井下环境感知技术[J]. 工矿自动化,2023,49(11):67-75.  doi: 10.13272/j.issn.1671-251x.2023080073
引用本文: 杨志方. 基于雷达与视觉融合的双模态煤矿井下环境感知技术[J]. 工矿自动化,2023,49(11):67-75.  doi: 10.13272/j.issn.1671-251x.2023080073
YANG Zhifang. Bimodal environment perception technology for underground coal mine based on radar and visual fusion[J]. Journal of Mine Automation,2023,49(11):67-75.  doi: 10.13272/j.issn.1671-251x.2023080073
Citation: YANG Zhifang. Bimodal environment perception technology for underground coal mine based on radar and visual fusion[J]. Journal of Mine Automation,2023,49(11):67-75.  doi: 10.13272/j.issn.1671-251x.2023080073


基金项目: 国家自然科学基金青年基金项目(42201386);天地科技股份有限公司科技创新创业资金专项(2023-TD-ZD005-005,2022-2-TD-ZD001,2022-TD-ZD001)。


  • 中图分类号: TD67

Bimodal environment perception technology for underground coal mine based on radar and visual fusion

  • 摘要: 环境感知是煤矿巡检机器人、视觉测量系统等场景应用的关键技术。单模态环境感知技术对煤矿井下复杂环境的感知能力较差。提出了雷达与视觉双模态空间融合方法,通过激光雷达和摄像仪之间的坐标转换来实现二者采集信息的融合,从而提高环境感知能力。为了更好地提取目标特征信息,提出了双模态融合环境感知网络架构技术路线:摄像仪和雷达采集的环境信息经雷达与视觉双模态空间融合方法进行融合处理,多模态特征融合网络模块提取融合信息中的目标特征,多任务处理网络模块采用不同的任务头处理目标特征信息,完成目标检测、图像分割、目标分类等环境感知任务。采用YOLOv5s目标检测算法搭建双模态特征提取网络模块进行实验,结果表明:基于雷达与视觉融合的双模态煤矿井下环境感知技术对井下巷道环境下行人检测的成功率较视觉、雷达感知分别提升15%,10%,对车道线、标志牌等各类目标分割的平均精度均值较视觉感知均提高10%以上,有效提升了煤矿井下环境感知能力,可为煤矿道路环境感知、视觉测量系统、无人矿车导航系统、矿井搜救机器人等应用场景提供技术支持。


  • 图  1  坐标系转换关系

    Figure  1.  Conversion relationship among coordinate systems

    图  2  雷达坐标系与世界坐标系的转换关系

    Figure  2.  Conversion relationship between radar coordinate system and world coordinate system

    图  3  相机成像模型

    Figure  3.  Camera imaging model

    图  4  像素坐标系与图像坐标系

    Figure  4.  Pixel coordinate system and image coordinate system

    图  5  双模态融合环境感知技术网络架构

    Figure  5.  Network architecture of bimodal fusion environment perception technology

    图  6  双模态特征提取网络模块架构

    Figure  6.  Architecture of bimodal feature extraction network module

    图  7  固定点位场景应用

    Figure  7.  Fixed position scenario application

    图  8  移动场景应用

    Figure  8.  Mobile scenario application

    图  9  煤矿井下行人感知结果

    Figure  9.  Personnel perception results in underground coal mine

    图  10  煤矿井下目标分割结果

    Figure  10.  Object segmentation results in underground coal mine

    CPU i9−9820X
    GPU NVIDIA RTX 2080 Ti GPU×2
    操作系统 Ubuntu 20.04
    架构 PyTorch
    实验总轮数 100
    批数大小 4
    初始学习率 0.001
    模型优化器 AdamW
    权重衰减项 1×10−4
    下载: 导出CSV

    表  1  模型轻量化效果

    Table  1.   Model lightweighting effects

    模型 模型大小/MiB 平均精度/% 平均帧率/
    轻量化前 256 87.7 28.7 53.17
    轻量化后 52.6 82.6 49.8 30.23
    下载: 导出CSV

    表  2  单模态与双模态检测结果对比

    Table  2.   Comparison between of unimodal and bimodal detection results

    感知方式 目标总数/个 检测数/个 漏检数/个 成功率/%
    视觉 60 45 15 75
    雷达 60 48 12 80
    融合 60 54 6 90
    下载: 导出CSV

    表  3  煤矿井下各类目标分割结果的评价指标

    Table  3.   Evaluation indexes of segmentation results of various types of object in underground coal mine %

    目标 纯图像 双模态空间融合图像
    mIoU 召回率 mAP mIoU 召回率 mAP
    背景 83.21 75.74 99.22 85.62 89.61 99.78
    车辆 77.48 81.62 79.82 79.40 84.50 88.92
    路面 79.27 79.80 72.31 82.12 91.30 82.38
    车道线 74.21 67.90 68.35 80.21 91.56 77.62
    标志牌 74.01 78.33 60.54 78.88 90.37 79.85
    行人 84.21 83.44 66.95 90.25 95.65 83.44
    下载: 导出CSV
