Coal-rock image recognition method integrating drilling geological information
-
摘要: 当前应用于煤岩图像识别的深度卷积神经网络模型存在体积庞大、计算过程冗杂等问题,难以满足实时检测要求,且对低照度、高粉尘等复杂环境适应性差。针对上述问题,提出了一种融合钻孔地质信息的煤岩图像识别方法。首先,通过改进的谱残差显著性检测(ISRSD)算法增强煤岩图像质量,有效减弱复杂环境对煤岩图像特征造成的不利影响;然后,使用加入注意力机制的VGG(AVGG)深度卷积神经网络模型——在VGG的基础上进行剪枝、加入卷积注意力模块(CBAM)和引入自适应学习率调整策略,高效提取煤岩图像特征;最后,利用贝叶斯模型融合煤岩图像特征和由钻孔地质柱状图获取的钻孔地质信息,提升煤岩分类的准确性和鲁棒性。实验结果表明,经ISRSD算法增强后的图像目标更突出,色彩失真程度更低,且边缘、纹理等图像特征保留相对完整; AVGG模型的准确率与VGG模型相当,但平均推理时间、参数量及模型大小分别仅为VGG模型的15.61%,33.44%及33.40%;与仅使用AVGG模型识别煤岩图像相比,利用贝叶斯模型融合钻孔地质信息后,准确率提高了1.85%,达97.31%。Abstract: The current deep convolutional neural network models applied to coal-rock image recognition have problems such as large volume and cumbersome calculation process. It is difficult to meet real-time detection requirements, and it has poor adaptability to complex environments such as low lighting and high dust. In order to solve the above problems, a coal-rock image recognition method integrating drilling geological information is proposed. Firstly, the improved spectral residual saliency detection (ISRSD) algorithm is used to enhance the quality of coal-rock images, effectively reducing the adverse effects of complex environments on the features of coal-rock images. Secondly, the method uses the attentional VGG (AVGG) deep convolutional neural network model. The AVGG performs pruning based on VGG, adds convolutional block attention module (CBAM), and introduces adaptive learning rate adjustment strategy to efficiently extract coal-rock image features. Finally, the Bayesian model is used to integrate the features of coal-rock images with the geological information obtained from the borehole geological column chart, in order to improve the accuracy and robustness of coal-rock classification. The experimental results show that the image enhanced by the ISRSD algorithm has more prominent targets, lower color distortion, and relatively complete preservation of image features such as edges and textures. The accuracy of the AVGG model is comparable to that of the VGG model, but the average inference time, parameter count, and model size are only 15.61%, 33.44%, and 33.40% of the VGG model, respectively. Compared with using only the AVGG model to recognize coal-rock images, using the Bayesian model to fuse drilling geological information improves accuracy by 1.85%, reaching 97.31%.
-
0. 引言
煤岩识别作为煤矿智能开采和巷道智能掘进技术的关键环节,其准确性和鲁棒性直接影响煤矿采掘智能化水平[1-3]。根据实施过程中是否需要接触煤炭或岩石,煤岩识别方法可分为接触式和非接触式两大类[4]。接触式煤岩识别方法包括振动检测法、声压检测法、高压水射流法等,虽然能直接作用于煤岩表面提供即时反馈,但成本较高,设备易损坏且不容易实现远程操作。非接触式煤岩识别方法包括图像分析法、声波探测法、雷达探测法、γ射线探测法等,由于无需直接接触煤岩,减少了设备磨损且易于实现远程操作。煤岩图像识别作为图像分析法的一种,具有设备体积小、成本低、易于部署等优点,一直是煤岩识别研究的热点之一。
近年来,众多学者研究使用深度卷积神经网络提取煤岩图像特征来实现煤岩图像识别。张云等[5]将双注意力机制(通道注意力机制与通道空间注意力机制)融入卷积神经网络,提高了煤岩识别精度。王建才等[6]将Transformer应用于 YOLOv5,实现了煤岩图像特征的高效提取。高峰等[7]使用嵌入全局注意力机制的残差卷积模块,降低了全局无关特性对煤岩识别的不利影响。司垒等[8]用深度分离卷积代替传统卷积,提高了煤岩识别的准确性。张斌等[9]使用目标检测算法YOLOv2与线性成像模型相结合的方法,实现了对井下煤岩图像的智能识别与定位。闫志蕊等[10]通过改进的DeeplabV3+和迁移学习实现了煤岩界面图像识别。伍云霞等[11-12]使用带有局部约束的自学习方法,解决了煤岩识别模型训练中样本不足的问题。
然而,当前应用于煤岩图像识别的深度卷积神经网络模型存在体积庞大、计算过程冗杂等问题,难以满足实时检测要求,且对低照度、高粉尘等复杂环境适应性差。因此,本文提出了一种融合钻孔地质信息的煤岩图像识别方法。首先,通过改进谱残差显著性检测(Improved Spectral Residual Saliency Detection,ISRSD)算法改善图像质量;其次,使用加入注意力机制的VGG(Attentional Visual Geometry Group,AVGG)深度卷积神经网络高效提取图像特征;最后,通过贝叶斯模型融合图像特征和钻孔地质信息,从而提升煤岩识别的鲁棒性和准确性。
1. 方法原理
融合钻孔地质信息的煤岩图像识别方法流程如图1所示。先应用ISRSD算法对煤岩图像进行增强,优化图像质量以降低模型运算量,再利用AVGG模型提取图像特征。结合钻孔地质柱状图为每个煤岩图像样本添加相应的地质特征标签,标记当前工作空间中存在的特定煤岩类型,从而提高煤岩识别准确率。最终,基于贝叶斯模型将提取的图像特征与钻孔地质信息进行融合,获取煤岩图像分类结果。
1.1 图像增强
显著性检测算法被广泛应用于图像的压缩编码、边缘检测、区域像素增强和目标分割等研究领域[13-14],可有效应对因煤矿井下低照度等因素造成的煤岩图像特征不明显。但传统的显著性检测算法对于图像特征被遮挡等情形的煤岩图像适应较差,因此本文使用ISRSD算法改善煤岩图像质量,使图像特征更易提取,以便降低模型运算量。该算法利用图像的频域信息,具有较高的检测准确性和鲁棒性。
ISRSD算法流程如图2所示。首先使用中值滤波抑制井下复杂环境对煤岩图像遮挡造成的影响,同时泛化主要目标区域;然后,提取煤岩样本显著区域,并使用锐化算子增强图像边缘、纹理等特征;最后,使用直方图均衡化提升图像亮度,使得图像中的目标更加清晰。
1.2 图像特征提取
深度卷积神经网络能够从图像中自动提取特征[5],其中,VGG是提取图像特征的首选算法之一[15]。但VGG存在参数量大、体积冗余、推理时间长等问题,因此本文对其进行改进,提出了一种AVGG模型,结构如图3所示。
具体改进方案:① 对VGG模型进行剪枝处理,减少冗余参数,提高其识别煤岩图像的效率。② 加入卷积注意力模块(Convolutional Block Attention Module,CBAM)[16],改善VGG模型对不同通道和生成空间的权重分配能力,以提升对煤岩图像识别的学习能力。③ 引入自适应学习率调整策略(图4),根据交叉熵损失值的变化量调整学习率,即当交叉熵损失值陷入局部震荡或波动幅度过大时,更新学习率,在提高学习效率的同时保证收敛性能。
1.3 钻孔地质信息融合
为提升煤岩识别的鲁棒性和准确性,使用贝叶斯模型将AVGG模型提取的图像特征与钻孔地质信息融合,获取煤岩图像分类结果。
钻孔地质柱状图详细记录了钻孔中不同地层的信息,从而可预知井下特定工作空间的煤岩类别。因此,依据钻孔地质柱状图,将采掘设备可直接接触的煤岩类别的图像样本标记地质特征标签1,采掘设备不可直接接触的煤岩类别的图像样本标记地质特征标签−1。
将钻孔地质信息与AVGG提取的图像特征进一步抽象形成贝叶斯模型训练所需的数据集,包括地质特征、AVGG提取的图像特征(AVGG模型输出的各类别置信度)、煤岩图像样本真实类别。
贝叶斯模型可以利用先验知识和新的观测数据不断更新对未知参数或事件概率的估计[17]。其中先验知识就是已知的钻孔地质信息,而新的观测数据则是AVGG模型提取的图像特征。
贝叶斯模型所求目标函数为
$$ P\left( {c|x} \right) = \frac{{P\left( c \right)P\left( {x|c} \right)}}{{P\left( x \right)}} $$ (1) 式中:P(c|x)为煤岩图像样本x属于煤岩类别c的概率;P(c)为煤岩类别c的先验概率;P(x|c)为煤岩类别c下煤岩图像样本x出现的概率;P(x)为煤岩图像样本x的先验概率。
朴素贝叶斯假定对于给定样本,煤岩图像样本特征的先验概率与煤岩类别无关,且假定特征之间无关联。因此,目标函数可转换为
$$ y = \arg \mathop {\max }\limits_{{c_k}} P\left( {{c_k}} \right)\prod _{i = 1}^dP\left( {{x_i}|{c_k}} \right) $$ (2) 式中:y为输出的煤岩类别;ck为第k个煤岩类别;$ d $为煤岩图像样本特征数;$ {x}_{i} $为煤岩图像样本x的第i个特征的取值。
对于连续属性,假定$ P\left({x}_{i}|c\right) $服从高斯分布$ {N}\left({\mu }_{c,i},{\sigma }_{c,i}^{2}\right) $,其中$ {\mu }_{c,i} $和$ {\sigma }_{c,i}^{2} $分别为煤岩类别c在第$ i $个特征取值的均值和方差,则
$$ P({x_i}|c) = \frac{1}{{\sqrt {2{\text{π}}} {\sigma _{c,i}}}}{\mathrm{exp}}\left( { - \frac{{{{\left( {{x_i} - {\mu _{c,i}}} \right)}^2}}}{{2\sigma _{c,i}^2}}} \right) $$ (3) 为实现贝叶斯模型在分类过程自动学习新样本,采用增量学习策略[18],即在接受训练样本时,仅根据新样本对模型进行更新,不必重新训练整个模型,并且使先前学得的有效信息不被忘记,从而实现随着煤岩图像样本增加,分类结果更准确。
2. 实验条件
2.1 样本采集
采集攀枝花煤田、沁水煤田多个生产矿井的含煤系地层岩样,共包含煤炭、泥岩、砂岩、砾岩和页岩5种岩性。使用KTW301矿用本安型手机在实验室暗光条件下对采集的岩样进行拍摄,共采集煤岩图像1 244张,图像尺寸统一调整为224×224。为增强模型的泛化能力,使用图像增强技术对样本集进行扩充,得到7 041张煤岩图像。对不同类别的样本之间输入不同的旋转角度间隔,以达到类别均衡的效果。数据集扩充及类别均衡前后样本数量见表1。
表 1 数据集扩充及类别均衡前后样本数量Table 1. Sample size before and after data set augmentation and category balancing类别 数据集扩充及类别
均衡前样本数/张数据集扩充及类别
均衡后样本数/张砂岩 337 1 515 砾岩 96 1 344 泥岩 369 1 348 煤炭 360 1 440 页岩 82 1 394 2.2 钻孔地质信息获取
某煤矿工作面的钻孔地质柱状图如图5所示。该工作面主要开采9号煤层,直接底和伪顶均为泥岩。采煤机可直接接触的煤岩类型为泥岩、煤,将这类煤岩图像样本的地质特征标签记为1,其他类煤岩图像样本的地质特征标签记为−1。
2.3 实验环境及参数
分别使用Sklearn机器学习模块和PyTorch深度学习框架搭建贝叶斯模型和AVGG模型,在GPU环境下进行模型训练和测试。具体实验环境配置:CPU为Intel(R) Xeon(R) W−2145 CPU @ 3.70 GHz;内存为64 GiB;GPU为NVIDIA Quadro P1000;显存为4 GiB;操作系统为Ubuntu 20.04;学习框架为PyTorch 1.8;CUDA版本为11.0;编程语言为Python3.7。综合考虑硬件及模型性能,模型训练设置:采用随机梯度下降算法优化模型,训练周期为300,批处理大小为64,初始学习率为0.08。煤岩图像样本按照9∶1比例随机划分为训练集和测试集,其中训练集6 339张,测试集702张。
3. 实验结果
3.1 AVGG模型性能验证
为验证AVGG模型的性能,与GoogLeNet,VGG,SVGG(Simplified VGG,剪枝的VGG)模型进行对比,使用未经过ISRSD算法处理的煤岩图像样本进行训练,结果见表2。
表 2 不同模型评价指标结果对比Table 2. Comparison of evaluation index results of different models模型 准确率/% 单个样本
平均推理时间/ms参数量/106个 模型大小
/MiBGoogLeNet 89.65 68.49 5.981 24 VGG 93.79 117.65 128.810 515 SVGG 83.72 18.86 43.081 172 AVGG 91.33 18.36 43.084 172 从表2可看出,VGG模型的准确率最高,但模型参数量最大,单个样本平均推理时间最长;SVGG模型单个样本平均推理时间较短,但准确率最低;GoogLeNet模型由于使用并行结构,参数量大幅减少,但单个样本平均推理时间增加;AVGG模型的准确率与VGG模型相当,但单个样本平均推理时间最短,且在参数量仅比SVGG模型增加2 238个(不足总参数量的0.1%)的情形下,AVGG模型的准确率较SVGG模型提高了7.61%。
3.2 ISRSD算法性能验证
为验证ISRSD算法的性能,与经典的显著性检测算法FT(Frequency-tuned)[19],LC (Local Contrast)[20]和HC(Histogram-based Contrast)[21]进行对比,结果如图6所示。
从图6可看出:ISRSD 算法增强后的目标主体更突出,背景弱化最明显,色彩失真程度相较其他算法更低且边缘、纹理等图像特征保留相对完整;应用FT,LC和HC算法增强后的目标边缘、纹理等特征有所缺失,部分样本存在目标主体与背景同时得到增强的现象,且色彩失真相对较大。
使用AVGG模型分别学习由ISRSD,FT,LC及HC显著性检测算法处理后的煤岩图像样本,不同算法下AVGG模型的准确率如图7所示。可看出AVGG模型对于经ISRSD算法处理的煤岩图像样本比未经显著性检测优化处理样本的识别准确率提升了1.85%,达94.36%,且欠拟合程度更低,这是由于ISRSD算法能够有效强化图像的边缘、纹理、亮度等特征,使图像特征更易被AVGG模型学习;FT,LC及HC算法优化的训练集的识别准确率均低于ISRSD算法。
不同显著性检测算法耗时见表3,可看出ISRSD算法处理单个样本耗时仅略高于FT算法,仍满足煤岩识别速度要求。
表 3 不同显著性检测算法耗时对比Table 3. Comparison of time consumption of different saliency detection algorithms算法 单个样本耗时/ms ISRSD 7.9 FT 5.5 LC 15.9 HC 194.3 3.3 钻孔地质信息融合效果验证
为验证基于贝叶斯模型融合钻孔地质信息的效果,将仅使用AVGG模型识别煤岩图像的准确率与利用贝叶斯模型融合钻孔地质信息后的煤岩识别准确率进行对比,如图8所示。
由图8可知, 融合钻孔地质信息后,煤岩识别平均准确率比融合前高1.85%,达97.31%。
4. 结论
1) 使用ISRSD算法对煤岩图像进行中值滤波、锐化及直方图均衡化处理,优化图像质量;通过对VGG模型剪枝、增加CBAM注意力机制和引入自适应学习率调整策略,高效提取图像特征;基于贝叶斯模型将提取的图像特征与钻孔地质信息融合,获取煤岩分类结果。
2) 实验结果表明,ISRSD算法能够有效增强图像特征,使其更容易被学习的同时降低模型运算量;AVGG模型在保证准确率的同时具有更快的推理速度;基于贝叶斯模型融合钻孔地质信息能有效提升煤岩识别的准确性和鲁棒性。
-
表 1 数据集扩充及类别均衡前后样本数量
Table 1 Sample size before and after data set augmentation and category balancing
类别 数据集扩充及类别
均衡前样本数/张数据集扩充及类别
均衡后样本数/张砂岩 337 1 515 砾岩 96 1 344 泥岩 369 1 348 煤炭 360 1 440 页岩 82 1 394 表 2 不同模型评价指标结果对比
Table 2 Comparison of evaluation index results of different models
模型 准确率/% 单个样本
平均推理时间/ms参数量/106个 模型大小
/MiBGoogLeNet 89.65 68.49 5.981 24 VGG 93.79 117.65 128.810 515 SVGG 83.72 18.86 43.081 172 AVGG 91.33 18.36 43.084 172 表 3 不同显著性检测算法耗时对比
Table 3 Comparison of time consumption of different saliency detection algorithms
算法 单个样本耗时/ms ISRSD 7.9 FT 5.5 LC 15.9 HC 194.3 -
[1] 王国法,刘峰,庞义辉,等. 煤矿智能化——煤炭工业高质量发展的核心技术支撑[J]. 煤炭学报,2019,44(2):349-357. WANG Guofa,LIU Feng,PANG Yihui,et al. Coal mine intellectualization:the core technology of high quality development[J]. Journal of China Coal Society,2019,44(2):349-357.
[2] 王伟,李擎,张德政,等. 基于深度学习的矿石图像处理研究综述[J]. 工程科学学报,2023,45(4):621-631. WANG Wei,LI Qing,ZHANG Dezheng,et al. A survey of ore image processing based on deep learning[J]. Chinese Journal of Engineering,2023,45(4):621-631.
[3] 杨健健,张强,王超,等. 煤矿掘进机的机器人化研究现状与发展[J]. 煤炭学报,2020,45(8):2995-3005. YANG Jianjian,ZHANG Qiang,WANG Chao,et al. Status and development of robotization research on roadheader for coal mines[J]. Journal of China Coal Society,2020,45(8):2995-3005.
[4] 陈浜. 基于视觉计算的煤岩识别方法研究[D]. 北京:中国矿业大学(北京),2018. CHEN Bang. Methodological studies of coal-rock recognition through visual computing[D]. Beijing:China University of Mining & Technology-Beijing,2018.
[5] 张云,童亮,来兴平,等. 基于机器视觉的煤尘环境下掘进空间煤岩界面感知与精准识别[J]. 煤炭学报,2024,49(7):3276-3290. ZHANG Yun,TONG Liang,LAI Xingping,et al. Coal-rock interface perception and accurate recognition in heading face under coal dust environment based on machine vision[J]. Journal of China Coal Society,2024,49(7):3276-3290.
[6] 王建才,李瑾,李志军,等. 基于改进 YOLOv5 的煤岩图像检测识别研究[J]. 煤矿机械,2022,43(9):204-208. WANG Jiancai,LI Jin,LI Zhijun,et al. Research on coal rock image detection and recognition based on improved YOLOv5[J]. Coal Mine Machinery,2022,43(9):204-208.
[7] 高峰,殷欣,刘泉声,等. 基于塔式池化架构的采掘工作面煤岩图像识别方法[J]. 煤炭学报,2021,46(12):4088-4102. GAO Feng,YIN Xin,LIU Quansheng,et al. Coal-rock image recognition method for mining and heading face based on spatial pyramid pooling structure[J]. Journal of China Coal Society,2021,46(12):4088-4102.
[8] 司垒,王忠宾,熊祥祥,等. 基于改进 U−net 网络模型的综采工作面煤岩识别方法[J]. 煤炭学报,2021,46(增刊1):578-589. SI Lei,WANG Zhongbin,XIONG Xiangxiang,et al. Coal-rock recognition method of fully-mechanized coal mining face based on improved U-net network model[J]. Journal of China Coal Society,2021,46(S1):578-589.
[9] 张斌,苏学贵,段振雄,等. YOLOv2在煤岩智能识别与定位中的应用研究[J]. 采矿与岩层控制工程学报,2020,2(2):90-97. ZHANG Bin,SU Xuegui,DUAN Zhenxiong,et al. Application of YOLOv2 in intelligent recognition and location of coal and rock[J]. Journal of Mining and Strata Control Engineering,2020,2(2):90-97.
[10] 闫志蕊,王宏伟,耿毅德. 基于改进DeeplabV3+和迁移学习的煤岩界面图像识别方法[J]. 煤炭科学技术,2023,51(增刊1):429-439. YAN Zhirui,WANG Hongwei,GENG Yide. Coal-rock interface image recognition method based on improved DeeplabV3+ and transfer learning[J]. Coal Science and Technology,2023,51(S1):429-439.
[11] 伍云霞,孟祥龙. 局部约束的自学习煤岩识别方法[J]. 煤炭学报,2018,43(9):2639-2646. WU Yunxia,MENG Xianglong. Locality-constrained self-taught learning for coal-rock recognition[J]. Journal of China Coal Society,2018,43(9):2639-2646.
[12] 伍云霞,田一民. 基于字典学习的煤岩图像特征提取与识别方法[J]. 煤炭学报,2016,41(12):3190-3196. WU Yunxia,TIAN Yimin. Method of coal-rock image feature extraction and recognition based on dictionary learning[J]. Journal of China Coal Society,2016,41(12):3190-3196.
[13] 吴岚虎,李智玮,刘垒烨,等. 基于场景几何信息的显著性目标检测方法综述[J]. 模式识别与人工智能,2023,36(2):120-142. WU Lanhu,LI Zhiwei,LIU Leiye,et al. A survey of salient object detection based on scene geometric information[J]. Pattern Recognition and Artificial Intelligence,2023,36(2):120-142.
[14] HOU Xiaodi,ZHANG Liqing. Saliency detection:a spectral residual approach[C]. IEEE Conference on Computer Vision and Pattern Recognition,Minneapolis,2007:1-8.
[15] SIMONYAN K,ZISSERMAN A. Very deep convolutional networks for large-scale image recognition[J]. Computer Science, 2014. DOI: 10.48550/arXiv.1409.1556.
[16] WOO S,PARK J,LEE J Y,et al. CBAM:convolutional block attention module[C]. European Conference on Computer Vision,Munich,2018:61-78.
[17] HARRINGTON P. Machine learning in action[M]. Singapore:Springer Nature Singapore Pte Ltd. ,2012.
[18] ZHOU Zhihua. Machine learning[M]. Singapore:Springer Nature Singapore Pte Ltd. ,2021.
[19] ACHANTA R,HEMAMI S,ESTRADA F,et al. Frequency-tuned salient region detection[C]. IEEE Conference on Computer Vision and Pattern Recognition,Munich ,2009:1597-1604.
[20] CHENG Mingming,ZHANG Guoxin,MITRA N J,et al. Global contrast based salient region detection[C]. IEEE Transactions on Pattern Analysis and Machine Intelligence,Santa Barbara,2015:569-582.
[21] ZHAI Yun,SHAH M. Visual attention detection in video sequences using spatiotemporal cues[C]. The 14th ACM International Conference on Multimedia,Santa Barbara,2006:815-824.
-
期刊类型引用(1)
1. 郭晋辉. 煤矿掘进场景下基于机器视觉的煤岩识别技术. 自动化应用. 2025(01): 92-94 . 百度学术
其他类型引用(0)