基于改进YOLOv5的矿山遥感图像去噪方法

裴丹, 房坤, 庆宇东, 陈沛

裴丹, 房坤, 庆宇东, 陈沛. 基于改进YOLOv5的矿山遥感图像去噪方法[J]. 工矿自动化, 2025, 51(3): 148-155. DOI: 10.13272/j.issn.1671-251x.2024110095
引用本文: 裴丹, 房坤, 庆宇东, 陈沛. 基于改进YOLOv5的矿山遥感图像去噪方法[J]. 工矿自动化, 2025, 51(3): 148-155. DOI: 10.13272/j.issn.1671-251x.2024110095
PEI Dan, FANG Kun, QING Yudong, CHEN Pei. Mine remote sensing image denoising method based on improved YOLOv5[J]. Journal of Mine Automation, 2025, 51(3): 148-155. DOI: 10.13272/j.issn.1671-251x.2024110095
Citation: PEI Dan, FANG Kun, QING Yudong, CHEN Pei. Mine remote sensing image denoising method based on improved YOLOv5[J]. Journal of Mine Automation, 2025, 51(3): 148-155. DOI: 10.13272/j.issn.1671-251x.2024110095

基于改进YOLOv5的矿山遥感图像去噪方法

基金项目: 2022年河南省教育厅高校重点项目(22B520023)。
详细信息
    作者简介:

    裴丹(1989—),女,河南洛阳人,助教,研究方向为计算机科学与技术,E-mail: 815290206@qq.com

    通讯作者:

    房坤(1991—),男,河南开封人,高级工程师,博士,研究方向为结构安全评估与可靠性分析,E-mail: 18317553962@163.com

  • 中图分类号: TD67

Mine remote sensing image denoising method based on improved YOLOv5

  • 摘要:

    典型露天矿场景的图像呈现多类型复合噪声特征,信噪比较低且具有显著的空间异质性,现有深度学习模型大多直接迁移自然图像去噪架构,忽视了矿山遥感图像特有的噪声分布规律。针对该问题,提出了一种基于改进YOLOv5的矿山遥感图像去噪方法。针对传统YOLOv5在高噪声环境下性能不稳定的问题,引入了多尺度特征融合模块,以增强模型对不同尺寸噪声的识别能力,同时结合残差注意力机制,提升了模型对有用特征的提取能力,增强了去噪效果的鲁棒性。采用自适应噪声估计技术,根据图像不同区域的噪声特性动态调整去噪参数,实现了更为精准的噪声抑制。实验结果表明:改进YOLOv5在峰值信噪比(PSNR)和结构相似性指数(SSIM)上均显著优于其他经典去噪方法,相较原始YOLOv5,PSNR提高2.5 dB,SSIM提高了0.05;改进YOLOv5在所有噪声类型下均表现出色,尤其是在高斯噪声环境中,其PSNR和SSIM分别达32.5 dB和0.95,显著优于其他经典去噪方法。

    Abstract:

    The images of typical open-pit mining scenarios exhibit multi-type composite noise characteristics, with a low signal-to-noise ratio and significant spatial heterogeneity. Most existing deep learning models directly transfer denoising architectures from natural images, ignoring the unique noise distribution patterns of mining remote sensing images. To address the issue, a mine remote sensing image denoising method based on improved YOLOv5 was proposed. Considering the instability of traditional YOLOv5 in high-noise environments, a multi-scale feature fusion module was introduced to enhance the model's ability to recognize noise of different sizes. Additionally, a residual attention mechanism was incorporated to improve the extraction of useful features and enhance the robustness of the denoising effect. An adaptive noise estimation technique was employed to dynamically adjust denoising parameters based on the noise characteristics of different image regions, achieving more precise noise suppression. The experimental results showed that the improved YOLOv5 significantly outperformed other classical denoising methods in terms of peak signal-to-noise ratio (PSNR) and structural similarity index measure (SSIM). Compared to the original YOLOv5, the PSNR value increased by 2.5 dB, and the SSIM improved by 0.05. The improved YOLOv5 performed well under all noise types, especially in Gaussian noise environments, where its PSNR and SSIM reached 32.5 dB and 0.95, respectively, significantly surpassing other classical denoising methods.

  • 随着智能矿山建设的快速推进,计算机视觉技术在露天矿安全监控、边坡形变监测和矿区生态修复等领域发挥着日益重要的作用[1-3]。矿山遥感图像作为地表信息获取的核心载体,其质量直接影响着矿区目标识别、地质灾害预警等关键任务的准确性。然而,矿山作业环境的特殊性给图像采集带来严峻挑战:露天开采产生的粉尘扩散,形成半透明遮蔽效应,大型机械振动导致成像模糊,矿区复杂地形引发光照不均等,致使图像呈现多类型复合噪声特征[4]。研究表明,典型露天矿场景的图像信噪比较自然图像低32%~45%,且具有显著的空间异质性[5-7],这对去噪方法提出了新的适应性要求。

    矿山遥感图像去噪技术的发展历经3个阶段:早期研究主要采用空域滤波方法,通过调节扩散系数在去噪与边缘保持间取得平衡[8];中期研究转向变换域方法,利用小波包分解对矿区多光谱图像进行分层去噪,但难以适应粉尘噪声的非平稳特性[9-10];近年来,随着深度学习技术的发展,基于深度神经网络的去噪方法展现出了强大的性能[11],其中YOLO系列算法作为目标检测领域的主流算法,具有较强的特征提取能力和实时性能。

    沈丹萍等[12]提出了一种结合YOLOX−S轻量化目标检测与多阈值分割的矿山遥感图像去噪方法,显著提升了图像质量。宋怀波等[13]采用基于容差的暗通道先验算法去除图像中的雾霾和薄云,增强整体对比度及云层边缘清晰度。樊培利等[14]针对矿山远程监控图像噪声问题,提出了一种基于生成对抗残差学习的算法,可有效去除噪声,提升图像质量与鲁棒性。然而,现有深度学习模型大多直接迁移自然图像去噪架构,忽视了矿山遥感图像特有的噪声分布规律,矿区图像噪声具有显著的空间异质性,在开采作业区呈现高强度椒盐噪声,在运输道路区域则以高斯−泊松混合噪声为主[15]

    针对上述问题,本文提出了一种基于改进YOLOv5的矿山遥感图像去噪方法。通过引入多尺度特征融合模块,显著增强了模型对不同尺度噪声的适应能力。在矿山遥感图像中,噪声通常呈现出从细微到显著的不同尺度分布特征。多尺度特征融合能够同时捕捉图像中的细节层次和整体结构信息,从而有效识别和去除各种噪声。此外,这一模块还提升了模型对目标物体边缘和纹理的保留能力,避免在去噪过程中丢失关键信息。设计了残差注意力机制,以提高模型对图像中关键特征的提取能力,进而强化去噪效果。应用自适应噪声估计技术,使得模型能够实时分析图像中的噪声分布,自动调整去噪参数,以适应环境中多变的噪声特性,显著提高在不同噪声条件下的去噪性能,确保矿山遥感图像在各种环境下的稳定性和准确性。

    基于改进YOLOv5的矿山遥感图像去噪方法包括3个核心模块:多尺度特征融合模块、残差注意力机制和自适应噪声估计模块。通过3个模块的协同工作,增强模型对不同尺度噪声的适应性,提高关键特征提取能力,并实现去噪参数动态调整。整体流程如图1所示,k为卷积核大小,S为卷积步长,n为模块重复次数,p为卷积填充大小。输入的含噪图像经过多尺度特征提取,得到不同尺度下的特征表示;利用残差注意力机制对特征进行加权处理,突出重要特征;结合自适应噪声估计对特征进行去噪重建,输出高质量的无噪图像。

    图  1  基于改进YOLOv5的矿山遥感图像去噪方法流程
    Figure  1.  Process of mine remote sensing image denoising method based on improved YOLOv5

    矿山遥感图像中的噪声具有多样性和多尺度特征,传统的单尺度特征提取难以充分捕获噪声信息。鉴此,本文引入多尺度特征融合模块,以增强模型对不同尺度噪声的感知和处理能力[16]。设输入的含噪图像为$ {\boldsymbol{I}} \in \bf{R}^{H \times W \times C} $,其中HWC分别为图像的高度、宽度和通道数。首先,通过多个卷积层提取不同尺度下的特征:

    $$ \left\{\begin{split} {{\boldsymbol{F}}_1} =& {\text{Con}}{{\text{v}}_1}({\boldsymbol{I}})\\ {{\boldsymbol{F}}_2} =& {\text{Con}}{{\text{v}}_2}({{\boldsymbol{F}}_1})\\ {{\boldsymbol{F}}_3} =& {\text{Con}}{{\text{v}}_3}({{\boldsymbol{F}}_2}) \end{split}\right. $$ (1)

    式中:$ {{\boldsymbol{F}}_k} $为第k层的特征映射,k=1,2,3;$ {\text{Con}}{{\text{v}}_k}( \cdot ) $为第k层的卷积操作。

    为了融合不同尺度的特征,采用上采样和下采样操作将各尺度特征映射到相同尺寸,然后进行元素级的加权融合。

    $$ {{\boldsymbol{F}}_{{\text{fusion}}}} = {w_1} {\text{Upsample}}({{\boldsymbol{F}}_1}) + {w_2} {{\boldsymbol{F}}_2} + {w_3} {\text{Downsample}}({{\boldsymbol{F}}_3}) $$ (2)

    式中:$ {{\boldsymbol{F}}_{{\text{fusion}}}} $为多尺度特征融合后的特征映射;$ {w_k} $为融合权重,$ {w_1} + {w_2} + {w_3} = 1 $;$ {\text{Upsample}}( \cdot ) $和$ {\text{Downsample}}( \cdot ) $分别为上采样和下采样操作。

    通过多尺度特征融合,模型能够同时关注到大尺度的整体结构和小尺度的细节信息,提高对不同尺度噪声的处理能力[17]

    为了进一步突出关键特征,引入了残差注意力机制[18]。该机制能够自适应地调整特征通道的权重,增强有用特征,抑制无关或干扰特征[19-20]。残差注意力机制如图2所示。对输入特征进行1×1卷积运算,将通道数从2 048压缩至512。此步骤属于通道降维操作,旨在减少后续注意力机制的计算负担,同时提取关键通道信息。在通道数为512的特征图上引入自注意力机制,用于学习不同通道的重要性权重。注意力特征经过1×1卷积运算,将通道数从512恢复至2 048,保证与输入特征的维度一致,便于后续残差连接[21]

    首先,对融合特征$ {{\boldsymbol{F}}_{{\text{fusion}}}} $进行全局平均池化,得到通道维度的统计信息:

    $$ {\boldsymbol{z}} = {\text{GAP}}({{\boldsymbol{F}}_{{\text{fusion}}}}) $$ (3)

    式中$ {\text{GAP}}( \cdot ) $为全局平均池化操作。

    经过2个全连接层和非线性激活函数,生成通道权重:

    $$ {\boldsymbol{s}} = \sigma ({{\boldsymbol{W}}_2}\delta ({{\boldsymbol{W}}_1} {\boldsymbol{z}})) $$ (4)

    式中:s为通道权重向量,$ {\boldsymbol{s}} \in {\bf{R}^C} $;$ \sigma ( \cdot ) $为Sigmoid 激活函数;$ {{\boldsymbol{W}}_1} $和$ {{\boldsymbol{W}}_2} $为可学习的权重矩阵;$ \delta ( \cdot ) $为ReLU 激活函数。

    对融合特征进行加权处理,并通过残差连接保留原始特征:

    $$ {{\boldsymbol{F}}_{{\text{att}}}} = {{\boldsymbol{F}}_{{\text{fusion}}}} + {{\boldsymbol{F}}_{{\text{fusion}}}} \odot {\boldsymbol{s}} $$ (5)

    式中:$ {{\boldsymbol{F}}_{{\text{att}}}} $为注意力特征;$ \odot $表示通道间逐元素乘法。

    图  2  残差注意力机制
    Figure  2.  Residual attention mechanism

    由于矿山遥感图像中不同区域的噪声特性可能存在差异,固定的去噪参数难以适应复杂的噪声分布[22-23]。鉴此,本文采用自适应噪声估计技术,根据图像的局部特性动态调整去噪参数[24]。首先,对注意力特征$ {{\boldsymbol{F}}_{{\text{att}}}} $进行局部统计,估计噪声水平。对于图像的每个局部区域$ {\varOmega _{(i,j)}} $,计算其方差:

    $$ \sigma _{(i,j)}^2 = \frac{1}{{|{\varOmega _{(i,j)}}|}}\sum\limits_{(m,n) \in {\varOmega _{(i,j)}}} {{{\left( {{\boldsymbol{F}}_{{\text{att}}}^{(m,n)} - {\mu _{(i,j)}}} \right)}^2}} $$ (6)

    式中:$ |{\varOmega _{(i,j)}}| $为区域内像素数量;$ {\boldsymbol{F}}_{{\text{att}}}^{(m,n)} $为位置$ (m,n) $处的特征值;$ {\mu _{(i,j)}} $为区域$ {\varOmega _{(i,j)}} $的平均值。

    根据估计的噪声水平$ {\sigma _{(i,j)}} $,动态调整去噪参数。

    $$ {\boldsymbol{F}}_{{\text{denoise}}}^{(i,j)} = {\boldsymbol{F}}_{{\text{att}}}^{(i,j)} - {\lambda _{(i,j)}} {\hat {\boldsymbol{N}}^{(i,j)}} $$ (7)

    式中:$ {\boldsymbol{F}}_{{\text{denoise}}}^{(i,j)} $为去噪后的特征;$ {\lambda _{(i,j)}} $为自适应去噪参数;$ {\hat {\boldsymbol{N}}^{(i,j)}} $为估计的噪声分量。

    $$ {\lambda _{(i,j)}} = \frac{{\sigma _{(i,j)}^2}}{{\sigma _{(i,j)}^2 + \beta }} $$ (8)

    式中$ \;\beta $为平滑因子,用于防止分母为0。

    通过自适应噪声估计,模型能够针对不同区域的噪声特性动态调整去噪强度,实现更精准的噪声抑制。

    为了训练模型,使其具备良好的去噪性能,设计了综合的损失函数,包括重构损失和感知损失[25]。重构损失衡量去噪后的图像与原始无噪图像之间的像素差异,采用均方误差(Mean-Square Error,MSE)定义。

    $$ {\mathcal{L}_{{\text{MSE}}}} = \frac{1}{N}\sum\limits_{t = 1}^N {\left\| {{\boldsymbol{I}}_{{\text{denoise}}}^{(t)} - {\boldsymbol{I}}_{{\text{clean}}}^{(t)}} \right\|_2^2} $$ (9)

    式中:$ {\mathcal{L}_{{\text{MSE}}}} $为MSE损失函数;N为像素总数;$ {\boldsymbol{I}}_{{\text{denoise}}}^{(t)} $为第t张去噪后的图像;$ {\boldsymbol{I}}_{{\text{clean}}}^{(t)} $为第t张原始图像。

    采用感知损失保留图像的高层次语义信息,感知损失函数为

    $$ {\mathcal{L}_{{\text{perceptual}}}} = \frac{1}{M}\sum\limits_{l = 1}^M {\left\| {{\phi _l}({{\boldsymbol{I}}_{{\text{denoise}}}}) - {\phi _l}({{\boldsymbol{I}}_{{\text{clean}}}})} \right\|_2^2} $$ (10)

    式中:M为感知损失的 VGG 网络层数,本文设置为8;$ {\phi _l}( \cdot ) $为VGG 网络第$ l $层的特征提取。

    模型的总损失函数为

    $$ {\mathcal{L}_{{\text{total}}}} = \alpha {\mathcal{L}_{{\text{MSE}}}} + \gamma {\mathcal{L}_{{\text{perceptual}}}} $$ (11)

    式中$ \alpha $和$ \gamma $为权重超参数,分别设置为0.4和0.5。

    选取了新疆有色金属工业有限责任公司提供的矿山遥感图像作为实验数据集。数据集总计包含2 000张原始图像,图像分辨率为3 840×2 160像素。该矿区采用露天开采方式,采场呈圆形阶梯状布置,共设计15个台阶,单个台阶高度为15 m,最大开采深度达225 m。实验数据主要采集自以下区域:① 露天采场作业区(螺旋形布置的运输道路系统和多层采矿平台),包括阶梯式采场、运输道路、工作平台等重点区域的航拍图像,占总数据量的40%。② 矿区尾矿库(层状排列的尾矿处理池和周围的岩层地貌),涵盖蓝色沉淀池、排水系统等环保处理设施的航拍图像,占比30%。③ 矿区周边地貌区域(褐色岩层分布和地形起伏特征),主要包括矿区周围的山体、峡谷等自然地貌特征的航拍图像,占比30%。

    为了模拟更复杂的噪声环境,在原始图像上添加高斯噪声、椒盐噪声和斑点噪声等多种典型噪声类型,最终得到含噪图像6 000张,用于模型的训练和测试。将数据集按8∶2的比例划分,其中80%用于训练,20%用于测试。训练过程中,优化器采用Adam,设置初始学习率为0.001,批量大小为32,训练轮数为100。

    为了客观评价各算法的去噪效果,选取了峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和结构相似性指数(Structural Similarity Index Measure,SSIM)作为主要评估指标。PSNR用于衡量去噪后图像与原始无噪图像之间的误差。SSIM用于衡量去噪后图像与原始图像在结构、亮度和对比度等方面的相似性。

    为了全面评估改进YOLOv5在矿山遥感图像去噪任务中的性能,将其与多种经典去噪方法进行详细对比,包括传统滤波方法(中值滤波、维纳滤波)、基于非局部特性的去噪方法(非局部均值滤波)及基于深度学习的去噪方法(去噪自编码器、原始YOLOv5)。为了确保实验结果的可靠性,每种方法均在相同的数据集和噪声条件下进行实验,结果见表1。可看出,改进YOLOv5在PSNR和SSIM上均显著优于其他经典去噪方法,相较原始YOLOv5,PSNR提高2.5 dB,SSIM提高了0.05,运行时间和参数量略有增加,表明模型复杂度有所提升,但在矿山遥感图像去噪任务中是可接受的。

    表  1  不同算法的去噪性能比较
    Table  1.  Comparison of denoising performance of different algorithms
    算法 PSNR /dB SSIM 运行时间/ s 参数量/106
    中值滤波 25.3 0.78 0.05
    维纳滤波 26.7 0.81 0.07
    非局部均值滤波 27.5 0.83 0.15
    去噪自编码器 28.9 0.86 1.20 1.2
    原始YOLOv5 29.4 0.88 0.95 7.0
    改进YOLOv5 31.9 0.93 1.10 7.5
    下载: 导出CSV 
    | 显示表格

    不同的收敛曲线对比如图3所示,可看出,改进YOLOv5在矿山遥感图像去噪任务中表现出了显著的收敛性优势。与中值滤波、维纳滤波和非局部均值滤波和原始YOLOv5相比,改进YOLOv5算法损失值的下降速度更快,而且最终能够稳定地达到较低的损失值,表现出更好的去噪效果和鲁棒性。这表明改进YOLOv5通过引入多尺度特征融合模块和残差注意力机制,能够更有效地处理高噪声环境下的图像,从而提升其在复杂矿山作业环境中的应用潜力。

    图  3  不同算法的收敛曲线对比
    Figure  3.  Comparison of convergence curves for different algorithms

    为了进一步验证改进算法在不同噪声类型下的表现,分别在高斯噪声、椒盐噪声和斑点噪声环境下对各算法的去噪效果进行了测试。噪声强度均设置为相同水平,以保证对比的公平性。测试结果见表2。可看出改进YOLOv5在所有噪声类型下均表现出色,尤其是在高斯噪声环境中,其PSNR和SSIM分别达32.5 dB和0.95,显著优于其他算法。这表明改进YOLOv5在处理不同噪声类型时具有更强的适应性和鲁棒性。对于椒盐噪声和斑点噪声,改进YOLOv5同样保持了较好的去噪效果,PSNR分别为31.2 dB和31.0 dB,SSIM分别为0.93和0.92。上述结果表明,多尺度特征融合模块和残差注意力机制在不同噪声环境下都能有效提升模型的去噪性能。

    表  2  不同噪声类型下各算法的PSNR和SSIM
    Table  2.  PSNR and SSIM of each method under different noise types
    噪声类型 算法 PSNR /dB SSIM
    高斯噪声 改进YOLOv5 32.5 0.95
    原始YOLOv5 29.4 0.88
    去噪自编码器 28.9 0.86
    非局部均值滤波 27.5 0.83
    维纳滤波 26.7 0.81
    中值滤波 25.3 0.78
    椒盐噪声 改进YOLOv5 31.2 0.93
    原始YOLOv5 27.8 0.85
    去噪自编码器 26.5 0.80
    非局部均值滤波 27.5 0.83
    维纳滤波 26.7 0.81
    中值滤波 25.3 0.78
    斑点噪声 改进YOLOv5 31.0 0.92
    原始YOLOv5 28.0 0.89
    去噪自编码器 27.0 0.84
    非局部均值滤波 27.5 0.83
    维纳滤波 26.7 0.81
    中值滤波 25.3 0.78
    下载: 导出CSV 
    | 显示表格

    将不同噪声类型下各算法的去噪效果进行了对比,结果如图4图6所示。

    图  4  高斯噪声下实验结果
    Figure  4.  Experimental results under Gaussian noise
    图  5  椒盐噪声下实验结果
    Figure  5.  Experimental results under salt-and-pepper noise
    图  6  斑点噪声下实验结果
    Figure  6.  Experimental results under speckle noise

    在添加高斯噪声的实验中,采用原始YOLOv5去噪后,图像仍然存在明显的模糊和噪声残留。改进YOLOv5能够更好地去除噪声,并恢复更多细节。中值滤波和维纳滤波也在一定程度上抑制了噪声,但图像仍然较为模糊,细节丢失较严重。非局部均值滤波性能相对较好,但在高噪声环境下的表现仍然不及改进YOLOv5。

    在椒盐噪声的实验中,中值滤波表现较好,能够有效去除一些椒盐噪声,但依然有不少噪点残留。维纳滤波和非局部均值滤波虽然能去除部分噪声,但图像的细节恢复效果差强人意。原始YOLOv5去噪后,虽然椒盐噪声有所减少,但残留噪点较多。改进YOLOv5则能够几乎完全去除椒盐噪声,图像质量得到了显著提升。

    对于斑点噪声的情况,传统算法如中值滤波和非局部均值滤波在去除斑点噪声时效果一般,噪声仍然比较明显。维纳滤波的效果稍好,但去噪后图像对比度和细节恢复不足。原始YOLOv5尽管有一定的改善,但斑点噪声依然存在,且图像质量恢复较差。改进YOLOv5则有效减弱了斑点噪声的影响,图像的对比度和细节得到了显著恢复,表现明显优于传统算法。

    与传统的去噪算法相比,改进YOLOv5在处理不同类型的噪声时表现出了更为显著的优势。其能够通过深度学习框架提取更加丰富的上下文信息,并结合多尺度特征融合和残差注意力机制等技术,显著提升了图像去噪效果。此外,改进YOLOv5的自适应噪声估计能力使其在处理复杂矿山遥感图像时表现出更强的鲁棒性和适应性。

    为了验证各项改进措施对整体去噪性能的贡献,设计了消融实验。以原始YOLOv5为基准,逐步引入多尺度特征融合模块、残差注意力机制和自适应噪声估计技术,观察每项改进对模型性能的影响,结果见表3。可看出,各模块对去噪性能的提升起到了积极的作用。

    改进YOLOv5在高噪声环境下的训练损失如图7所示。可看出改进YOLOv5通过引入多尺度特征融合模块和残差注意力机制,显著提升了模型在高噪声环境下的表现,在复杂环境中能够实现对目标的准确识别和高效处理。

    表  3  消融实验结果
    Table  3.  Results of ablation experiments
    模块配置 PSNR/dB SSIM 运行时间/s
    原始YOLOv5 29.4 0.88 0.95
    +多尺度特征融合模块 30.2 0.92 1.00
    +多尺度特征融合模块+残差注意力机制 30.8 0.95 1.05
    +多尺度特征融合模块+残差注意力机制
    +自适应噪声估计
    31.9 0.93 1.10
    下载: 导出CSV 
    | 显示表格
    图  7  改进YOLOv5在高噪声环境下的训练损失
    Figure  7.  Training loss of improved YOLOv5 in high noise environment

    1) 针对矿山遥感图像中复杂多变的噪声问题,提出了一种基于改进YOLOv5的图像去噪方法。通过引入多尺度特征融合模块、残差注意力机制和自适应噪声估计技术,显著提升了模型对不同尺度和类型噪声的适应能力,增强了关键特征的提取效果,并实现了去噪参数的动态调整。这些改进提升了去噪效果的鲁棒性和精度,且保持了良好的实时性。

    2) 对比实验结果表明:改进YOLOv5在PSNR和SSIM方面均优于传统去噪方法和原始YOLOv5;改进YOLOv5在所有噪声类型下均表现出色,尤其是在高斯噪声环境中,其PSNR和SSIM分别达32.5 dB和0.95,显著优于其他算法。消融实验进一步证实了各项改进措施对整体性能提升的贡献。

    3) 未来的研究可进一步优化算法结构,探索更高效的特征提取和注意力机制,并在更大规模和多样化的矿山遥感图像数据集上进行验证。此外,结合实时处理需求,进一步提升算法的计算效率,以更好地应用于实际矿山安全监控和智能化管理系统中。

  • 图  1   基于改进YOLOv5的矿山遥感图像去噪方法流程

    Figure  1.   Process of mine remote sensing image denoising method based on improved YOLOv5

    图  2   残差注意力机制

    Figure  2.   Residual attention mechanism

    图  3   不同算法的收敛曲线对比

    Figure  3.   Comparison of convergence curves for different algorithms

    图  4   高斯噪声下实验结果

    Figure  4.   Experimental results under Gaussian noise

    图  5   椒盐噪声下实验结果

    Figure  5.   Experimental results under salt-and-pepper noise

    图  6   斑点噪声下实验结果

    Figure  6.   Experimental results under speckle noise

    图  7   改进YOLOv5在高噪声环境下的训练损失

    Figure  7.   Training loss of improved YOLOv5 in high noise environment

    表  1   不同算法的去噪性能比较

    Table  1   Comparison of denoising performance of different algorithms

    算法 PSNR /dB SSIM 运行时间/ s 参数量/106
    中值滤波 25.3 0.78 0.05
    维纳滤波 26.7 0.81 0.07
    非局部均值滤波 27.5 0.83 0.15
    去噪自编码器 28.9 0.86 1.20 1.2
    原始YOLOv5 29.4 0.88 0.95 7.0
    改进YOLOv5 31.9 0.93 1.10 7.5
    下载: 导出CSV

    表  2   不同噪声类型下各算法的PSNR和SSIM

    Table  2   PSNR and SSIM of each method under different noise types

    噪声类型 算法 PSNR /dB SSIM
    高斯噪声 改进YOLOv5 32.5 0.95
    原始YOLOv5 29.4 0.88
    去噪自编码器 28.9 0.86
    非局部均值滤波 27.5 0.83
    维纳滤波 26.7 0.81
    中值滤波 25.3 0.78
    椒盐噪声 改进YOLOv5 31.2 0.93
    原始YOLOv5 27.8 0.85
    去噪自编码器 26.5 0.80
    非局部均值滤波 27.5 0.83
    维纳滤波 26.7 0.81
    中值滤波 25.3 0.78
    斑点噪声 改进YOLOv5 31.0 0.92
    原始YOLOv5 28.0 0.89
    去噪自编码器 27.0 0.84
    非局部均值滤波 27.5 0.83
    维纳滤波 26.7 0.81
    中值滤波 25.3 0.78
    下载: 导出CSV

    表  3   消融实验结果

    Table  3   Results of ablation experiments

    模块配置 PSNR/dB SSIM 运行时间/s
    原始YOLOv5 29.4 0.88 0.95
    +多尺度特征融合模块 30.2 0.92 1.00
    +多尺度特征融合模块+残差注意力机制 30.8 0.95 1.05
    +多尺度特征融合模块+残差注意力机制
    +自适应噪声估计
    31.9 0.93 1.10
    下载: 导出CSV
  • [1] 张玉茜,刘文荣,孙勇,等. 基于Faster−RCNN与自注意力机制的矿山图像异常检测算法[J]. 金属矿山,2024(7):196-201.

    ZHANG Yuqian,LIU Wenrong,SUN Yong,et al. Mining image anomaly detection algorithm based on faster-RCNN and self-attention mechanism[J]. Metal Mine,2024(7):196-201.

    [2]

    XIAO Lingzhi,WANG Shengbiao,ZHANG Jun,et al. Poisson2Poisson-Sparse:unsupervised Poisson noise image denoising based on sparse modeling[J]. Signal Processing,2025,230. DOI:10.1016/j.sigpro. 2024.109870.

    [3]

    GUO Xiaoqiang,LIU Xinhua,ZHANG Xu,et al. A novel denoising approach based on improved invertible neural networks for real-time conveyor belt monitoring[J]. IEEE Sensors Journal,23(3):3194-3203.

    [4] 傅荣春雪,刘君强,冯潇楠,等. 基于剪枝和去噪的航空发动机故障图像识别与预测[J]. 航空计算技术,2023,53(2):40-44. DOI: 10.3969/j.issn.1671-654X.2023.02.009

    FU Rongchunxue,LIU Junqiang,FENG Xiaonan,et al. Recognition and prediction of aero-engine fault image based on pruning and denoising[J]. Aeronautical Computing Technique,2023,53(2):40-44. DOI: 10.3969/j.issn.1671-654X.2023.02.009

    [5] 李龙海,郭华锋,于萍,等. 矿山远程监控图像的改进非局部均值滤波算法[J]. 金属矿山,2022(10):165-169.

    LI Longhai,GUO Huafeng,YU Ping,et al. Improved non-local means filtering algorithm of mine remote monitoring image[J]. Metal Mine,2022(10):165-169.

    [6] 赵鑫,冯敬培. 钢丝绳张力监测系统的图像处理功能设计研究[J]. 煤炭科技,2022,43(3):75-78,82.

    ZHAO Xin,FENG Jingpei. Research on image processing function design of wire rope tension monitoring system[J]. Coal Science & Technology Magazine,2022,43(3):75-78,82.

    [7] 孔华永,娄昭远. 基于生成式对抗网络的煤矿图像去噪研究[J]. 煤矿机械,2022,43(7):173-175.

    KONG Huayong,LOU Zhaoyuan. Research on coal mine image denoising based on generative adversarial network[J]. Coal Mine Machinery,2022,43(7):173-175.

    [8] 车守全,李涛,包从望,等. 矿区遥感图像去噪方法研究[J]. 工矿自动化,2022,48(1):113-118,124.

    CHE Shouquan,LI Tao,BAO Congwang,et al. Research on denoising method of remote sensing image in mining area[J]. Industry and Mine Automation,2022,48(1):113-118,124.

    [9] 王小兵. 融合提升小波阈值与多方向边缘检测的矿区遥感图像去噪[J]. 国土资源遥感,2020,32(4):46-52.

    WANG Xiaobing. Denoising algorithm based on the fusion of lifting wavelet thresholding and multidirectional edge detection of remote sensing image of mining area[J]. Remote Sensing for Land & Resources,2020,32(4):46-52.

    [10]

    TIAN Chunwei,ZHENG Menghua,ZUO Wangmeng,et al. Multi-stage image denoising with the wavelet transform[J]. Pattern Recognition,2023,134. DOI: 10.1016/j.patcog.2022.109050.

    [11]

    ZHANG Jie,WANG Fengxian,ZHANG Huanlong,et al. Compressive sensing spatially adaptive total variation method for high-noise astronomical image denoising[J]. The Visual Computer,2024,40(2):1215-1227. DOI: 10.1007/s00371-023-02842-w

    [12] 沈丹萍,赵爽. 基于轻量化YOLOX−S与多阈值分割的矿山遥感图像去噪算法[J]. 金属矿山,2024(9):175-180.

    SHEN Danping,ZHAO Shuang. Mine remote sensing image denoising algorithm based on lightweight YOLOX-S and multi-threshold eegmentation[J]. Metal Mine,2024(9):175-180.

    [13] 宋怀波,雒鹏鑫,王亚男,等. 融合YOLOv5s与Criminisi算法的农业遥感图像去云方法研究[J]. 西北农林科技大学学报(自然科学版),2023,51(3):143-154.

    SONG Huaibo,LUO Pengxin,WANG Yanan,et al. Fusion of YOLOv5s network and Criminisi algorithm to remove clouds from agricultural remote sensing images[J]. Journal of Northwest A & F University(Natural Science Edition),2023,51(3):143-154.

    [14] 樊培利,王建军,艾薇. 基于生成对抗残差学习的矿山远程监控图像去噪算法[J]. 金属矿山,2024(5):286-292.

    FAN Peili,WANG Jianjun,AI Wei. Mine remote monitoring image denoising algorithm based on generated residuals learning[J]. Metal Mine,2024(5):286-292.

    [15]

    DU Jiazhi,QIAO Xin,YAN Zifei,et al. Flexible image denoising model with multi-layer conditional feature modulation[J]. Pattern Recognition,2024,152. DOI: 10.1016/j.patcog.2024.110372.

    [16] 马琳,苏明,兰义湧. 一种基于多尺度特征复用残差网络的矿山图像重建算法[J]. 金属矿山,2023(11):228-233.

    MA Lin,SU Ming,LAN Yiyong. A mine image reconstruction algorithm based on multi-scale feature multiplexing residual network[J]. Metal Mine,2023(11):228-233.

    [17] 李茹,鲁海峰. 基于多尺度卷积神经网络的矿山监控图像识别研究[J]. 唐山学院学报,2023,36(6):5-10,16.

    LI Ru,LU Haifeng. Research on mine monitoring image recognition based on multi-scale convolutional neural network[J]. Journal of Tangshan University,2023,36(6):5-10,16.

    [18] 江结林,史明月,杨海东,等. 多头注意力机制的全频图像去噪算法[J]. 计算机工程与应用,2024,60(16):236-247. DOI: 10.3778/j.issn.1002-8331.2311-0430

    JIANG Jielin,SHI Mingyue,YANG Haidong,et al. Omni-frequency image denoising with multi-head attention[J]. Computer Engineering and Applications,2024,60(16):236-247. DOI: 10.3778/j.issn.1002-8331.2311-0430

    [19]

    WU Wencong,LIU Shijie,XIA Yuelong,et al. Dual residual attention network for image denoising[J]. Pattern Recognition,2024,149. DOI: 10.1016/j.patcog.2024.110291.

    [20]

    SHARIF S M A,ALI NAQVI R,BISWAS M. Learning medical image denoising with deep dynamic residual attention network[J]. Mathematics,2020,8(12). DOI: 10.3390/math8122192.

    [21]

    TAO Haowu,GUO Wenhua,HAN Rui,et al. RDASNet:image denoising via a residual dense attention similarity network[J]. Sensors,2023,23(3). DOI: 10.3390/s23031486.

    [22] 张宇,窦银科,赵亮亮,等. MF−TLID:一种多特征融合输电线覆冰图像去噪方法[J]. 重庆理工大学学报(自然科学),2024,38(10):147-155.

    ZHANG Yu,DOU Yinke,ZHAO Liangliang,et al. An ice-covered transmission line image denoising method fused with multiple features[J]. Journal of Chongqing University of Technology (Natural Science),2024,38(10):147-155.

    [23] 余卓璞,周冬明,周联敏. 基于高阶交互的渐进式真实图像去噪网络[J]. 科学技术与工程,2024,24(21):9043-9052. DOI: 10.12404/j.issn.1671-1815.2306226

    YU Zhuopu,ZHOU Dongming,ZHOU Lianmin. Progressive real-word image denoising network based on higher-order interactions[J]. Science Technology and Engineering,2024,24(21):9043-9052. DOI: 10.12404/j.issn.1671-1815.2306226

    [24] 张杰,卢淼鑫,李嘉康,等. 基于残差密集卷积自编码的高噪声图像去噪方法[J]. 计算机科学,2024,51(增刊1):567-573.

    ZHANG Jie,LU Miaoxin,LI Jiakang,et al. High-noise image denoising method based on residual dense convolutional autoencoder[J]. Computer Science,2024,51(S1):567-573.

    [25] 伏锦,黄山. 基于改进循环生成对抗网络的图像去噪研究[J]. 计算机工程与应用,2023,59(17):178-186. DOI: 10.3778/j.issn.1002-8331.2209-0050

    FU Jin,HUANG Shan. Research on image denoising based on improved CycleGAN[J]. Computer Engineering and Applications,2023,59(17):178-186. DOI: 10.3778/j.issn.1002-8331.2209-0050

图(7)  /  表(3)
计量
  • 文章访问数:  14
  • HTML全文浏览量:  5
  • PDF下载量:  0
  • 被引次数: 0
出版历程
  • 收稿日期:  2024-11-28
  • 修回日期:  2025-03-24
  • 网络出版日期:  2025-03-12
  • 刊出日期:  2025-03-14

目录

/

返回文章
返回