当前位置: 首页 > news >正文

【LLIE专题】一种用于低光图像增强的空间自适应光照引导 Transformer(SAIGFormer)框架

在这里插入图片描述

SAIGFormer: A Spatially-Adaptive Illumination-Guided Network for Low-Light Image Enhancement(2025)

  • 专题介绍
  • 一、研究背景
  • 二、方法
      • 2.1 动机
      • 2.2 框架概述
      • 2.3 空间自适应积分光照估计器
      • 2.4 空间自适应光照引导Transformer
  • 三、实验结果
      • 1. 数据集
      • 2. 对比
  • 四、总结

本文将对 SAIGFormer: A Spatially-Adaptive Illumination-Guided Network for Low-Light Image Enhancement,这篇文章进行讲解。参考资料如下:

[1] 文章
[2] 代码


专题介绍

在低光照环境下,传统成像设备往往因画面昏暗、细节丢失而受限。LLIE(低照度暗光增强)技术应运而生,它通过提升图像亮度、对比度,减少噪点并恢复色彩细节,让暗夜变得清晰可见。

LLIE技术从传统方法如直方图均衡化、Retinex模型等起步,近年来借助深度学习,尤其是卷积神经网络(CNN),GAN模型,扩散模型实现了质的飞跃。这些算法能自动学习图像特征,精准处理低光照图像,效果显著优于传统技术。

本专题将聚焦LLIE技术的核心原理、应用案例及最新进展,让我们一起见证LLIE如何点亮暗夜,开启视觉新视界!欢迎一起探讨交流!

系列文章如下
【1】ZeroDCE
【2】HVI
【3】CLIP-LIT
【4】GLARE
【5】Retinexformer
【6】SG-LLIE
【7】GPP-LLIE
【8】FusionNet
【9】EnligtenGAN
【10】PTG
【11】CSNorm
【12】SG-LLIE结构提取方案


一、研究背景

近年来基于 Transformer 的低光增强方法在恢复全局光照方面取得了显著进展,但在逆光、阴影等非均匀光照场景中仍存在过曝光或亮度恢复不足的问题。为此,作者提出了一种空间自适应光照引导 Transformer(SAIGFormer)框架,以实现准确的光照恢复。

具体而言,该框架提出动态积分图像来建模空间变化的光照,并构建了新的空间自适应积分光照估计器 SAI²E;还引入了光照引导多头自注意力(IGMSA)机制,利用光照校准与亮度相关的特征,以实现视觉上满意的光照增强。

在五个标准低光数据集和一个跨域基准(LOL-Blur)上的大量实验表明,SAIGFormer 在定量和定性指标上均显著优于最先进的方法,尤其在非均匀光照增强方面表现出色,同时在多个数据集上具有很强的泛化能力。

二、方法

作者认为光照估计器的本质需要基于以下三个关键要点:
(1)简单且轻量,避免复杂的网络结构和手工制定的约束。
(2)具有很强的空间适应性,以准确匹配非均匀且空间复杂的光照分布。
(3)它应位于早期阶段,以便在框架的所有模块中提供光照引导,实现精确的光照恢复。

基于这些原则,作者开发了一种简单而高效的空间自适应积分光照估计器(SAI²E),该估计器引入了动态积分图像技术,从原始图像中提取空间变化的光照。此外,作者提出了一种光照引导多头自注意力(IG-MSA)模块,该模块将提取的光照图与通道注意力相结合。

2.1 动机

-现有光照估计器通常采用简单的Mean-RGB/Max-RGB理论或基于Retinex的框架,但这些方法往往无法实现精确的光照恢复。

  • 已知光照主要编码在图像的低频分量中,早期基于Retinex理论的工作采用高斯滤波来增强估计光照图的平滑性,低通滤波器是提取光照分量的可行选择。但现实场景中的光照高度不均匀且空间复杂,不同光照条件下的区域在噪声污染程度上存在显著差异,固定窗口大小的低通滤波器无法在所有空间区域一致地捕捉具有代表性的光照分量,可能会误导模型在整个图像上均匀地学习准确的光照模式
  • 作者提出了高效的光照估计器SAI²E,首次将动态积分图像表示引入低光图像增强。积分图像能够快速并行计算图像任意矩形区域的逐像素积分,利用这一特性,采用小型子网络为低光图像中不同光照条件的区域自适应分配不同窗口大小的低通滤波器,从而实现每个区域的准确光照估计

2.2 框架概述

如前所述,现有的光照增强框架难以有效增强非均匀光照。为解决这一问题,首先从原始图像中估计空间自适应光照,以指导Transformer框架精确增强光照。
在这里插入图片描述
上图展示了所提出的空间自适应光照引导Transformer(SAIGFormer)的整体框架。在框架的浅层,所提出的空间自适应积分光照估计器(SAI²E)从输入图像的每个通道估计光照。SAIGFormer的主要架构采用UNet架构,其中每个阶段由堆叠的空间自适应光照引导Transformer(SAIGT)块组成。光照图像IL−0I_{L_{-} 0}IL0通过通道方向的深度可分离卷积在各个尺度下采样为IL−1I_{L_{-} 1}IL1IL−2I_{L_{-} 2}IL2IL−3I_{L_{-} 3}IL3。值得注意的是,光照图像不会被上采样,而是在编码器和解码器之间共享。

2.3 空间自适应积分光照估计器

空间自适应积分光照估计器(SAI²E)旨在高效且准确地从输入图像中估计非均匀光照。

SAI²E由四个阶段组成:
1)积分图像的计算;
2)每个空间位置的积分区域和调制系数的预测;
3)动态积分图像的计算和每个空间位置的光照估计;
4)光照的调制。

具体来说:

  1. 动态积分区域的确定
    首先,通过Offset-Net预测坐标偏移图O∈RH×W×4O \in \mathbb{R}^{H ×W ×4}ORH×W×4,其中偏移图的四个通道分别表示每个空间位置中心坐标CCC在顶部(t)、左侧(l)、底部(b)和右侧(r)的位移量。由于训练和测试阶段图像尺寸可能不一致,需将每个空间位置的偏移乘以缩放因子Nh=h/HN_h = h / HNh=h/HNw=w/WN_w = w / WNw=w/W, h、wh、whw为训练图像尺寸,H、WH、WHW为原始图像尺寸)以适配不同尺寸。基于上述偏移量,可计算每个空间位置的动态积分区域坐标(tl, tr, bl, br),这些坐标定义了该位置对应的矩形积分区域范围。
  2. 动态积分图像的计算
    在确定动态积分区域后,利用积分图像的特性计算动态积分图像IdI_dId。积分图像Iii(x,y)I_{ii}(x, y)Iii(x,y)的计算公式为:
    Iii(x,y)=∑x′≤xy′≤yI(x′,y′)I_{ii}(x, y) = \sum_{\substack{x' \leq x \\ y' \leq y}} I(x', y')Iii(x,y)=xxyyI(x,y)
    其中,Iii(x,y)I_{ii}(x, y)Iii(x,y)表示原始图像III中所有位于(x,y)(x, y)(x,y)上方和左侧的像素总和。
    动态积分图像IdI_dId的计算基于上述积分图像,通过动态积分区域的坐标(tl, tr, bl, br),快速求解该区域内的像素和,从而实现对空间变化光照的自适应估计。
  3. 光照图的最终生成
    估计每个空间位置的光照后,将其与Modulation-Net预测的调制系数图M∈RH×W×3M \in \mathbb{R}^{H ×W ×3}MRH×W×3相乘,得到最终的光照图ILI_LIL,公式可概括为:
    IL=(光照估计值)×MI_L = \text{(光照估计值)} \times MIL=(光照估计值)×M
    以此实现对光照强度的自适应调制,确保光照估计的准确性。

总之,结合卷积神经网络和积分图像算法,为每个空间位置自适应地预测不同窗口大小的低通滤波区域。

2.4 空间自适应光照引导Transformer

如上图所示,SAIGT由两个PreLayerNorm(LN)、一个光照引导多头自注意力(IGMSA)模块和一个双门控前馈网络(DG-FFN)组成。IG-MSA:为了优化Transformer内的光照特征建模,提出了IG-MSA(光照引导多头自注意力),它将光照集成到查询向量中以校准通道特征,从而引导Transformer实现准确的光照增强(类似retinexformer思路)。这个网络结构在transformer结构中非常常见,不再赘述。

三、实验结果

1. 数据集

在6个低光图像增强基准数据集上进行评估,具体包括:

  • LOL系列:LOL-v1(500对图像,485用于训练,15用于测试);LOL-v2分为真实子集(LOL-v2-Real,689:100划分)和合成子集(LOL-v2-Syn,900:100划分)。
  • SID与SMID:均包含短曝光(低光)和长曝光(正常光)图像对,SID含2697对(2099训练、598测试),SMID含20809对(15763训练、剩余测试),均从RAW格式转换为sRGB格式。
  • LOL-Blur:含12000对低光且含运动模糊的图像,按17:3划分为训练和测试集,用于验证跨域泛化能力。

2. 对比

通过定量(PSNR、SSIM)和定性指标,与RetinexNet、EnlightenGAN、UFormer等现有方法对比,结果如下:

  1. 定量结果

    • LOL-v1:PSNR达24.94dB,超第二名SNR-Net 0.33dB,SSIM 0.863,为当前最优。
    • LOL-v2-Syn:PSNR 26.60dB,超第二名URWKV 0.24dB,SSIM 0.946,居首。
    • SMID:PSNR 29.67dB,超第二名URWKV 0.23dB,SSIM 0.831,表现最优。
    • LOL-Blur(跨域):PSNR 27.41dB,超第二名URWKV 0.14dB,SSIM 0.908,验证强泛化能力。
      在这里插入图片描述
  2. 定性结果
    视觉对比显示,SAIGFormer在非均匀光照场景(如逆光、阴影)中能避免过曝光(如LLFlow、GSAD)、欠曝光(如CIDNet)及噪声、artifacts(如Retinexformer),光照分布更接近真实值;在极端暗区和运动模糊场景中,细节恢复更优,色彩失真更少。
    在这里插入图片描述

四、总结

本文的核心创新点主要是空间自适应积分光照估计器(SAI²E):首次在深度学习中引入动态积分图像表示。该估计器能为不同光照条件的区域自适应分配不同窗口大小的低通滤波器,准确捕捉空间变化的光照分布。


感谢阅读,欢迎留言或私信,一起探讨和交流。
如果对你有帮助的话,也希望可以给博主点一个关注,感谢。

http://www.xdnf.cn/news/1356751.html

相关文章:

  • Ansible 自动化基石:变量定义、优先级控制与 Vault 敏感信息加密实战指南
  • 【重学MySQL】八十七. 触发器管理全攻略:SHOW TRIGGERS与DROP TRIGGER实战详解
  • MySQL管理
  • [身份验证脚手架] 认证路由 | 认证后端控制器与请求
  • MR椎间盘和腰椎分割项目:基于深度学习的医学图像分析
  • 【数据结构】栈和队列——栈
  • MyBatis 和 MyBatis-Plus对比
  • 一个奇怪的问题-Python会替代Java吗?技术语言之争的真相-优雅草卓伊凡
  • 深度学习:CUDA、PyTorch下载安装
  • 用 Bright Data MCP Server 构建实时数据驱动的 AI 情报系统:从市场调研到技术追踪的自动化实战
  • 自由学习记录(87)
  • System.IO.Pipelines 与“零拷贝”:在 .NET 打造高吞吐二进制 RPC
  • 关于 svn无法查看下拉日志提示“要离线”和根目录看日志“no data” 的解决方法
  • 编译Marlin 1.1.9.1固件指南
  • 如何理解“向量”
  • 大数据、hadoop、爬虫、spark项目开发设计之基于数据挖掘的交通流量分析研究
  • 数据挖掘 4.1~4.7 机器学习性能评估参数
  • 【软考架构】云计算相关概念
  • 《CF1120D Power Tree》
  • Implementing Redis in C++ : E(AVL树详解)
  • 深入解析Apache Kafka的核心概念:构建高吞吐分布式流处理平台
  • 自动化运维之k8s——Kubernetes集群部署、pod、service微服务、kubernetes网络通信
  • Linux-函数的使用-编写监控脚本
  • Qt——网络通信(UDP/TCP/HTTP)
  • Linux学习-TCP网络协议
  • Linux shell脚本数值计算与条件执行
  • (计算机网络)JWT三部分及 Signature 作用
  • 如何在 IDEA 中在启动 Spring Boot 项目时加参数
  • [Windows] PDF-XChange Editor Plus官方便携版
  • 海盗王3.0客户端从32位升级64位之路