当前位置: 首页 > backend >正文

噪声建模在一小时:最小化准备工作的自监督低光RAW图像去噪

论文标题:
Noise Modeling in One Hour: Minimizing Preparation Efforts for Self-supervised Low-Light RAW Image Denoising
发表日期:
2025年5月
作者:
Feiran Li, Haiyang Jiang*, Daisuke Iso
发表单位:
Sony Research, Tokyo University
原文链接:
https://arxiv.org/pdf/2505.00045
开源代码链接:
https://github.com/SonyResearch/raw_image_denoising

引言

在低光环境下拍摄RAW图像时,噪声问题总是令人头疼。传统降噪方法需要大量成对的干净-噪声图像进行训练,而索尼研究院的这项研究提出了一种自监督学习方法,仅需1小时的准备时间就能完成噪声建模,性能还比现有方法提升了0.54dB。这项技术将大大降低低光摄影的门槛,让更多人能拍出清晰的照片。

论文中的方法架构图展示了这个创新的降噪流程:

实验结果对比图显示,该方法在保持图像细节的同时有效去除了噪声:

实验结果对比图

量子效率统计图展示了该方法在传感器特性分析方面的创新:

量子效率统计图

问题背景及相关工作

在低光环境下拍摄RAW图像时,噪声问题尤为突出。相比标准RGB图像,RAW图像保留了原始噪声特性,具有更高的位深度,因此在降噪方面展现出巨大潜力。然而,基于学习的方法需要大量成对的干净-噪声图像进行训练,这在实践中往往难以实现。

传统噪声合成方法通常需要传感器特定的建模,包括信号依赖和信号无关的噪声合成两个步骤。这些步骤往往需要大量人工干预和复杂流程,如系统增益校准和噪声分析,耗时可达数天。

现有的噪声合成方法主要分为两类:基于统计模型的方法和基于神经网络的方法。前者如ELD方法识别了RAW传感器数据中的四种关键噪声元素;后者如NoiseFlow使用流模型进行噪声建模。但这些方法都存在实现复杂或部署困难的问题。

方法概述

本论文提出了一种简单实用的噪声合成流程,通过详细分析噪声特性和广泛验证现有技术,大大减少了准备时间。该方法的核心在于:

假设量子效率:通过假设量子效率值来合成光子散粒噪声,避免了繁琐的系统增益校准过程

直接采样信号无关噪声:直接从传感器采集暗帧作为信号无关噪声的样本,省去了复杂的噪声分析步骤

暗影校正:通过暗影校正消除时间一致性噪声的影响,提高训练效果

术语解读

RAW图像:直接从相机传感器输出的未经处理的图像数据,保留了更多的原始信息

系统增益K:由量子效率(QE)和模拟增益(AG)组成,K=QE×AG,是噪声建模中的关键参数

暗帧:在完全黑暗条件下拍摄的图像,仅包含传感器自身产生的噪声

光子散粒噪声:由光的量子特性引起,服从泊松分布,是信号依赖噪声的主要成分

核心设计

本方法的整体流程如图2所示:

图2:降噪流程概览。在准备阶段,本文为每个模拟增益收集多个暗帧并计算相应的暗影。为了合成一对训练图像,本文假设一个系统增益K来生成泊松散粒噪声图,并将其与采样得到的暗影校正暗帧一起添加到干净图像中。在推理阶段,给定一个噪声图像,本文从中减去暗影后输入网络。

该方法的核心创新点在于:

基于假设的散粒噪声合成:通过假设量子效率值来估计系统增益K,避免了复杂的校准过程

直接采样信号无关噪声:使用直接从传感器采集的暗帧作为信号无关噪声的样本

暗影校正:通过暗影校正消除时间一致性噪声的影响

论文主体思路

本论文的主要研究思路可以总结如下:

应用场景:低光环境下RAW图像去噪

问题建模:通过噪声合成实现自监督学习,解决成对数据不足的问题

模型Backbone:采用U-Net作为去噪网络,与现有工作保持一致

损失函数:使用L1损失函数

训练数据集:使用合成的噪声-干净图像对

测试数据集:SID、ELD和LRID数据集

训练方法:使用Adam优化器训练1000个epoch,其中400个epoch用于微调

方法优势:准备时间从数天缩短至1小时,性能提升0.54dB

方法缺点:需要已知模拟增益(AG),对普通消费者相机用户可能不友好

主要创新点

基于假设的散粒噪声合成:通过假设量子效率值来估计系统增益K,避免了复杂的校准过程

直接采样信号无关噪声:使用直接从传感器采集的暗帧作为信号无关噪声的样本

暗影校正:通过暗影校正消除时间一致性噪声的影响

简化流程:将准备时间从数天缩短至1小时,同时保持甚至提升去噪性能

核心原理推导

本方法基于以下图像形成模型:

其中Kd是用于亮度调整的数字增益,Ka是应用于模拟信号的系统增益,X是与场景辐照度成正比的实际光子数,Np是信号依赖噪声,N1和N2是两种信号无关噪声。

信号依赖噪声主要来自光子散粒噪声,服从泊松分布:

系统增益K由量子效率(QE)和模拟增益(AG)组成: 

基于量子效率的物理约束(通常在30%-70%之间),可以安全地假设K值而不需要精确校准。

数据准备及实验设计

实验使用了三个流行的低光RAW图像去噪数据集:

SID:使用Sony-A7S2全画幅单反相机拍摄

ELD:使用另一台Sony-A7S2相机拍摄

LRID:使用Redmi K30智能手机的IMX686传感器拍摄

实验对比了多种方法,包括:

监督方法:使用真实噪声-干净图像对训练

自监督方法:基于干净图像合成噪声

混合方法:使用合成数据进行预训练,真实图像对进行微调

实验结果

在SID和ELD数据集上,本文方法以46.43dB的平均PSNR刷新了自监督降噪记录,甚至超过部分监督学习方法。来看关键数据对比:

图3:不同噪声合成方法的定性对比。所有图像都经过简单的图像信号处理流程转换为sRGB格式以便更好可视化。ELD和SFRN在图像边界处表现出明显的颜色偏差,而本文方法则没有。

在智能手机传感器测试集LRID上,本文方法展现出45.08dB的惊人表现,比现有最佳方法提升0.54dB。更令人惊喜的是,使用仅10个暗帧进行在线校准时的性能损失不超过0.1dB!

图4:不同模型拟合信号无关噪声的分位数-分位数图

图4:不同模型拟合信号无关噪声的分位数-分位数图。左:重采样数据与用于模型拟合数据的对比(即建模精度)。右:重采样数据与未见暗帧数据的对比(即泛化精度)

http://www.xdnf.cn/news/9015.html

相关文章:

  • ArcGIS 与 HEC-RAS 协同:流域水文分析与洪水模拟全流程
  • 数字展厅建设需融合创意设计与实用功能,打造多维用户体验!
  • 动态规划(7):背包问题
  • 解决 docker pull镜像失败
  • DEC Global:技术赋能如何重塑投资者决策模式?
  • Three.js搭建小米SU7三维汽车实战(5)su7登场
  • 深度解析新能源汽车结构与工作原理
  • 多端一体开发:iVX 如何让「一次开发,全平台部署」从理想照进现实
  • Android中一次完整的ipc通信过程
  • Vue 3.0中复杂状态如何管理
  • ARINC818_FILE
  • jquery基础知识
  • 批量转存夸克网盘内容并分享实操教程
  • charAt()
  • ArkUI:鸿蒙应用响应式与组件化开发指南(一)
  • RuoYi前后端分离框架集成UEditorPlus富文本编辑器
  • C++ list基础概念、list初始化、list赋值操作、list大小操作、list数据插入
  • Debian系统安装Python详细教程及常见问题解答
  • 菜鸟之路Day34一一Mybatis-基础操作
  • 基于深度学习的情绪识别检测系统【完整版】
  • 什么是时空学习(Spatiotemporal Learning)
  • 大语言模型 20 - MCP 在客户端中使用 Cursor Cline 中配置 MCP 服务
  • 如何安全配置数据库(MySQL/PostgreSQL/MongoDB)
  • QT5.15 MacOS 打包指南
  • ai作诗平台:AnKo引领未来诗歌创作新时代!
  • CC工具箱使用指南:【计算线要素的插值点数据】
  • 华为OD机试真题——新学校选址(2025A卷:100分)Java/python/JavaScript/C/C++/GO最佳实现
  • 《软件工程》第 5 章 - 需求分析模型的表示
  • Android开机向导定制(1)开机向导加载流程
  • 小土堆pytorch--损失函数与反向传播