当前位置: 首页 > web >正文

【2025CVPR-目标检测方向】FIRE:通过频率引导重建误差对扩散生成的图像进行鲁棒检测

1. ​引言和背景

扩散模型的快速发展显著提高了图像生成质量,使生成内容难以与真实图像区分,引发了误用风险(如虚假信息)。现有检测方法主要基于重建误差:扩散模型生成的图像在重建过程中(通过预训练模型)误差较小,而真实图像误差较大。但这些方法(如DIRE)面临泛化性问题,无法有效处理未见过的数据集或模型。核心洞察来自频率分析:扩散模型在重建真实图像时,难以准确捕捉中频信息(包含纹理和边缘细节),而生成图像则缺乏这种固有信息。这导致了关键问题:​如何定位和利用这些难重建的频率成分来提升检测?​

通过实验观察(如Figure 2),作者发现真实图像的中频成分(band-pass filtered)与重建误差图高度相似,而生成图像的重建误差更低。这表明中频信息可作为区分真实和生成图像的关键线索。

2. ​方法概述:FIRE框架

FIRE的核心思想是:​通过移除真实图像中的难重建中频成分,生成“伪生成图像”,并比较移除前后的重建误差变化。真实图像的误差变化更大,而生成图像的误差变化较小,从而提供鲁棒检测信号。FIRE包括两个主要组件:

  • 频率掩码细化模块(FMRE)​​:识别并隔离中频区域(扩散模型难以重建的部分)。
  • 后端分类器
http://www.xdnf.cn/news/17277.html

相关文章:

  • 内核链表、栈区、队列
  • 微型导轨:智能家居抽屉的智能化应用
  • Kafka-exporter采集参数调整方案
  • C语言:指针(1-2)
  • 令牌桶限流算法
  • 蚊子咬人问题何时休:深度学习引领智能灭蚊新时代
  • 【C/C++】形参、实参相关内容整理
  • SpringBoot 整合Langchain4j 对接主流大模型实战详解
  • AI Infra与LLM的联系与差异
  • 《Transformer黑魔法Mask与Softmax、Attention的关系:一个-∞符号如何让AI学会“选择性失明“》
  • 【React 插件】@uiw/react-md-editor 使用教程:从基础使用到自定义扩展
  • 【自动驾驶】《Sparse4Dv3 Advancing End-to-End 3D Detection and Tracking》论文阅读笔记
  • [科普] 从单核到千核:Linux SMP 的“演化史”与工程细节
  • MySQL数据库索引及底层数据结构
  • 16-DS18B20-±0.5℃精度-12bitADC--55°C ~ +125°C
  • 如何测试一个机器是大端还是小端
  • 如何解决网页视频课程进度条禁止拖动?
  • 查看ubuntu server 的基本信息
  • ubuntu 22.04 中安装python3.11 和 3.11 的 pip
  • 自然语言处理的相关概念与问题
  • 如何给小语种视频生成字幕?我的实测方法分享
  • 从《中国开源年度报告》看中国开源力量的十年变迁中,Apache SeaTunnel 的跃迁
  • Numpy科学计算与数据分析:Numpy入门之多平台安装与基础环境配置
  • 学习 Android(十四)NDK基础
  • RocketMQ和Kafka一样有重平衡的问题吗?
  • 人工智能-python-机器学习实战:特征降维、PCA与KNN的核心价值解析
  • LlaMA_Factory实战微调VL大模型
  • o2o 商城系统数据分析管理系统模块设计
  • SpringMVC基础
  • Linux部署tp5.1,nginx服务器不管访问那个方法,一直访问index/index问题解决方法