当前位置: 首页 > ops >正文

从深度伪造到深度信任:AI安全的三场攻防战

前言

当大模型开始“睁眼”看世界,伪造者也开始“闭眼”造世界。

2025 WAIC释放出的信号很明确:没有AI安全底座,就没有产业智能化的高楼。WAIC 把“安全”摆在与“创新”同等重要的位置,形成了“1 份共识框架+2 份重磅报告+3 大技术展示+N 场高端对话”的立体化安全议程。其中合合信息现场展示了“AI 鉴伪”的三组“黑科技”——人脸视频鉴伪、AIGC图像鉴伪、通用篡改检测——为狂奔的多模态AI系上了“安全带”。

从“深度伪造”到“深度信任”:AI安全的时代拐点

门槛断崖:从“会写代码”到“会说话”

2013年制作一条换脸视频需要专业显卡和编程知识,而2025年只需一部手机:开源工具ROOP v3.0内置15种人脸模型,微信小程序"妙颜AI"将操作简化成一句话指令,单次换脸成本已降至0.0067元。这种技术民主化带来便利的同时,也催生了新的安全隐患。

技术对比:

  • ‌2013年‌:8小时训练,200张素材,专业设备
  • ‌2025年‌:10秒完成,零技术门槛,手机即可操作

黑产工具链的“工业化”升级

当技术门槛降低,黑色产业迅速形成完整生态链:

  • 素材库:
  1. 暗网“Face100”数据集收录 1.2 亿张高清人脸,按年龄、性别、人种分类;
  2. “DocForge”模板商城提供 3000+ 伪造证件 PSD,支持自动替换头像、姓名、编号。
  • 工具箱:
  1. 一键去水印脚本“CleanUp Pro”可对抗 C2PA、TruePic 等 6 种主流水印;
  2. “ReCompress”算法在压缩的同时保留伪造特征,社交平台二次传播后仍“肉眼可信”。
  • 分发链:
  1. Telegram 频道“FakeFactory”日均推送 5000 条伪造视频;
  2. 东南亚“内容农场”以 0.03 美元/条的价格接包,24 小时可铺满 TikTok 热门榜。

这种工业化运作使得伪造内容产量两年增长1000倍,而检测技术仅提升4倍效率,形成危险的"剪刀差"。

AI安全的时代拐点2025

  • 技术拐点:Diffusion Transformer 参数量突破 80 B,生成质量首次越过“恐怖谷”;
  • 算力拐点:H100 显卡租赁价跌破 1.2 美元/卡时,伪造成本击穿心理防线;
  • 监管拐点:中美欧同步落地《AI 生成内容标识法》,强制水印反而刺激了“反检测”黑产;
  • 社会拐点:Z 世代对“眼见为实”的信任度首次跌破 50%(皮尤 2025 调查)。

WAIC现场的三场“攻防战”

在 WAIC 2025 现场的合合信息展台,“攻防战”不再只是抽象的技术口号,而是被拆分成三场可触、可看、可实战的硬核演示。

人脸视频:毫秒级“拆面具”

观众在合合信息人脸鉴伪展台体验“真假对决”:其中一个是真人,还有两个是ROOP实时伪造,表情纹路及其相似,肉眼难辨,但AI人脸鉴伪模型能即刻判断真伪,并标出伪造区域。

左侧图为生成的2个“假”人脸,右侧图为“假”人脸被鉴伪模型鉴别为“99%”假

核心挑战:目前市面上合成人脸的技术手段多样而复杂,传统的检测技术在应对新出现的人脸伪造算法时往往“有心无力”。

针对不同的人脸篡改形式,合合信息团队基于大规模数据训练,形成了多层次AI篡改检测方案。

例如,应对人脸图像交换伪造,合合信息AI人脸鉴伪模型能够锚定人眼不可见的高级视觉差异,为每一个像素打上真伪标签并计算伪造像素占比,为图像真伪概率“打分”。此外,合合信息团队还面临形式更多变的伪造情况,例如由伪造算法直接生成的复杂图像。采用了多种神经网络模型,聚焦于图像特征,实现多维度交叉验证真伪,让判断结果更精准。

AIGC图像鉴伪技术:让AI生成的“假名画”显形

随着大模型的持续优化,AIGC图像中可被观察到的“失真细节”正变得越来越少,现场展出的《星空》《向日葵》等名画被大模型二次生成后肉眼难以鉴别真假,而合合信息推出AIGC图像鉴别技术,用大模型分析“看不见”的图像信息,让生成式假图无所遁形。

核心挑战:生成式 AI 能产出高度逼真图像,严重威胁舆论安全和公共信任,且传统方法缺少可解释性和泛化性。

方案:借助 MLLM 的推理能力,通过多角度 Prompt 设计+融合策略,在复杂数据集上超过传统模型与人类专家

AIGC图像鉴别技术具备鉴别范围广、抗攻击性强等优势,可应对实际场景中复杂、多样的图片信息。在鉴别范围上,合合信息AIGC图像鉴别技术可通过不同角度和不同层级的prompt,分析AI生成图像的视觉特征以及透视关系、光影角度等合理性因素,结合图像频谱信息辅助模型进行判断,实现毫秒级鉴伪,有效识别MidJourney、 Stable Diffusion、StyleGAN和GPT 4O等主流模型AI生成图片,测试样本集鉴定准确率超90%,适用于社交媒体内容治理、商业欺诈鉴定、保险理赔等多个场景。

TextIn篡改检测平台

TextIn通用篡改检测平台采用自研深度神经网络技术,基于百万级数据训练,支持财务凭证篡改检测、商场机打小票篡改检测、以及身份证、护照、行驶证、驾驶证、港澳台证件等数十种常用卡证篡改检测。平台可在毫秒级时间内完成一次鉴定,在适配场景下,误检率低至千分之一。目前已落地证券、银行等场景。

核心痛点:传统伪造检测方法只能输出真假或mask,难以说明“为什么”; 单一监督信号对多种伪造方式难以泛化。

解决方案:

  • 深度神经网络端到端定位篡改区域;
  • 百万级数据集覆盖PS、拼接、打印翻拍等20种攻击;
  • API已接入银行远程开户、保险理赔、电商反欺诈等场景。

总结

AI让伪造更容易,也让检测更强大。真正的安全不是让技术停步,而是让每一次创新都自带“刹车片”。合合信息目前已开放检测系统并牵头制定行业标准,实现金融、政务、电商等多场景快速落地与复用。未来,无痕篡改、跨模态融合与数据稀缺等难题仍待攻克,亟需产学研协同持续突破。

http://www.xdnf.cn/news/17276.html

相关文章:

  • web端-登录页面验证码的实现(springboot+vue前后端分离)超详细
  • 5- Python 网络爬虫 — 如何突破 JS 动态渲染壁垒?工具原理与实战全解析
  • K8s 常见故障案例分析
  • KLA/TENCOR ALTAIR 8900
  • vscode 配置
  • 灵活、高效,Sub-GHz频段中的轻量化组网方案
  • linux-文件系统
  • Android 中 实现自定义 Dialog 提示框
  • 32-Hive SQL DML语法之查询数据
  • 无人机仿真环境搭建
  • 软件包管理、缓存、自定义 YUM 源
  • 基于Vue.js和Golang构建高效在线客服系统:前端实现与后端交互详解
  • Linux网络--1、网络基础
  • 分布式系统性能优化实战:从瓶颈定位到架构升级
  • [GESP2023012 五级] 2023年12月GESP C++五级上机题题解,附带讲解视频!
  • c++初学day1(类比C语言进行举例,具体原理等到学到更深层的东西再进行解析)
  • WiFi 核心概念与实战用例全解
  • 17.14 CogVLM-17B多模态模型爆肝部署:4-bit量化+1120px高清输入,A100实战避坑指南
  • SimpleMindMap:一个强大的Web思维导图
  • CVRF 是什么?微软弃用 MS 编号后,网络安全的下一个标准
  • 【面经】2025年软件测试面试题,精选100 道(附答案)
  • 为什么通过CreateThread创建的线程调用C/C++运行库函数不稳定
  • 交换机100G模块远距离连接踩坑记录
  • Vibe coding现在能用于生产吗?
  • “鱼书”深度学习进阶笔记(1)第二章
  • 弱电+机房+设备+运维资料合集方案(Word+PPT)
  • trae开发c#
  • Vue3 计算属性与监听器
  • 【MATLAB例程】联邦卡尔曼滤波,主滤波与子滤波融合GPS、IMU、里程计多传感器数据。提供源代码下载链接
  • Zabbix网络发现:自动化监控新利器