当前位置: 首页 > ds >正文

【EGSR2025】材质+扩散模型+神经网络相关论文整理随笔

MatSwap: Light-aware material transfers in images
在这里插入图片描述
介绍任务:输入一张拍摄图像、示例材质纹理图像(这里跟BRDF无关,通常我们讲到材质一般指的是SVBRDF,但是这里的材质指的只是纹理)、用户为拍摄图像指定的遮罩区域(上图中的红色),输出一张在遮罩区域替换为示例材质的图像结果。
【埋雷】这里需要留意论文中是否提到跟传统的扩散模型mask加生成有什么区别,例如:图像重绘。
当前任务面临的最大问题是在转移材质的过程中,做到材质、集合、光照的解耦。

从宏观上解决了什么问题?以往工作会用复杂文本提示词、大规模人工标注来进行生成,但是这些方法需要艺术家的专业知识,或3D场景的属性,获取难度比较大。这篇文章的方法只需要通过一个平面材质,就能免去uv映射,来得到可靠的结果。

怎么做的呢?
依赖于一个定制的light和几何感知的扩散模型。具体来说就是对预训练的文生图模型在合成数据集上进行材质迁移的微调。
在这里插入图片描述
上图展示了训练和推理的流程图。训练的时候先用blender生成合成数据,包括法线,irradiance等,然后将输入图像、法线、irradiance和mask分别用编码器或下采样压缩并concatenate为扩散模型的输入latent;此外,将条件图像p采用ip-adapter的形式注入扩散模型的交叉注意力模块中,最终迭代训练。而推理过程中则更简单,此时使用一个预训练的法线、irradiance估计网络Φ来根据input直接猜出法线和irradiance,然后联合其他输入注入到扩散模型中得到最终结果。

这个方法有点类似于Siggraph 2024文章RGB2X中的【X→RGB】部分。

http://www.xdnf.cn/news/15044.html

相关文章:

  • FastAPI依赖注入:构建高可维护API的核心理念与实战
  • HCIA-生成数协议(STP)
  • IRF堆叠技术的主要优势
  • Flutter 每日翻译之 Widget
  • 开关电源抄板学习
  • C++ 中左值和右值
  • 小菜狗的云计算之旅,学习了解rsync+sersync实现数据实时同步(详细操作步骤)
  • PanoSAM:使用 Meta Segment Anything 模型对全景图像中的点云数据进行无监督分割
  • 深入理解 classnames:React 动态类名管理的最佳实践
  • 设计模式之迭代器模式
  • 基于改进多目标优化算法的众包物流配送调度研究
  • 【机器学习笔记Ⅰ】2 线性回归模型
  • 百度文心大模型 4.5 开源深度测评:技术架构、部署实战与生态协同全解析
  • 编程语言艺术:C语言中的属性attribute笔记总结
  • bro code笔记 inheritance
  • 从前端转nest.js开发的学习路线
  • 【Guava】1.0.设计虚拟机的方向
  • java学习——guava并发编程练习
  • Redis ①⑤-集群
  • Vue+Openlayers加载OSM、加载天地图
  • 周任务自动化升级:N8N与多维表格无缝联动全解析
  • 2025年03月 C/C++(四级)真题解析#中国电子学会#全国青少年软件编程等级考试
  • 【架构艺术】IC(个人贡献者)视角下产品研发规划的实战Tips
  • 一次内存“卡顿”全流程实战分析:从制造问题到优化解决
  • java中,stream的filter和list的removeIf筛选速度比较
  • JMM--数据原子操作
  • SpringAI与智能体入门
  • 解决kali Linux在VMware中的全局缩放问题
  • 量化可复用的UI评审标准(试验稿)
  • Python PyJWT详解:从入门到实战