当前位置: 首页 > backend >正文

更快的图像局部修改与可控生成:Flex.2-preview

Flex.2-preview 文本生成图像扩散模型介绍

一、模型简介

Flex.2-preview 是一种 开源的 80 亿参数文本生成图像扩散模型,具备通用控制和修复支持功能,是 Flex.1alpha 的下一代版本。该模型由社区开发并为社区服务,采用 Apache 2.0 许可证,允许商业使用。它具有 512 长度的输入、16 通道潜在空间,且可微调。

二、功能特性

  1. 内置修复功能 :在基础模型中集成了修复支持,能够对图像进行局部修复或修改。

  2. 通用控制输入 :支持多种输入形式,如线条、姿势和深度信息,实现对生成图像的多样化控制。

  3. 高效性 :具有指导嵌入器,使得图像生成速度比 Flex.1 提高了一倍。

三、使用方法

ComfyUI 环境

  1. 安装 Flex2 Conditioner 节点和 comfyui_controlnet_aux 工具,用于生成控制图像(姿势和深度)等。

  2. 下载 Flex.2-preview.safetensors 模型文件,并放置在 ComfyUI/models/diffusion_models 文件夹下,重启 ComfyUI。

  3. 使用预设的工作流程示例来开始控制和修复操作。

Diffusers 环境

  1. 安装所需的库,包括 torch、accelerate、transformers 和 diffusers。

  2. 导入必要的模块,如 AutoPipelineForText2Image 和 load_image 等。

  3. 通过加载 Flex.2-preview 模型,并指定相关参数(如输入图像、掩码、控制图像等)来生成图像。

四、技术细节

  1. Flex.2 的开发过程经历了 Flux.1 Schnell、OpenFlux.1、Flex.1-alpha 等阶段,每一次迭代都有所进步,而 Flex.2 是目前最大的进步。

  2. 在控制和修复的训练方面比较激进,模型在一些方面(如解剖结构和文本)上存在困难,修复功能也在持续改进中。

  3. Flex.2 设计为可微调,尽管实践尚处于实验阶段。可以直接在能够进行控制和修复的模型上训练传统的 LoRAs,Flex.1-alpha 的 LoRAs 也通常能很好地与之配合。

五、局限性与改进

  1. 局限性

    • 模型在处理解剖结构和文本方面存在一定的困难。

    • 修复功能仍在完善中,尚未达到理想效果。

  2. 改进措施

    • 开发者正通过每次新的训练运行来改进这些限制。

    • 支持通过训练简单的 LoRA 来让模型使用自定义控制。

六、未来展望

开发者鼓励用户反馈模型的使用体验,提出改进建议和新功能需求。同时,他们也在探索最佳实践,以推动 Flex.2-preview 模型的进一步发展和优化。

Flex.2-preview 核心技术汇总表

在这里插入图片描述

http://www.xdnf.cn/news/2607.html

相关文章:

  • 航顺 芯片 开发记录 (一) 2025年4月27日19:23:32
  • 【博客系统】博客系统第二弹:实现博客列表接口
  • T检验、F检验及样本容量计算学习总结
  • 通过示例学习:连续 XOR
  • SpringBoot驾校报名小程序实现
  • 详细PostMan的安装和基本使用方法
  • 【SF】在 Android 显示系统中,图层合成方式 Device 和 Client 的区别
  • 文章记单词 | 第50篇(六级)
  • Zookeeper HA集群搭建
  • 昂瑞微蓝牙OM6621系列对比选型指南
  • 《代码整洁之道》第8章 边界 - 笔记
  • NCCL 通信与调试
  • Grok发布了Grok Studio 和 Workspaces两个强大的功能。该如何使用?如何使用Grok3 API?
  • 深度学习与SLAM特征提取融合:技术突破与应用前景
  • 深入解读:2025 数字化转型管理 参考架构
  • 视频HLS分片与关键帧优化深度解析
  • 2025 网络安全技术深水区探索:从 “攻防对抗” 到 “数字韧性” 的范式跃迁
  • VRRP与BFD在冗余设计中的核心区别:从“备用网关”到“毫秒级故障检测”
  • JavaScript中主动抛出错误的方法
  • 【java】lambda表达式总结
  • 类-python
  • AI中Token的理解与使用总结
  • seededit: Align image re-generation to image editing
  • 【中级软件设计师】编译和解释程序的翻译阶段、符号表 (附软考真题)
  • RC吸收电路参数设置实战
  • DJL FastText (FtModel) 使用指南
  • 如何编写企业的数据标准管理办法
  • 人大金仓sys_rman备份脚本
  • 【SAP-CO】标准价(S价)和移动平均价(V价)
  • 合理布局结构体,精打细算 cacheline