当前位置: 首页 > news >正文

字节开源BAGEL可文生图、图像理解、图像编辑

BAGEL是由字节跳动开源的通用多模态大模型,一个原生支持多模态输入输出 + 思维链推理 + MoE 架构优化的跨模态超级 AI。

话不多说,咱们今天来试着复现下。

1、下载代码,创建环境

git clone https://github.com/bytedance-seed/BAGEL.gitcd BAGELconda create -n bagel python=3.10conda activate bagel

2、安装环境

pip install -r requirements.txt

这时候报错了,如图

说没没有安装torch,好,那我先去官方安装torch。推荐安装2.5.1版本,因为环境文件中写着2.5.1版本。

安装好torch后再去安装requirements.txt中的各个包,这次顺利安装。

3、下载模型文件

from huggingface_hub import snapshot_downloadsave_dir = "/path/to/save/BAGEL-7B-MoT"repo_id = "ByteDance-Seed/BAGEL-7B-MoT"cache_dir = save_dir + "/cache"snapshot_download(cache_dir=cache_dir,  local_dir=save_dir,  repo_id=repo_id,  local_dir_use_symlinks=False,  resume_download=True,  allow_patterns=["*.json", "*.safetensors", "*.bin", "*.py", "*.md", "*.txt"],)

需要修改下第三行的安装路径。

如果无法访问huggingface的话可使用hf镜像

export HF_ENDPOINT=https://hf-mirror.com

下载速度还是很快的,但是就是模型文件太大了。

4、运行

下载完成后就可以试着跑下了

python app.py

报错了,看着是flash-attn

摸索了半天,直接降低版本就可以了。

pip install flash-attn==2.7.5

接着再跑下试试。又报错了,但是这次是显存不够,我的24G显存竟然带不起来,尴尬了

。但是应该环境是搭建的没问题的。

大家有大显存的话可以搭建下跑下试一下。

写了这么半天不是白写了,这不相当于没实现吗?

没关系,咱们来看看其他方法。试试comfyui版的能不能跑起来。

comfyui的安装参考 Ubuntu源码版comfyui的安装,也可直接安装win桌面版的。

5、安装节点

当然也可以手动安装。

git clone https://github.com/neverbiasu/ComfyUI-BAGEL

安装好后将上面下载好的模型文件复制到comfyui的models/bagel下面。

这个里面带了三个工作流,咱们可以下载下来导入试试。

重启comfyui。

导入工作流试下。咱们就用最近比较火的吉普力风格试下。

提示词 "change the style into Ghibli"

哈哈,灭霸一下子没霸气了

http://www.xdnf.cn/news/714079.html

相关文章:

  • 秒杀/高并发解决方案+落地实现
  • 【Pandas】pandas DataFrame duplicated
  • docker运行centos提示Operation not permitted
  • 快速了解 GO之接口解耦
  • 涨薪技术|0到1学会性能测试第89课-性能测试设计
  • R语言基础| 数据基本管理与操作
  • #Js篇:两个前端应用通过postMessage传递file对像
  • 02.K8S核心概念
  • JVM Full GC 频繁问题排查、优化及解决方案
  • ansible template 文件中如果包含{{}} 等非ansible 变量处理
  • git reset --hard HEAD~1与git reset --hard origin/xxx
  • CentOS_7.9 2U物理服务器上部署系统简易操作步骤
  • 人工智能100问☞第36问:什么是BERT?
  • 第5讲、Odoo 18 CLI 模块源码全解读
  • 跨架构镜像打包问题及解决方案
  • 棋盘问题(放置棋子)
  • ranges属性验证
  • 逻辑回归详解:从原理到实践
  • notion搭建个人知识管理库
  • 利用Python制作环保志愿者招募海报
  • 设计师如何搭建自己的素材库?
  • useRef、useForwardRef 和 useImperativeHandle
  • SpringSecurity
  • 深入了解 C# 异步编程库 AsyncEx
  • Minimax-speech-hd
  • Qt DateTimeEdit(时间⽇期的微调框)
  • 【QQ音乐】sign签名| data参数加密 | AES-GCM加密 | webpack实战 (下)
  • ElasticSearch简介及常用操作指南
  • TypeScript中?和!号用法
  • Asp.Net Core 托管服务