当前位置：首页 > news >正文

字节开源BAGEL可文生图、图像理解、图像编辑

news 2025/6/9 0:36:34

BAGEL是由字节跳动开源的通用多模态大模型，一个原生支持多模态输入输出 + 思维链推理 + MoE 架构优化的跨模态超级 AI。

话不多说，咱们今天来试着复现下。

1、下载代码，创建环境

git clone https://github.com/bytedance-seed/BAGEL.gitcd BAGELconda create -n bagel python=3.10conda activate bagel

2、安装环境

pip install -r requirements.txt

这时候报错了，如图

说没没有安装torch，好，那我先去官方安装torch。推荐安装2.5.1版本，因为环境文件中写着2.5.1版本。

安装好torch后再去安装requirements.txt中的各个包，这次顺利安装。

3、下载模型文件

from huggingface_hub import snapshot_downloadsave_dir = "/path/to/save/BAGEL-7B-MoT"repo_id = "ByteDance-Seed/BAGEL-7B-MoT"cache_dir = save_dir + "/cache"snapshot_download(cache_dir=cache_dir,  local_dir=save_dir,  repo_id=repo_id,  local_dir_use_symlinks=False,  resume_download=True,  allow_patterns=["*.json", "*.safetensors", "*.bin", "*.py", "*.md", "*.txt"],)

需要修改下第三行的安装路径。

如果无法访问huggingface的话可使用hf镜像

export HF_ENDPOINT=https://hf-mirror.com

下载速度还是很快的，但是就是模型文件太大了。

4、运行

下载完成后就可以试着跑下了

python app.py

报错了，看着是flash-attn

摸索了半天，直接降低版本就可以了。

pip install flash-attn==2.7.5

接着再跑下试试。又报错了，但是这次是显存不够，我的24G显存竟然带不起来，尴尬了

。但是应该环境是搭建的没问题的。

大家有大显存的话可以搭建下跑下试一下。

写了这么半天不是白写了，这不相当于没实现吗？

没关系，咱们来看看其他方法。试试comfyui版的能不能跑起来。

comfyui的安装参考 Ubuntu源码版comfyui的安装，也可直接安装win桌面版的。

5、安装节点

当然也可以手动安装。

git clone https://github.com/neverbiasu/ComfyUI-BAGEL

安装好后将上面下载好的模型文件复制到comfyui的models/bagel下面。

这个里面带了三个工作流，咱们可以下载下来导入试试。

重启comfyui。

导入工作流试下。咱们就用最近比较火的吉普力风格试下。

提示词 "change the style into Ghibli"

哈哈，灭霸一下子没霸气了

查看全文

http://www.xdnf.cn/news/714079.html

秒杀/高并发解决方案+落地实现

【Pandas】pandas DataFrame duplicated

docker运行centos提示Operation not permitted

快速了解 GO之接口解耦

涨薪技术|0到1学会性能测试第89课-性能测试设计

R语言基础| 数据基本管理与操作

#Js篇：两个前端应用通过postMessage传递file对像

02.K8S核心概念

JVM Full GC 频繁问题排查、优化及解决方案

ansible template 文件中如果包含{{}} 等非ansible 变量处理

git reset --hard HEAD~1与git reset --hard origin/xxx

CentOS_7.9 2U物理服务器上部署系统简易操作步骤

人工智能100问☞第36问：什么是BERT？

第5讲、Odoo 18 CLI 模块源码全解读

useRef、useForwardRef 和 useImperativeHandle

SpringSecurity

深入了解 C# 异步编程库 AsyncEx

Minimax-speech-hd

Qt DateTimeEdit（时间⽇期的微调框）

【QQ音乐】sign签名| data参数加密 | AES-GCM加密 | webpack实战（下）

ElasticSearch简介及常用操作指南

TypeScript中？和！号用法

Asp.Net Core 托管服务

相关文章：