当前位置: 首页 > backend >正文

推荐 github 项目:GeminiImageApp(图片生成方向,可以做一定的素材)

推荐 github 项目:GeminiImageApp(图片生成方向,可以做一定的素材)

这个项目能干嘛?

使用 gemini 2.0 的 api 和 google 其他的 api 来做衍生处理

简化和优化了文生图和图生图的行为(我的最主要)

并且有一些目标检测和切割(我用不到)

视频和 imagefx 因为没 api,没试,原则上可以,

imagefx 在 imagefx 的官网免费,veo 免费一天 10 来次,可以使用其他国内视频 ai 替代

重点!

这个项目搭建需要梯子

本文详细视频讲解地址:

https://www.bilibili.com/video/BV1DyT9zqEvZ/?vd_source=67d6208fe3d9dfab2f35bd5205001cf0

体验地址:

备注:imagen3 和视频生成缺乏 api,无法使用

随时关闭的依旧搭建地址:(个人免费 api ,gemini 2.0 flash 一天只有 1500 次,每分钟 10 次,基本上同时多人使用要打挤,或者一天次数用超,家庭宽带 +cloudflare 的减速加持,连接缓慢)

https://geminiimageapp.fantacy.online/

这个只是体验一下功能做,你自行搭建是最佳选择

项目地址:

这个项目的 github 地址为 https://github.com/0xsline/GeminiImageApp

环境的安装:

python 环境(建议 3.10 以上) ,官网下载 https://www.python.org/downloads/

Node js 环境(直接装最新的稳定版本) 官网下载 https://nodejs.org/zh-cn

Git ,最好存在,方便后续更新

Google AI API Key (必需),gemini 2.0 的 api 每天免费 1500 次生成,需要 google 账号,

imagefx 和 veo 生成视频的 api 我没搞,首次免费 300 美元赠金,限期三个月,好像需要银行卡

如何部署?

github 的 readme 有点小错误,这里应该是

git clone https://github.com/0xsline/GeminiImageApp.git
cd GeminiImageApp

配置 api

复制环境变量模板

cp .env.example .env

修改,注意修改的是 GeminiImageApp 目录下的.env 文件,这个文件是需要你自己复制.env.example 出来的

GOOGLE_API_KEY=your_google_ai_api_key_here

GEMINI_API_KEY=your_google_ai_api_key_here

后端配置:

cd backend
pip install -r requirements.txt

如果 pip 安装不成功,依赖冲突?可以这样干

请添加图片描述

因为他指定了特定版本,但是你的 python 又安不上其中一些,那么就可以取消掉所有的版本,手动修改这个文件

然后重新安装即可

后端启动:

终端输入

Python ./run.py

在这里插入图片描述

前端配置和启动

#进入前端目录
cd frontend
#安装依赖
npm install
#启动开发服务器
npm run dev

在这里插入图片描述

启动成功,打开你的浏览器,输入

http://localhost:3000/

在这里插入图片描述

然后测试一下生成图片和图生图,ok,完工

如果前端页面打不开,把这里修改一下,然后重启

在这里插入图片描述

先加这个,然后继续

http://www.xdnf.cn/news/13071.html

相关文章:

  • 第三章:局域网
  • FDA方向图的matlab仿真实现
  • 河北对口计算机高考MySQL笔记(完结版)(2026高考)持续更新~~~~
  • 【Elasticsearch基础】Elasticsearch批量操作(Bulk API)深度解析与实践指南
  • RocketMQ 客户端负载均衡机制详解及最佳实践
  • FFmpeg介绍
  • AI-Python机器学习与深度学习实践技术应用
  • 苹果端Cursor免费额度与模型受限终极解决方案
  • 【Elasticsearch】一个图书馆的案例解释 Elasticsearch
  • Pandas 可视化集成:数据科学家的高效绘图指南
  • 协议转换利器,profinet转ethercat网关的两大派系,各有千秋
  • C#中清空DataGridView的方法
  • RKNN开发环境搭建2-RKNN Model Zoo 环境搭建
  • DAY 26 函数专题1:函数定义与参数
  • 【HarmonyOS 5】鸿蒙中Stage模型与FA模型详解
  • ASR(语音识别)语音/字幕标注 通过via(via_subtitle_annotator)
  • pytorch卷积层权重之 二维互相关运算(corr2d) (亲测,已解决)
  • 华为云CAE部署spring cloud服务
  • MCU ADC硬件设计注意事项
  • Elasticsearch的索引
  • EC2安装WebRTC sdk-c环境、构建、编译
  • 在鸿蒙HarmonyOS 5中使用DevEco Studio实现企业微信功能
  • 二维数组 行列混淆区分 js
  • 中山大学GaussianFusion:首个将高斯表示引入端到端自动驾驶多传感器融合的新框架
  • NLP学习路线图(三十六): 机器翻译
  • DriveGPT4: Interpretable End-to-end Autonomous Driving via Large Language Model
  • 对象回调初步研究
  • Go 语言底层(四) : 深入 Context 上下文
  • 基于UniApp开发HarmonyOS 5.0鸿蒙汽车应用的指南
  • 医疗风险预测AI模型:机器学习与深度学习方法的深度分析与实践