当前位置: 首页 > java >正文

支持图文混排的Gemini Next Chat

在这里插入图片描述

简介

什么是 Gemini Next Chat ?

Gemini Next Chat 是一个可以让你一键部署私人 Gemini 应用的工具,支持 Gemini 1.5Gemini 2.0 多模态模型。它提供了一个简单的界面,支持图像识别和语音对话,并且拥有内置的实用插件,如网络搜索、网页阅读器、Arxiv 搜索、天气等。此外,它还支持多模态实时 API,提供流畅的语音和视频体验。

主要特点

  • 一键部署:用户可以通过简单的步骤在 Vercel 上免费部署应用,通常在一分钟内完成。
  • 跨平台支持:提供一个小型的跨平台客户端(Windows/MacOS/Linux),可在菜单栏中运行,提高工作效率。
  • 多模态模型支持:能够理解图像、视频、音频及某些文本文件,支持多种交互模式。
  • 插件支持:内置 Web 搜索、Web 阅读器、Arxiv 搜索、天气等实用插件,增强功能。
  • 快速加载:极快的首次屏幕加载速度,支持流式响应。
  • 隐私和安全:所有数据保存在用户本地浏览器中,确保隐私。
  • 多语言支持:支持多种语言,包括英语、中文、法语等。
  • 良好的用户界面:响应式设计,支持暗黑模式。

应用场景

  • 个人助理:作为智能助手与用户进行语音或文本对话,提供信息和建议。
  • 知识管理:用户可以使用该应用管理和检索与特定主题相关的信息。
  • 教育工具:用于学习和教学,可以通过多模态交互帮助学生理解复杂概念。
  • 研究辅助:支持科研人员在 Arxiv 等数据库中搜索相关文献,方便获取研究资料。
  • 跨平台应用:适用于需要在不同操作系统上运行的用户,提升工作效率。

Gemini Next Chat 非常适合希望快速搭建 AI 驱动应用的开发者和企业。

准备工作

获取 Gemini API 密钥

在浏览器中打开 https://aistudio.google.com/app/apikey,创建一个 API 密钥

这一步需要网络和区域都满足才行,后面使用就不需要满足网络条件了;

Gemini API 的代理转发

登录 https://dash.cloudflare.com ,进入 Cloudflare 仪表板,选择 AI --> AI Gateway

创建网关 ,名称可以用 gemini

点名称进入网关

点右上角 API

平台下拉,选择 Google-AI-Studio

复制并保存 API 端点,该链接即 Gemini api 的代理转发链接

Cherry Studio 应用

之前有网友反馈 国内免代理使用Gemini API 中的代理方法延时比较大,可以试试👇这种

  • 提供商类型: 选择 Gemini

  • API 秘钥:填入自己的 Gemini API 密钥
  • API 地址:填入上一步生成的 API 端点

客户端

如果不想折腾,可以试试官方的客户端应用

虽然后续使用可以不需要科学上网,但是申请 Gemini API Key 还是需要的,实在怕麻烦,也可以试试国产的大模型。目前硅基流动(SiliconFlow),注册就送 2000Tokens,虽然不是免费,但也够用一阵子的

注册地址

https://cloud.siliconflow.cn/i/NkUiXVhQ

安装

Gemini Next Chat 支持 vercel 上一键部署,但那不是我们要介绍的内容,老苏只是自己使用,没必要挂在公网上,因此还是在群晖上以 Docker 方式安装。

在注册表中搜索 xiangfa ,下拉找到 xiangfa/talk-with-gemini,版本选择 latest

本文写作时, latest 版本对应为 v1.10.2

端口

本地端口不冲突就行,不确定的话可以用命令查一下

# 查看端口占用
netstat -tunlp | grep 端口号
本地端口容器端口
54813000

环境

可变
GEMINI_API_KEY(可选)您的 Gemini API 密钥,用于启用服务器 API
GEMINI_API_BASE_URL(可选)覆盖 Gemini API 请求基本 URL,默认为 https://generativelanguage.googleapis.com
NEXT_PUBLIC_GEMINI_MODEL_LIST(可选)自定义模型列表,默认为所有模型
NEXT_PUBLIC_UPLOAD_LIMIT(可选)文件上传大小限制,默认没有大小限制
ACCESS_PASSWORD(可选)访问密码,提供有限的访问控制
HEAD_SCRIPTS(可选)注入的脚本代码,用于统计或错误跟踪
EXPORT_BASE_PATH(可选)在静态部署模式中设置页面基本路径

老苏没有设置环境变量,因为在软件中设置 GEMINI_API_KEYGEMINI_API_BASE_URL 更方便

命令行安装

如果你熟悉命令行,可能用 docker cli 更快捷

# 运行容器
docker run -d \--restart unless-stopped \--name talk-with-gemini \-p 5481:3000 \xiangfa/talk-with-gemini

也可以用 docker-compose 安装,将下面的内容保存为 docker-compose.yml 文件

version: '3'services:talk-with-gemini:image: xiangfa/talk-with-geminicontainer_name: talk-with-geminirestart: unless-stoppedports:- 5481:3000

然后执行下面的命令

# 新建文件夹 gemini-next-chat 
mkdir -p /volume1/docker/gemini-next-chat# 进入 gemini-next-chat 目录
cd /volume1/docker/gemini-next-chat# 将 docker-compose.yml 放入当前目录# 一键启动
docker-compose up -d

运行

在浏览器中输入 http://群晖IP:5481 就能看到主界面

如果没有自适应为中文,可以进入右上角 Setting --> General Settings --> Language,下拉找到 简体中文

切换到 语言模型

  • Gemini 密钥:填入自己的 Gemini API 密钥
  • API 代理链接:填入上一步生成的 API 端点
  • 其他根据需要进行设置

所有的设置保存在浏览器中,所以换了浏览器需要重新设置,哪怕在同一台主机上;

接下来就可以开始聊天了

支持 gemini-2.0-flash-exp-image-generation 模型,可生成包含图文混排的内容

系统内置一些插件,可完成网络搜索、网页解读等,很像 Cherry Studio 现在通过 MCP 完成的功能

助理市场则收藏了近 500 个助手,很多提示词的写法是值得我们学习和研究的

参考文档

u14app/gemini-next-chat: Deploy your private Gemini application for free with one click, supporting Gemini 1.5, Gemini 2.0 models.
地址:https://github.com/u14app/gemini-next-chat

Gemini Next Chat 升级 v1.10.0,已支持最新的图文模型,可以生成图文混排的内容,对话修图等,欢迎来到新的 AGI 时代 - 开发调优 - LINUX DO
地址:https://linux.do/t/topic/497837?page=7

http://www.xdnf.cn/news/4080.html

相关文章:

  • Linux 系统下VS Code python环境配置!
  • GPU性能加速的隐藏魔法:Dual-Issue Warp Schedule全解析
  • 国内短剧 vs. 海外短剧系统:如何选择?2025年深度对比与SEO优化指南
  • 高并发内存池------threadcache
  • WebService的学习
  • 电子邮件相关协议介绍
  • NetSuite 2025.1 学习笔记
  • Java基础学完,继续深耕(0505)Linux 常用命令
  • TS 类class修饰符
  • 接口测试过程中常见的缺陷详解
  • Go小技巧易错点100例(三十)
  • 算法刷题篇
  • 基于Redis实现优惠券秒杀——第3期(分布式锁-Redisson)
  • UniGetUI 使用指南:轻松管理 Windows 软件(包括CUDA)
  • 【Springboot知识】Springboot计划任务Schedule详解
  • 前端懒加载(Lazy Loading)实战指南
  • 旋转图像(中等)
  • RPC是什么
  • Linux文件复制命令精要指南:cp与scp详解
  • Three.js + React 实战系列 - 客户评价区细解教程 Clients 组件✨(回答式评价 + 评分星级)
  • 51c大模型~合集124
  • TS 类型兼容性
  • 乡村饮用水厂无线网络规划与设计:融合 LoRaWAN、5G、Mesh 的分层异构方案
  • unity TMP字体使用出现乱码方框
  • 最长回文子串(动规 + 中心拓展)
  • 反转字符串2
  • 杰理-JL701-充电开机,芯片不进入休眠
  • Spring Boot 中 @Bean 注解详解:从入门到实践
  • 无人机 | 无人机设计概述
  • Springclound常用五大组件及其使用原理