当前位置: 首页 > backend >正文

谷歌 Gemma 大模型安装步骤

1.下载OllamaSetup安装包

下载地址:https://ollama.com/download

这里已Windows系统为例:

在这里插入图片描述

2.安装OllamaSetup客户端

在这里插入图片描述

3.部署大模型

在系统搜索栏里面,搜索cmd并打开
在这里插入图片描述

根据电脑实际配置情况选择对应的模型进行安装

【1】. 普通7B版 安装指令:(适合8G显存)
执行命令:ollama run gemma:7b

如果你是第一次部署,它会自动下载!
【2】. 7B的全量版本:(需要16G左右的显存)

执行命令:ollama run gemma:7b-instruct-fp16
【3】. 2B轻量版:(适合CPU会低配电脑安装)
执行命令:ollama run gemma:2b

这里下载模型需要时间(请耐心等待)

等看到有以下提示后代表模型已经安装成功。
在这里插入图片描述
如果你需要下载谷歌 Gemma 开源大模型的文件,那么可以前往官网下载!
官网地址:http://ai.google.dev/gemma

4.加载 Gemma 模型 2B

from transformers import AutoTokenizer, AutoModelForCausalLM
import torchmodel_id = "google/gemma-2b-it"  # 或 "google/gemma-7b-it"tokenizer = AutoTokenizer.from_pretrained(model_id)
model = AutoModelForCausalLM.from_pretrained(model_id, device_map="auto")# 推理
prompt = "你好,请介绍一下你自己。"
inputs = tokenizer(prompt, return_tensors="pt").to(model.device)
outputs = model.generate(**inputs, max_new_tokens=100)
print(tokenizer.decode(outputs[0], skip_special_tokens=True))

5.测试和常见问题

无法加载模型?
请确保使用的是最新的 transformers

模型第一次加载需要联网从 Hugging Face 下载

可手动提前下载模型:

huggingface-cli download google/gemma-2b-it

想要部署网页聊天界面?

推荐结合 Gradio:

pip install gradio

实例代码

import gradio as grdef chat(prompt):inputs = tokenizer(prompt, return_tensors="pt").to(model.device)outputs = model.generate(**inputs, max_new_tokens=100)return tokenizer.decode(outputs[0], skip_special_tokens=True)gr.Interface(fn=chat, inputs="text", outputs="text").launch()
http://www.xdnf.cn/news/4757.html

相关文章:

  • oracle goldengate非并行进程转换为并行进程
  • Python3正则表达式:字符串魔法师的指南[特殊字符]‍♂️
  • 【C语言】--指针超详解(二)
  • 非对称加密:为什么RSA让“公开传密”成为可能
  • 计算机科技笔记: 容错计算机设计01 概述 教材书籍 课程安排 发展历史
  • Python连接云端服务器:基于Paramiko库的实践与问题剖析
  • LeetCode 3341.到达最后一个房间的最少时间 I:Dijkstra算法(类似深搜)-简短清晰的话描述
  • 9. 从《蜀道难》学CSS基础:三种选择器的实战解析
  • 密码学--RSA
  • 【AI提示词】费曼学习法导师
  • 缓存套餐-01.Spring Cache介绍和常用注解
  • LeetCode 3341到达最后一个房间的最少时间 I 题解
  • 基于大模型的计划性剖宫产全流程预测与方案优化研究报告
  • 跨浏览器自动化测试的智能生成方法
  • rom定制系列------红米note12 5G版miui14修改型号root版 原生安卓14批量线刷固件 原生安卓15等
  • STM32 ADC
  • 可撤销并查集,原理分析,题目练习
  • 数据结构(三)——栈和队列
  • 《P2880 [USACO07JAN] 平衡系列 G》
  • 【基础复习笔记】计算机视觉
  • 笔记本电脑实现网线内网 + Wi-Fi外网同时使用的配置方案
  • 运维打铁:服务器分类及PHP入门
  • 移植easylogger通过J-Linker的RTT输出日志/Ozone的RTT设置
  • 华为设备MSTP
  • 【IP101】图像压缩技术详解:从JPEG到小波压缩的完整指南
  • 机器人领域和心理学领域 恐怖谷 是什么
  • 如何为APP应用程序选择合适的服务器
  • C++ - 输入输出
  • Matlab 车辆四自由度垂向模型平稳性
  • Jupyter Notebook / Lab 疑难杂症记:从命令找不到到环境冲突与网络阻塞的排查实录