当前位置: 首页 > java >正文

本地部署DeepSeek实战

目录

1. 安装Ollama

2.安装DeepSeek

3.客户端调用DeepSeek

4.API调用本地部署大模型


最近想通过Spring-AI来整个大模型的应用,调用其它公司的大模型平台都需要申请API Key、Secret Key,模型调用都需要按调用次数/Token 收费,有个别平台有免费试用期和免费额度。如果想免费调用大模型,最好是自己本地部署运行开源模型,减少资金消耗。

阿里云百炼平台:大模型服务平台百炼控制台

百度千帆平台:百度智能云千帆大模型平台

腾讯混元平台:登录 - 腾讯云

字节扣子:扣子

1. 安装Ollama

Ollama 是一个开源的大型语言模型(LLM)平台,旨在让用户能够轻松地在本地运行、管理和与大型语言模型进行交互。在本地机器上便捷部署和运行大型语言模型(LLM)而设计。

下载:在官网Ollama,直接点击download即可,根据电脑系统选择不同的版本。

安装完成后打开如下:

2.安装DeepSeek

deepseek官网上可以看到有不同版本的模型,可以根据自己电脑的配置安装不同的模板

  • 1.5B:适合硬件配置较低的电脑,4GB内存就够了;M1/M2处理器可安装

  • 7B:推荐版本,大部分电脑都能跑,要求8GB内存+4GB显存;M3的处理器可安装

  • 32B:高性能设备的专属,要求32GB内存+12GB显存。M4或者更高处理器

安装命令:ollama run deepseek-r1:7b

安装成功如下:

3.客户端调用DeepSeek

如果不想用ollama命令操作DeepSeek,可安装可视化大模型交互工具

可视化工具有:ChatBox客户端、Cherry Studio、浏览器插件

Cherry Studio下载地址:

ChatBox下载地址:Chatbox AI官网:办公学习的AI好助手,全平台AI客户端,官方免费下载

浏览器插件安装方式:

  • 打开浏览器的扩展中心,启用【开发人员模式】;

  • 把文末提供的插件压缩包拖入扩展中心进行安装;

  • 安装完成后,你会看到一个名为“Page Assist-本地AI模型的Web UI”的插件。

下载Cherry Studio之后,打开,设置

添加模型,我自己的是deepseek-r1:7b

首页中调用大模型

4.API调用本地部署大模型

有开发需求的朋友,可以开启API模式,通过API集成的方式。

基于Ollama框架运行了deepSeek R1模型,ollama相当于一个代理,我们直接调用ollama的API即可实现大模型接口的调用。

Ollama包装了完善的接口与大模型进行交互,接下来会通过Spring-AI来实践Agent应用。

参考:https://zhuanlan.zhihu.com/p/21682261418

http://www.xdnf.cn/news/18466.html

相关文章:

  • CS 创世 SD NAND 助力 T-BOX:破解智能汽车数字中枢的存储密码
  • 【UniApp打包鸿蒙APP全流程】如何配置并添加UniApp API所需的鸿蒙系统权限
  • 使用隧道(Tunnel)连接PostgreSQL数据库(解决防火墙问题)
  • 【Ansible】变量与敏感数据管理:Vault加密与Facts采集详解
  • 使用PPT进行科研绘图过程中常用的快捷键
  • Matplotlib 可视化大师系列(八):综合篇 - 在一张图中组合多种图表类型
  • Android 广告轮播全实现:图片与视频混合展示的完整方案
  • 基于ERNIE 4.5的多智能体协作的自动化视频舆情分析报告生成器
  • 图像处理中的伪影
  • git新建项目如何推送到远程仓库
  • C#_面向对象设计的艺术
  • Python 网络编程实战指南:从 TCP_UDP 到 Socket 编程
  • 基于LangChain + Milvus 实现RAG
  • Linux学习-网络编程2
  • Zynq开发实践(fpga高频使用的两个场景)
  • Elasticsearch Rails 实战全指南(elasticsearch-rails / elasticsearch-model)
  • VLLM部署gpt-oss-20b踩坑记录
  • chrome driver在Mac上运行时提示安全问题怎么解决
  • STM32 - Embedded IDE - GCC - 重定向printf到串口
  • jmeter
  • [docker/大数据]Spark快速入门
  • DS 0 | 数据结构学习:前言
  • MySQL的事务
  • 24.解构赋值
  • 3 种无误的方式删除 Itel 手机上的短信
  • K8S - NetworkPolicy的使用
  • 【小白笔记】 MNN 移动端大模型部署
  • 【普通地质学】构造运动与地质构造
  • unbuntu 20.04 docker 部署wordpress
  • 一体化伺服电机在特种机器人(炉管爬行器)中的应用案例