当前位置: 首页 > ai >正文

多卡跑ollama run deepseek-r1

# 设置环境变量并启动模型
export CUDA_VISIBLE_DEVICES=0,1,2,3
export OLLAMA_SCHED_SPREAD=1  # 启用多卡负载均衡
ollama run deepseek-r1:32b

若 deepseek-r1:32b 的显存需求未超过单卡容量(如单卡 24GB),Ollama 不会自动启用多卡

在run一个8b的就可以看出来多卡了 

http://www.xdnf.cn/news/7242.html

相关文章:

  • DRIVEGPT4: 通过大语言模型实现可解释的端到端自动驾驶
  • 数据治理进阶:精读数据治理培训方案【附全文阅读】
  • 我用 CodeBuddy 打造了一个灵感收集应用 —— SparkNotes 开发实录
  • 一周快讯 | 银发文娱旅游一周新鲜事
  • 【日常笔记】wps如何将值转换成东西南北等风向汉字
  • python fastapi + react, 写一个图片 app
  • Cryosparc里头restack的妙用
  • Linux项目部署全攻略:从环境搭建到前后端部署实战
  • 计算机网络-HTTP与HTTPS
  • Java资源管理与防止泄漏:从SeaTunnel源码看资源释放
  • lowcoder数据库操作1:链接目标数据库
  • 深度学习在移动开发中的应用:实时图像分割实战
  • 从代码学习深度学习 - 用于预训练词嵌入的数据集 PyTorch版
  • WEB安全--SQL注入--MSSQL注入
  • OpenCV 环境搭建与概述
  • Golang的网络安全策略实践
  • TeaType 奶茶性格占卜机开发记录:一场俏皮的 UniApp 单页奇遇
  • 小红书的视频怎么保存没有水印(方法分享)
  • 云鼎入鼎系统:一站式电商管理解决方案
  • bisheng系列(一)- 本地部署(Docker)
  • Kotlin Compose Button 实现长按监听并实现动画效果
  • React Flow 中 Minimap 与 Controls 组件使用指南:交互式小地图与视口控制定制(含代码示例)
  • 精益数据分析(68/126):数据透视表实战与解决方案验证——从问卷分析到产品落地的关键跨越
  • liunx定时任务,centos定时任务
  • eMMC深度解析:嵌入式多媒体卡的硬件电路设计要点
  • 【氮化镓】偏置对GaN HEMT 单粒子效应的影响
  • [Java实战]Spring Boot整合Kafka:高吞吐量消息系统实战(二十七)
  • GStreamer (三)常⽤插件
  • 《AI革命重塑未来五年:医疗诊断精准度翻倍、自动驾驶事故锐减90%,全球科技版图加速变革》
  • 深入理解仿函数(Functors):从概念到实践