当前位置: 首页 > news >正文

dstack 是 Kubernetes 和 Slurm 的开源替代方案,旨在简化 ML 团队跨顶级云、本地集群和加速器的 GPU 分配和 AI 工作负载编排

一、软件介绍

文末提供程序和源码下载

      dstack 是 Kubernetes 和 Slurm 的开源替代方案,旨在简化顶级云和本地集群中 ML 团队的 GPU 分配和 AI 工作负载编排。

二、Accelerators 加速器

dstack 支持 NVIDIA 开箱即用的 、 AMD 、 Google TPU 和 Intel Gaudi 加速器。

三、Installation 安装

在通过 CLI 或 API 使用 dstack 之前,请设置一个 dstack 服务器。如果您已经有一个正在运行的 dstack 服务器,则只需设置 CLI。

Set up the server 设置服务器

(可选)配置后端

要与云提供商一起使用 dstack ,请通过该文件 ~/.dstack/server/config.yml 配置后端。

Start the server 启动服务器
You can install the server on Linux, macOS, and Windows (via WSL 2). It requires Git and OpenSSH.
您可以在 Linux、macOS 和 Windows 上安装服务器(通过 WSL 2)。它需要 Git 和 OpenSSH。

pip 果仁
$ pip install "dstack[all]" -U
uv
$ uv tool install "dstack[all]" -U
Once it's installed, go ahead and start the server.
安装后,继续启动服务器。

$ dstack server
Applying ~/.dstack/server/config.yml...

The admin token is "bbae0f28-d3dd-4820-bf61-8f4bb40815da"
The server is running at http://127.0.0.1:3000/
For more details on server configuration options, see the Server deployment guide.
有关 Server 配置选项的更多详细信息,请参阅 Server 部署指南。

Set up the CLI 设置 CLI
Once the server is up, you can access it via the dstack CLI.
服务器启动后,您可以通过 dstack CLI 访问它。

The CLI can be installed on Linux, macOS, and Windows. It requires Git and OpenSSH.
CLI 可以安装在 Linux、macOS 和 Windows 上。它需要 Git 和 OpenSSH。

pip 果仁
$ pip install dstack -U
uv
$ uv tool install dstack -U
To point the CLI to the dstack server, configure it with the server address, user token, and project name:
要将 CLI 指向服务器, dstack 请使用服务器地址、用户令牌和项目名称对其进行配置:

$ dstack config \
    --url http://127.0.0.1:3000 \
    --project main \
    --token bbae0f28-d3dd-4820-bf61-8f4bb40815da
    
Configuration is updated at ~/.dstack/config.yml

四、How does it work? 它是如何工作的?

1. Define configurations 1. 定义配置
dstack 支持以下配置:

  • 开发环境 — 用于使用桌面 IDE 进行交互式开发
  • 任务 — 用于调度作业(包括分布式作业)或运行 Web 应用程序
  • 服务 — 用于部署模型和 Web 应用程序(具有自动扩展和授权功能)
  • 队列 — 用于管理云和本地集群
  • Volumes — 用于管理持久化卷
  • 网关 — 用于配置入口流量和公共终端节点

配置可以定义为存储库中的 YAML 文件。

2. Apply configurations 2. 应用配置
通过 dstack apply CLI 命令或编程 API 应用配置。

dstack 跨云和本地集群自动管理预置、作业队列、自动扩展、联网、卷、运行故障、容量不足错误、端口转发等。

五、软件下载

夸克网盘分享

本文信息来源于GitHub作者地址:https://github.com/dstackai/dstack

http://www.xdnf.cn/news/266599.html

相关文章:

  • 大数据引领行业革命:深度解析与未来趋势
  • 接口测试——HTTP状态码
  • bellard.org‌ : QuickJS 如何使用 qjs 执行 js 脚本
  • 施磊老师rpc(三)
  • Docker安装Ollama及使用Ollama部署大模型
  • 二极管反向恢复的定义和原理
  • SQL语句--postgis语句(矢量数据的定义与操作)
  • REINFORCE蒙特卡罗策略梯度算法详解:python从零实现
  • STM32 DMA直接存储器存取
  • 解码响应式 Web 设计:原理、技术与优劣势全解析
  • C++代码随想录刷题知识分享-----142.环形链表II
  • 希洛激活器策略思路
  • n8n工作流自动化平台的实操:Cannot find module ‘iconv-lite‘
  • 生成式 AI 与 AI 的区别
  • DeepSeek实战--LLM微调
  • LeetCode算法题 (设计链表)Day16!!!C/C++
  • 「Mac畅玩AIGC与多模态16」开发篇12 - 多节点串联与输出合并的工作流示例
  • ipvsadm,是一个什么工具?
  • 中国 AIGC 确权革命:“AI 创意・中国” 平台上线,存证成本降至 0.1 元 / 件
  • CAN网桥中继隔离抗干扰集线器重映射一进一出CAN扩展CAN Bridge
  • 在Java项目中实现本地语音识别与热点检测,并集成阿里云智能语音服务
  • Dubbo(92)如何在微服务架构中应用Dubbo?
  • 深入理解C++类型转换:从基础到高级应用
  • 糖尿病筛查常识---秋浦四郎
  • 计网_可靠传输ARQ机制
  • neo4j初尝试
  • Java从入门到精通 - Java语法
  • C++ 简单工厂模式详解
  • QT6 源(72):阅读与注释单选框这个类型的按钮 QRadioButton,及各种属性验证,
  • 【Linux知识】find命令行使用详解