当前位置: 首页 > backend >正文

openshift AI 2.22安装的需求

OpenShift版本(???)

官方文档没有详细描述,建议采用4.17或者4.18 。

worker 节点

在安装 Operator 时,您的集群必须至少有 2 个 worker 节点,至少有 8 个 CPU 和 32 GiB RAM 用于 OpenShift AI。为确保 OpenShift AI 可用,除了最低要求外,还需要额外的集群资源。

Cluster Samples Operator(???)

安装集群后,按照 OpenShift Container Platform 文档配置 Cluster Samples Operator: 为受限集群配置 Samples Operator。

Chapter 2. Configuring the Cluster Samples Operator | Images | OpenShift Container Platform | 4.17 | Red Hat Documentation

备注:

Starting from OpenShift Container Platform 4.16, the Cluster Samples Operator is deprecated .

Open Data Hub 不能安装在集群中

为 OpenShift 配置身份提供程序

使用具有 cluster-admin 角色的用户访问集群;不允许 kubeadmin 用户。要为用户分配 cluster-admin 权限,请按照相关 OpenShift 文档中的步骤操作:

OpenShift Container Platform: 创建集群管理员

Chapter 8. Using RBAC to define and apply permissions | Authentication and authorization | OpenShift Container Platform | 4.17 | Red Hat Documentation

您的集群配置了可动态置备的默认存储类

访问对象存储

OpenShift AI 组件需要或可以使用 S3 兼容对象存储,如 AWS S3、MinIO、Ceph 或 IBM Cloud Storage。对象存储是一种数据存储机制,允许用户作为对象或文件访问其数据。S3 API 是基于 HTTP 访问对象存储服务的可识别标准。

对象存储必须可以被 OpenShift 集群访问。在与集群相同的断开连接的网络中部署对象存储。

以下组件需要对象存储:

单一或多模式服务平台,以部署存储模型。请参阅 在单模式服务平台上部署 模型或使用多型号服务平台部署模型。

数据科学管道、存储工件、日志和中间结果。请参阅配置管道服务器和 关于管道日志。

以下组件可以使用对象存储:

工作台,用于访问大型数据集。请参阅在数据科学项目中添加连接。

分布式工作负载,用于从和推送结果中提取输入数据。请参阅从数据科学管道运行分布式数据科学工作负载。

管道中执行的代码。例如,要将生成的模型存储在对象存储中。请参阅 Jupyterlab 中的管道概述。

安装 KServe 依赖项

要支持 KServe 组件(由 single-model 服务平台用来为大型模型提供服务),还必须为 Red Hat OpenShift Serverless 和 Red Hat OpenShift Service Mesh 安装 Operator 并执行额外的配置。如需更多信息 ,请参阅关于单模式服务平台。

如果要为 single-model 服务平台添加授权供应商,您必须安装 Red Hat - Authorino Operator。如需更多信息,请参阅为 单模式服务平台添加授权供应商。

数据科学项目准备

Data Science pipelines 2.0 包含 Argo 工作流的安装。如果一个现有 Argo 工作流安装没有在集群中的数据科学管道安装,则安装 OpenShift AI 后将禁用数据科学管道。在安装 OpenShift AI 前,请确保集群没有由数据科学管道安装的 Argo 工作流,或删除 Argo 工作流的独立安装。

在断开连接的环境中执行管道前,您必须将镜像上传到私有 registry。如需更多信息,请参阅 镜像以在受限环境中运行管道。

您可以将管道工件存储在 S3 兼容对象存储桶中,以便不使用本地存储。要做到这一点,您必须首先对存储帐户上的 S3 存储桶配置写入访问权限。

如果要在以 FIPS 模式运行的集群中安装 OpenShift AI,则数据科学项目的任何自定义容器镜像都必须基于 UBI 9 或 RHEL 9。这样可确保与 FIPS 批准的管道组件兼容,并防止与不匹配的 OpenSSL 或 GNU C 库(glibc)版本相关的错误。

关于GPU卡,官方文档并没有描述。如果使用英伟达的GPU卡,可以查看NVIDIA GPU Operator可能支持的英伟达卡。一般来说,比较低端的英伟达容易在公有云上获得。比如V100,A10,T4.

就连落后几代的A100 也难以从公有云获得。

http://www.xdnf.cn/news/16390.html

相关文章:

  • 人工智能与城市:城市生活的集成智能
  • 基于 LSTM 与 SVM 融合的时间序列预测模型:理论框架与协同机制—实践算法(1)
  • Wireshark TS | 发送数据超出接收窗口
  • Frontiers in Psychology投稿LaTeX(三)
  • 元宇宙中的“虫洞“:技术实现、应用场景与未来挑战
  • J3160迷你小主机 性能测试 对比i3-4170 以及服务器
  • Python Pandas.qcut函数解析与实战教程
  • RS485转profinet网关如何让JRT激光测距传感器开启自动模式连续测量模式
  • 数据结构基础内容(第九篇:最短路径)
  • DP之背包基础
  • AutoLabelImg:高效的数据自动化标注工具和下载
  • Gradio.NET 中文快速入门与用法说明
  • 2025年7月25日-7月26日 · AI 今日头条
  • 在Luckfox Lyra(Zero W)上将TF卡格式化为ext4文件系统
  • 《 集成异步任务与定时调度:线程池与任务中心设计》
  • AI与区块链Web3技术融合:重塑数字经济的未来格局
  • 2025年项目数据看板工具选型指南,精选12款
  • SQL中的group by和having区别详解
  • 【C语言网络编程】HTTP 客户端请求(基于 Socket 的完整实现)
  • 神经网络知识讨论
  • 网易大模型算法岗面经80道
  • 【学习笔记】MimicGen: 基于人类演示的可扩展机器人学习数据生成系统
  • 批量重命名带编号工具,附免费地址
  • idea打开后project窗口未显示项目名称的解决方案
  • k8s的权限
  • tlias智能学习辅助系统--Filter(过滤器)
  • Ansible列出常见操作系统的发行版,Ansible中使用facts变量的两种方式
  • CH341 Linux驱动 没有 /dev/ttyCH341USB0
  • Linux文件系统管理——NFS服务端的安装配置与NFS客户端的安装与挂载实操教程
  • 【AI】联网模式