openshift AI 2.22安装的需求
OpenShift版本(???)
官方文档没有详细描述,建议采用4.17或者4.18 。
worker 节点
在安装 Operator 时,您的集群必须至少有 2 个 worker 节点,至少有 8 个 CPU 和 32 GiB RAM 用于 OpenShift AI。为确保 OpenShift AI 可用,除了最低要求外,还需要额外的集群资源。
Cluster Samples Operator(???)
安装集群后,按照 OpenShift Container Platform 文档配置 Cluster Samples Operator: 为受限集群配置 Samples Operator。
Chapter 2. Configuring the Cluster Samples Operator | Images | OpenShift Container Platform | 4.17 | Red Hat Documentation
备注:
Starting from OpenShift Container Platform 4.16, the Cluster Samples Operator is deprecated .
Open Data Hub 不能安装在集群中
为 OpenShift 配置身份提供程序
使用具有 cluster-admin 角色的用户访问集群;不允许 kubeadmin 用户。要为用户分配 cluster-admin 权限,请按照相关 OpenShift 文档中的步骤操作:
OpenShift Container Platform: 创建集群管理员
Chapter 8. Using RBAC to define and apply permissions | Authentication and authorization | OpenShift Container Platform | 4.17 | Red Hat Documentation
您的集群配置了可动态置备的默认存储类
访问对象存储
OpenShift AI 组件需要或可以使用 S3 兼容对象存储,如 AWS S3、MinIO、Ceph 或 IBM Cloud Storage。对象存储是一种数据存储机制,允许用户作为对象或文件访问其数据。S3 API 是基于 HTTP 访问对象存储服务的可识别标准。
对象存储必须可以被 OpenShift 集群访问。在与集群相同的断开连接的网络中部署对象存储。
以下组件需要对象存储:
单一或多模式服务平台,以部署存储模型。请参阅 在单模式服务平台上部署 模型或使用多型号服务平台部署模型。
数据科学管道、存储工件、日志和中间结果。请参阅配置管道服务器和 关于管道日志。
以下组件可以使用对象存储:
工作台,用于访问大型数据集。请参阅在数据科学项目中添加连接。
分布式工作负载,用于从和推送结果中提取输入数据。请参阅从数据科学管道运行分布式数据科学工作负载。
管道中执行的代码。例如,要将生成的模型存储在对象存储中。请参阅 Jupyterlab 中的管道概述。
安装 KServe 依赖项
要支持 KServe 组件(由 single-model 服务平台用来为大型模型提供服务),还必须为 Red Hat OpenShift Serverless 和 Red Hat OpenShift Service Mesh 安装 Operator 并执行额外的配置。如需更多信息 ,请参阅关于单模式服务平台。
如果要为 single-model 服务平台添加授权供应商,您必须安装 Red Hat - Authorino Operator。如需更多信息,请参阅为 单模式服务平台添加授权供应商。
数据科学项目准备
Data Science pipelines 2.0 包含 Argo 工作流的安装。如果一个现有 Argo 工作流安装没有在集群中的数据科学管道安装,则安装 OpenShift AI 后将禁用数据科学管道。在安装 OpenShift AI 前,请确保集群没有由数据科学管道安装的 Argo 工作流,或删除 Argo 工作流的独立安装。
在断开连接的环境中执行管道前,您必须将镜像上传到私有 registry。如需更多信息,请参阅 镜像以在受限环境中运行管道。
您可以将管道工件存储在 S3 兼容对象存储桶中,以便不使用本地存储。要做到这一点,您必须首先对存储帐户上的 S3 存储桶配置写入访问权限。
如果要在以 FIPS 模式运行的集群中安装 OpenShift AI,则数据科学项目的任何自定义容器镜像都必须基于 UBI 9 或 RHEL 9。这样可确保与 FIPS 批准的管道组件兼容,并防止与不匹配的 OpenSSL 或 GNU C 库(glibc)版本相关的错误。
关于GPU卡,官方文档并没有描述。如果使用英伟达的GPU卡,可以查看NVIDIA GPU Operator可能支持的英伟达卡。一般来说,比较低端的英伟达容易在公有云上获得。比如V100,A10,T4.
就连落后几代的A100 也难以从公有云获得。