基于海光DCU平台的cube-studio软件适配
测试目的
cube-studio作为国内最大的开源一站式云原生mlops平台,大量使用者需要使用国产化gpu,因此进行适配,以兼容海光国产化gpu算力,使其基于海光国产化gpu来完成cube-studio提供的基础能力,例如在线开发,分布式多机多卡训练,在线推理等。同时保留对其他gpu/npu厂商的兼容性。
兼容扩展改进和适配测试
1)k8s中dcu算力支持
2)平台扩展后算力全局变量配置:同时支持多厂商gpu卡(包含dcu)和虚拟化gpu卡(包括vdcu)
3)平台web界面上使用dcu,分为单卡模式和共享模式
创建Pod效果
4)Notebook在线开发
5)Pipeline分布式多机多卡训练: