当前位置: 首页 > backend >正文

【开发心得】Dify部署ollama模型的坑[8]

目录

关于一体机

关于特斯拉

AI显卡与游戏显卡

总结 


目前我们的私有化部署已经来到了32B的大模型,场景落地了。

在继续评估之前,来说点儿关于硬件的坑。

关于一体机

市面上,一体机很火,不怀疑一体机的算力,也不怀疑一体机的部署门槛,但是对于一体机在场景落地以后的优化和维护存在疑问,不过这个不是今天的主题,下次再聊。

先说说我们的选择,采用了公有云的私有化部署方案,读起来有点儿拗口,简单的说,就是算力与一体机类似,外网是无法访问的,知识库也是私有化的,并不对外公开。

关于特斯拉

重点来说说GPU,之前的文章里,都是不带GPU的,这次真的是有钱了,买了4卡的GPU,型号是特斯拉L2,虽然比不上A100(美国也不让我们用),但是也算是中端AI计算卡了,性能用下来,感觉还不错。

AI显卡与游戏显卡

当时在讨论硬件方案的过程中,有人就问,AI用的GPU与游戏显卡的区别是什么?

今天就把这个问题搞清楚,首先需要说明的是,如果你在家里自己玩,用带游戏显卡的笔记本,都可以部署一个14B的模型,而且效果也不错,网上的很多收费视频都是采用了这种方式。

企业级的话,游戏显卡就有点儿马拉火车的感觉了,不废话,直接上表格对比吧。

维度AI显卡游戏显卡
核心架构强化Tensor Core/CUDA,高并行计算优化RT Core,强调实时渲染
显存类型HBM2/HBM3,高带宽低延迟GDDR6X,侧重纹理加载速度
典型应用深度学习、科学计算3A游戏、VR内容创作
扩展能力支持多卡互联(NVLink)多屏输出为主(SLI/CrossFire)
价格区间企业级(10万+)消费级(2000-15000元)
代表型号英伟达A100/H100技嘉RTX 5060 Ti、RTX 4090
适用场景优先级科研/商用 > 娱乐娱乐 > 轻度专业应用

假入你家里的游戏电脑配置还算可以,也可以本地部署一个,可以把电脑里的各类攻略搞一个知识库,至少在游戏阶段,也可以少踩很多坑。

维度游戏显卡方案专业AI显卡方案
显存成本RTX 5090D(32GB)约1.5万元,性价比较高‌27A100/H100(80GB)单卡超10万元‌26
部署复杂度需手动配置多卡互联与模型压缩,适合技术型用户‌58支持NVLink多卡扩展,企业级工具链完善‌68
适用场景个人开发者/小型团队测试、轻量级AI应用‌58大规模模型训练、商用高并发需求‌26

总结 

照例还是总结一下,在人工智能领域,目前是符合Scaling Law(扩展定律)的,是指模型的性能与其规模(如数据量、参数数量、计算资源等)之间的经验性数学关系。简单来说,它描述了“更大规模通常带来更好性能”的规律,但并非简单的线性增长,而是遵循特定的非线性模式。上不封顶,个体而言,利用现有资源做更多的事情,是值得思考和实践的。

http://www.xdnf.cn/news/564.html

相关文章:

  • 【漫话机器学习系列】210.标准化(Standardization)
  • [Java · 初窥门径] Java 注释符
  • DEV-c++怎么免打头文件中英文切换
  • c语言中的原,反,补码
  • PyTorch 深度学习实战(38):注意力机制全面解析(从Seq2Seq到Transformer)
  • “劣币驱逐良币”与“U型锁”刍议
  • Linux中的软件管理
  • 解决Windows update服务启动拒绝访问的问题 | wuauserv 注册表拒绝访问的方法
  • Sleuth+Zipkin 服务链路追踪
  • 四级英语备考指南
  • 信息量、香农熵、交叉熵、KL散度总结
  • PowerBi中DATEDIFF怎么使用?
  • vue3 中 iframe 多页面切换导致资源刷新的问题解决
  • 从句详细解析
  • 群晖威联通飞牛等nas如何把宿主机硬盘挂接到可道云docker容器中
  • 【Envi遥感图像处理】016:如何下载NOAA AVHRR GIMMS 全球数据集?
  • 结构体详解
  • (10)VTK C++开发示例 --- 点和线之间的距离
  • 【入门】数字之和为13的整数
  • Doris,新一代实时数仓核心基础设施
  • 数据防泄漏:企业信息安全的重要防线
  • Datawhale AI春训营学习
  • PHP框架在大规模分布式系统中的适用性如何?
  • deekseak 本地windows 10 部署步骤
  • ACM ICPC算法基础包括哪几类
  • Withholding Tax(预扣所得税)-前台操作 Part 1
  • System.in 详解
  • 【笔记】网络安全管理
  • 嵌入式单片机开发 - Keil MDK 编译与烧录程序
  • c++中的类有关概念