当前位置: 首页 > backend >正文

【精彩回顾.上海交通大学专场】---大模型推理需求下的计算生态链变革

2025 年 6 月 6 日,由存算一体开发者社区与上海交通大学联合主办的 “大模型推理需求下的计算生态链变革” 专场活动在上海交通大学闵行校区顺利举办。本次活动汇聚了算能、OpenDataLab、知存科技、天翼云等企业专家,围绕大模型时代的算力架构创新、数据生态构建及产业实践展开深度探讨,推动产学研用协同发展。以下为核心内容回顾:

一、存内计算架构:突破算力瓶颈的硬件革新

知存科技数字设计专家邢小地在《硬件架构创新:存内计算架构下的数字计算生态》演讲中指出,大模型发展面临功耗、带宽、成本、容量四大瓶颈,传统冯·诺依曼架构的 “存储墙” 问题尤为突出(DDR 功耗占比达 74%,数据搬运时间是计算的 89 倍)。存内计算(CIM)通过将计算单元嵌入存储阵列,实现 “存储即算力”,可显著提升算力密度并降低功耗。

- 技术优势:存内计算架构支持向量 - 矩阵乘法(如 GEMM 运算)的原位计算,避免数据频繁搬运。例如,知存科技的存算核在 28nm 工艺下即可实现与 12nm 数字核相当的算力密度,且单位面积功耗更低。

- 应用场景:适用于神经网络的 Conv 层推理及大模型的 Linear 层,尤其在边缘智能、自动驾驶等实时性要求高的场景中优势显著。通过 3D 堆叠技术,存算阵列与数字控制层协同,可进一步提升算力。

二、OpenDataLab:构建大模型时代的数据基座

OpenDataLab 数据平台专家叶奕谷分享了《开源数据与工具协同,OpenDataLab 构建大模型时代的创新基座》,强调数据在大模型发展中的核心地位:

- 数据生态:OpenDataLab 已开源 7700 + 数据集,容量超 180TB,覆盖文本、图像、视频等多模态数据,支持大模型预训练、微调、评测全生命周期。例如,“万卷・丝路” 多语言数据集涵盖 8 个语种,数据总量超 800B Tokens,助力跨文化大模型研发。

- 工具链赋能:开源数据提取工具 MinerU 可高效解析 PDF/PPT 等文档,智能标注工具 LabelU 支持多模态数据标注,大幅提升数据处理效率。通过与高校、企业合作,OpenDataLab 推动数据标准化与开源共享,降低大模型开发门槛。

 三、算能与天翼云:软硬件协同的算力实践

算能云端产品线负责人王少泽介绍了《唯快不破:SophNet 产品焕新升级》,展示算能在 TPU 与 RISC-V 处理器领域的布局。其最新智算服务器 SGM7-40 搭载原生 FP8 算力单元,支持大模型极速推理,相比传统方案成本降低 80%,推理速度提升 45.2t/s。

天翼云智算产品线研发专家范顺国则分享了《国产万卡集群实战:息壤超大规模训练实践与性能优化》,探讨了万卡集群中的环境准备、训练调优及断点续训技术,强调异构算力协同与故障处理能力在大模型训练中的关键作用。

四、生态联动:从技术到应用的全链条整合

本次活动首次披露 存算一体开发者社区的生态规划:

- 开发者支持:社区将推出存内计算开源工具链,提供实训营与技术竞赛,降低硬件开发门槛。例如,2025 年 “知存科技杯” TensorCore 赛题聚焦轻量化 AI 模型优化,吸引高校与企业开发者参与。

- 产业合作:社区联动智谱 AI、Coze 等企业,探索存内计算在具身智能、多模态模型中的应用场景,并与 AWS、GitCode 等平台共享资源,扩大技术影响力。

- 行业前瞻:聚焦于存算一体技术发展,着眼于AI端侧前沿发展态势,打造新一代AI硬件开发者社区。

五、未来展望:算力与数据驱动的 AI 生态变革

大模型时代的计算生态链正从 “模型中心” 转向 “数据与算力协同”。存内计算架构与开源数据平台的结合,将推动 AI 硬件从通用化走向定制化,加速大模型在垂直领域的落地。正如活动嘉宾所言:“只有打破硬件、软件、数据之间的壁垒,才能真正释放大模型的生产力。”

关于存算一体开发者社区 :


聚焦开发者需求,构建AI全链路生态,推动存算一体技术普及

依托行业前沿算力架构,首发技术开源与实战训练营,提供高性能硬件底座与全栈工具链。联合高校、研究院及企业,打造首个聚焦存算一体的开发者社区,覆盖“技术研发—实践—产业应用”全周期。通过开源生态、沉浸式实训与产学研协同,降低技术门槛,加速算力创新商业化。聚焦智能驾驶、工业质检等场景,助力开发者实现从创意到落地的价值跃迁,共塑存算一体新未来。

加入社区,解锁算力开发新体验!

http://www.xdnf.cn/news/13222.html

相关文章:

  • “概率鹦鹉”难解语义等价验证的NPC难题: 从技术本质看LLM在SQL优化任务中的致命缺陷
  • 高并发内存池的轻量级模拟-细节处理与优化部分
  • 多协议诱骗电压芯片优势,如何防止负载太大而导致充电器复位重启
  • DisplayPort 2.0协议介绍(2)
  • JavaScript 标签加载
  • AI知识库调用全攻略:四种实战方法与技术实现
  • c++第七天 继承与派生2
  • 安全编程期末复习12(红色重点向下兼容)
  • 河南建筑安全员C证考试常见题及答案解析
  • 2.7 判断.lib和.a是静态库 还是动态库的导入库
  • 基于Docker部署MYSQL主从复制
  • RT_Thread——线程管理(下)
  • 数学公式中latex的粗体问题
  • vSphere环境ubuntu24.04虚拟机从BIOS切换为EFI模式启动
  • 链表反转示例代码
  • 每日算法刷题Day27 6.9:leetcode二分答案2道题,用时1h20min
  • 论文解析:一文弄懂U-Net(图像分割)!
  • WEB3全栈开发——面试专业技能点P5中间件
  • 华为智选携手IAM:突破技术边界,重塑智慧健康家居新时代
  • 苍穹外卖|学习笔记|day07
  • C#学习第29天:表达式树(Expression Trees)
  • 俩人相向而行,何时相遇问题思考。
  • 《创始人IP打造:知识变现的高效路径》
  • EXCEL 实现“点击跳转到指定 Sheet”的方法
  • 《Minio 分片上传实现(基于Spring Boot)》
  • 第三章 3.2 无线传感器网络的组成
  • 本周黄金想法
  • yaml读取写入常见错误 (‘cannot represent an object‘, 117)
  • STM32ADC模数转换器,让你的32可以测量电压!!!
  • Mobile ALOHA全身模仿学习