当前位置: 首页 > web >正文

【TVM 教程】FAQ

Apache TVM 是一个深度的深度学习编译框架,适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/

如何安装

参阅 安装 TVM

如何添加新的硬件后端

  • 如果硬件后端支持 LLVM,则可以直接通过在 target 中设置正确的 target 三元组来生成代码。
  • 如果 target 硬件是 GPU,请用 cuda、opencl 或 vulkan 后端。
  • 如果 target 硬件是一个特殊的加速器,请查看 VTA:多功能张量加速器 和 向 TVM 中添加自定义 Codegen 。
  • 对上述所有情况,若要用 AutoTVM 添加 target-specific 的优化模板,请参阅 使用模板和 AutoTVM 进行自动调优。
  • 除了使用 LLVM 的向量化,还可以嵌入微内核来利用硬件内联函数,请参阅 使用 Tensorize 来利用硬件内联函数。

TVM 与其他 IR/DSL 项目的关系

深度学习系统中通常有两个层次的 IR 抽象。TensorFlow 的 XLA 和 Intel 的 ngraph 都使用计算图表示,它是高级的表示,有助于执行通用优化,例如内存重用、布局转换和自动微分。

TVM 采用底层表示,明确表示内存布局、并行化模式、局部性和硬件原语等选择。低级 IR 更类似 target 硬件——采用了现有图像处理语言,如 Halide、darkroom 和循环转化工具(如 loopy 和基于多面体的分析)的想法。重点关注如何表达深度学习工作负载(如 recurrence)、不同硬件后端的优化,以及如何嵌入框架,从而提供端到端的编译堆栈。

TVM 与 libDNN、cuDNN 的关系

TVM 将这些库作为外部调用。TVM 的目标之一是生成高性能内核。通过学习手动内核制作技术,并将它们作为原语添加到 DSL 的方式,我们得以增量发展 TVM。有关 TVM 中算子的组成,参见顶部。

安全

参阅 安全指南

http://www.xdnf.cn/news/15631.html

相关文章:

  • 筑牢网络安全防线:DDoS/CC 攻击全链路防护技术解析
  • Hadoop(三)
  • PyTorch 损失函数详解:从理论到实践
  • Qt小组件 - 7 SQL Thread Qt访问数据库ORM
  • Uniapp中双弹窗为什么无法显示?
  • 玩转Docker | 使用Docker部署bender个人导航页工具
  • 利用Java自定义格式,循环导出数据、图片到excel
  • 【论文阅读 | CVPR 2023 |CDDFuse:基于相关性驱动的双分支特征分解的多模态图像融合】
  • lua(xlua)基础知识点记录
  • 【前端】在Vue3中绘制多系列柱状图与曲线图
  • 量子比特耦合与系统集成:量子计算硬件的核心突破
  • 入门华为数通,HCIA/HCIP/HCIE该怎么选?
  • 2025年自动化工程、物联网与计算机应用国际会议(AEITCA 2025)
  • Java基础:分支/循环/数组
  • PLC-BMS电力载波通信技术深度解析:智能电网与储能系统的融合创新
  • 【WRFDA数据第一期】WRFDA Free Input 数据网页
  • Spring Boot 整合 Nacos 实战教程:服务注册发现与配置中心详解
  • 【后端】.NET Core API框架搭建(6) --配置使用MongoDB
  • 微软AutoGen:多智能体协作的工业级解决方案
  • PyCharm高效入门
  • NodeJS Express 静态文件、中间件、路由案例
  • 手撕Spring底层系列之:IOC、AOP
  • java操作Excel两种方式EasyExcel 和POI
  • 跟着Carl学算法--回溯【2】
  • React Hooks 数据请求库——SWR使用详解
  • Spring AI 系列之十四 - RAG-ETL之一
  • Vue3+Ts实现父子组件间传值的两种方式
  • Unity Android Logcat插件 输出日志中文乱码解决
  • 小白成长之路-Elasticsearch 7.0 配置
  • BNN 技术详解:当神经网络只剩下 +1 和 -1