当前位置：首页 > web >正文

【TVM 教程】FAQ

web 2025/7/17 10:21:04

Apache TVM 是一个深度的深度学习编译框架，适用于 CPU、GPU 和各种机器学习加速芯片。更多 TVM 中文文档可访问 →https://tvm.hyper.ai/

如何安装

参阅安装 TVM

如何添加新的硬件后端

如果硬件后端支持 LLVM，则可以直接通过在 target 中设置正确的 target 三元组来生成代码。
如果 target 硬件是 GPU，请用 cuda、opencl 或 vulkan 后端。
如果 target 硬件是一个特殊的加速器，请查看 VTA：多功能张量加速器和向 TVM 中添加自定义 Codegen 。
对上述所有情况，若要用 AutoTVM 添加 target-specific 的优化模板，请参阅使用模板和 AutoTVM 进行自动调优。
除了使用 LLVM 的向量化，还可以嵌入微内核来利用硬件内联函数，请参阅使用 Tensorize 来利用硬件内联函数。

TVM 与其他 IR/DSL 项目的关系

深度学习系统中通常有两个层次的 IR 抽象。TensorFlow 的 XLA 和 Intel 的 ngraph 都使用计算图表示，它是高级的表示，有助于执行通用优化，例如内存重用、布局转换和自动微分。

TVM 采用底层表示，明确表示内存布局、并行化模式、局部性和硬件原语等选择。低级 IR 更类似 target 硬件——采用了现有图像处理语言，如 Halide、darkroom 和循环转化工具（如 loopy 和基于多面体的分析）的想法。重点关注如何表达深度学习工作负载（如 recurrence）、不同硬件后端的优化，以及如何嵌入框架，从而提供端到端的编译堆栈。

TVM 与 libDNN、cuDNN 的关系

TVM 将这些库作为外部调用。TVM 的目标之一是生成高性能内核。通过学习手动内核制作技术，并将它们作为原语添加到 DSL 的方式，我们得以增量发展 TVM。有关 TVM 中算子的组成，参见顶部。

安全

参阅安全指南

http://www.xdnf.cn/news/15631.html

相关文章：

筑牢网络安全防线：DDoS/CC 攻击全链路防护技术解析

Hadoop（三）

PyTorch 损失函数详解：从理论到实践

Qt小组件 - 7 SQL Thread Qt访问数据库ORM

Uniapp中双弹窗为什么无法显示?

玩转Docker | 使用Docker部署bender个人导航页工具

利用Java自定义格式，循环导出数据、图片到excel

【论文阅读 | CVPR 2023 |CDDFuse：基于相关性驱动的双分支特征分解的多模态图像融合】

lua（xlua）基础知识点记录

【前端】在Vue3中绘制多系列柱状图与曲线图

量子比特耦合与系统集成：量子计算硬件的核心突破

入门华为数通，HCIA/HCIP/HCIE该怎么选？

2025年自动化工程、物联网与计算机应用国际会议（AEITCA 2025）

Java基础：分支/循环/数组

PLC-BMS电力载波通信技术深度解析：智能电网与储能系统的融合创新

【WRFDA数据第一期】WRFDA Free Input 数据网页

Spring Boot 整合 Nacos 实战教程：服务注册发现与配置中心详解

【后端】.NET Core API框架搭建（6） --配置使用MongoDB

微软AutoGen：多智能体协作的工业级解决方案

PyCharm高效入门

NodeJS Express 静态文件、中间件、路由案例

手撕Spring底层系列之：IOC、AOP

java操作Excel两种方式EasyExcel 和POI

跟着Carl学算法--回溯【2】

React Hooks 数据请求库——SWR使用详解

Spring AI 系列之十四 - RAG-ETL之一

Vue3+Ts实现父子组件间传值的两种方式

Unity Android Logcat插件输出日志中文乱码解决

小白成长之路-Elasticsearch 7.0 配置

BNN 技术详解：当神经网络只剩下 +1 和 -1