当前位置: 首页 > news >正文

端侧推理软件栈

目前单个嵌入式设备算力不足以训练模型,运行大语言模型进行推理算力也是很吃紧的。嵌入式设备上可以部署轻量模型推理软件栈。

如何构建嵌入式设备模型软件栈:

1、构建自己的模型文件格式。

2、构建python,c接口库,提供模型构建工具集,模型推理接口库等。

3、支持TensorFlow,PyTorch,ONNX等模型,并提供工具将这些模型转换成自己的模型,而且提供工具分析自己的模型。

4、提供模型评估工具,支持精度评估,性能评估,内存评估等。

5、支持推理,量化,稀疏,矩阵运算,自定义算子,动态shape,数据排布等特性和功能,支持NPU/GPU/CPU调度,Cache管理等硬件管理,支持图级别/算子级别/内存优化等优化机制和流程。

6、算子可以运行在CPU上(可用SVE,NEON指令扩展等优化性能),可以运行在GPU,NPU,TPU上,其中TPU是谷歌自研的。

7、端侧使用GPU运行算子可以用OpenGL,OpenCL,Vulkan等库,MNN,NCNN是对这些库进行了封装。在NPU上运行算子需要使用专用的NPU软件栈,ARM的NPU软件栈是ARM NN。

http://www.xdnf.cn/news/1132651.html

相关文章:

  • 智慧农业新图景:物联网如何精准守护作物生长​
  • FCN语义分割笔记(1)
  • XSS-labs 1-8关
  • 系统性学习C语言-第十八讲-C语言内存函数
  • 从零开始的云计算生活——番外4,使用 Keepalived 实现 MySQL 高可用
  • xss-lab1-8关
  • AWS ML Specialist 考试备考指南
  • Liunx练习项目6-创建dns服务器
  • 图机器学习(10)——监督学习中的图神经网络
  • AI Agent开发学习系列 - langchain之LCEL(1):LangChain LCEL链式编排与RAG增强实践
  • 新手向:自动化图片格式转换工具
  • orfeotoolbox ResetMargin
  • 硬件设计学习DAY3——电源Buck电路深度解析:CCM/DCM/BCM模式与电感设计
  • Linux运维新手的修炼手扎之第21天
  • 【论文阅读】A Survey on Knowledge-Oriented Retrieval-Augmented Generation(4)
  • Kotlin比较接口
  • Kotlin获取集合中的元素操作
  • 力扣-146.LRU缓存机制
  • Xsens人形机器人拟人动作AI训练,提升机器人工作精度与效率
  • MybatisPlus-11.IService的批量新增
  • 高性能架构模式——高性能缓存架构
  • alpineLinux修改包管理为国内源
  • 【Linux】基本指令详解(二) 输入\输出重定向、一切皆文件、认识管道、man、cp、mv、echo、cat
  • LVS集群搭建
  • OpenCV稠密光流估计的一个类cv::optflow::DenseRLOFOpticalFlow
  • [AI-video] 字幕服务 | 视频素材服务 | 视频生成服务
  • 智能电网时代:双向WiFi电表在海外家庭能源中的战略价值
  • C++---emplace_back与push_back
  • 网络爬虫的相关知识和操作
  • lazyvim恢复gt键