当前位置: 首页 > web >正文

LiteRT-LM边缘平台上高效运行语言模型

谷歌发布高效运行语言模型的 C++ 库:LiteRT-LM

LiteRT-LM 支持跨平台高效运行 Gemma-3N 系列模型,支持 2B 和 4B 参数模型,适用于桌面环境(Mac/Windows/Linux)及物联网设备

 

语言模型不再是一个单一模型,而是一个由多个模型和组件协同工作的流水线。LiteRT-LM 基于 LiteRT 构建,以支持这些流水线,包括:

  • C++ API 高效运行语言模型
  • 跨平台支持,通过便携式 C++ 实现广泛部署场景
  • 灵活可定制,满足您的特定功能需求
  • 硬件加速,释放设备硬件的全部潜能

参考开源

https://github.com/google-ai-edge/LiteRT-LM

https://huggingface.co/google/gemma-3n-E2B-it-litert-lm-preview 

http://www.xdnf.cn/news/14432.html

相关文章:

  • 【Android】 BindService源码流程
  • 如何在Windows上使用qemu安装ubuntu24.04服务器?
  • 408第一季 - 数据结构 - B树与B+树
  • 数据结构---B树
  • 卷积神经网络中的通道注意力机制
  • [游戏实时地图] 地图数据 | 兴趣点数据 | 虚幻引擎SDK接口
  • 软考 系统架构设计师系列知识点之杂项集萃(89)
  • UFS Layout Guide (UFS 2.x)
  • 第11章:Neo4j实际应用案例
  • 把Cmakelist.txt转化为Qt Pro文件的方法
  • 如何让 AI 接入自己的 API?我开发了一个将 OpenAPI 文档转为 MCP 服务的工具
  • 深入理解Kafka Consumer:从理论到实战
  • 简化您的工作流程:在 Azure 中构建高效的逻辑应用程序
  • 电池预测 | 第32讲 Matlab基于CNN-BiLSTM-Attention的锂电池剩余寿命预测,附锂电池最新文章汇集
  • Zustand:小而美的React状态管理库详解
  • React 实现卡牌翻牌游戏
  • AI医生24小时在线:你的健康新‘算法监护人
  • 项目 : 基于正倒排的boost搜索引擎
  • 基于n8n快速开发股票舆情监控对话系统
  • Servlet完整笔记
  • 通过 BLE 和 Wi-Fi 交换优化基于 ID 的远程无人机通信的延迟
  • Bootstrap 5学习教程,从入门到精通, Bootstrap 5 列表组(List Group)语法知识点及案例(14)
  • 【图像处理入门】8. 数学基础与优化:线性代数、概率与算法调优实战
  • Python----OpenCV(图像的绘制——绘制椭圆,绘制文本,添加文字水印,添加图片水印)
  • Nginx限速配置详解
  • LeetCode 高频 SQL 50 题(基础版)【题解】合集
  • 高效开发REST API:Django REST Framework序列化器深度指南
  • 搭建K8s集群平台(详细版)
  • SQL Server 2025 预览版发布:AI深度集成、开发者体验飞跃与混合云新篇章
  • Java对象中的MarkWord