当前位置: 首页 > news >正文

openvino如何在c++中调用pytorch训练的模型

步骤1:将PyTorch模型转换为ONNX格式

转换代码示例(Python)

import torch
import torchvision

1. 加载训练好的PyTorch模型

model = torchvision.models.resnet18(pretrained=True)
model.eval()  # 设置为评估模式

2. 创建虚拟输入(尺寸需匹配模型输入)

dummy_input = torch.randn(1, 3, 224, 224)

3. 导出为ONNX格式

torch.onnx.export(model,dummy_input,"resnet18.onnx",export_params=True,opset_version=11,  # 推荐使用11+input_names=["input"],output_names=["output"]
)

步骤2:将ONNX转换为OpenVINO IR格式

使用OpenVINO的Model Optimizer转换模型:

mo --input_model resnet18.onnx \--output_dir ir_model \--model_name resnet18_ir \--data_type FP32  # 也可用FP16

生成文件:
resnet18_ir.xml:网络拓扑结构
resnet18_ir.bin:权重数据

步骤3:C++集成推理代码

环境配置
安装OpenVINO Runtime
CMake配置示例:

find_package(OpenVINO REQUIRED)
add_executable(inference_app main.cpp)
target_link_libraries(inference_app PRIVATE openvino::runtime)

C++推理代码

#include <openvino/openvino.hpp>
#include <vector>int main() {// 1. 初始化OpenVINO核心ov::Core core;// 2. 加载模型auto model = core.read_model("ir_model/resnet18_ir.xml");// 3. 编译模型(指定设备)ov::CompiledModel compiled_model = core.compile_model(model, "CPU");  // 也可用"GPU", "MYRIAD"// 4. 创建推理请求ov::InferRequest infer_request = compiled_model.create_infer_request();// 5. 准备输入数据auto input_tensor = infer_request.get_input_tensor();float* input_data = input_tensor.data<float>();// 填充数据(示例:随机值)std::fill_n(input_data, input_tensor.get_size(), 0.5f); // 6. 执行推理infer_request.infer();// 7. 获取输出结果auto output_tensor = infer_request.get_output_tensor();const float* output_data = output_tensor.data<const float>();// 处理输出(例如:打印前10个结果)for (int i = 0; i < 10; ++i) {std::cout << "Output[" << i << "] = " << output_data[i] << std::endl;}return 0;
}

关键注意事项

输入预处理:
需在C++中复现PyTorch的预处理逻辑(归一化/缩放)
示例:若PyTorch使用mean=[0.485,0.456,0.406], std=[0.229,0.224,0.225],需在填充input_data前进行归一化
动态shape支持:
若需动态输入尺寸,导出ONNX时指定动态维度:
torch.onnx.export(…, dynamic_axes={“input”: {0: “batch_size”, 2: “height”, 3: “width”}})

性能优化:
使用ov::preprocess::PrePostProcessor进行图内预处理
启用异步推理:infer_request.start_async()
多设备支持:core.compile_model(model, “MULTI:CPU,GPU”)
错误排查工具:
验证ONNX:onnx.checker.check_model(onnx.load(“resnet18.onnx”))
查看IR结构:使用Netron打开.xml文件

完整流程图示

graph LR
A[PyTorch模型 .pt] -->|torch.onnx.export| B[ONNX模型]
B -->|Model Optimizer| C[OpenVINO IR XML/BIN]
C --> D[C++加载IR]
D --> E[预处理数据]
E --> F[执行推理]
F --> G[解析输出]

通过以上步骤,即可高效部署PyTorch模型到C++生产环境。建议参考OpenVINO官方文档获取最新API细节和性能调优指南。

http://www.xdnf.cn/news/886105.html

相关文章:

  • 【Oracle】分区表
  • Maxscript快速入门(四)
  • C#、VB.net——如何设置窗体应用程序的外边框不可拉伸
  • Mermaid画UML类图
  • 深度学习N2周:构建词典
  • 【笔记】解决MSYS2安装后cargo-install-update.exe-System Error
  • Mybatis动态SQL语句
  • aitrader兼容talib,布林带的简单策略,创业板十年年年化15.5%,附代码
  • 成都芯谷金融中心·文化科技产业园:构建产业新城的实践与探索
  • Python打卡训练营day45——2025.06.05
  • 11 - ArcGIS For JavaScript -- 高程分析
  • Redis 缓存策略:借助缓存优化数据库性能并保障数据一致性
  • Liunx进程替换
  • 【Linux篇】0基础之学习操作系统进程
  • 2021 RoboCom 世界机器人开发者大赛-高职组(初赛)解题报告 | 珂学家
  • Spring中@Primary注解的作用与使用
  • Dockerfile实践java项目
  • 哈希算法实战全景:安全加密到分布式系统的“核心引擎”
  • 25_06_05Ubuntu系统root密码破解
  • Vite模块联邦(vite-plugin-federation)实现去中心化微前端后台管理系统架构
  • ROS:pcd点云转为路径规划的pgm文件和yaml文件
  • PHP的namespace
  • 第十三节:第五部分:集合框架:集合嵌套
  • ubuntu24.04 使用apt指令只下载不安装软件
  • BENTLY模块特价型号3300/16-14-01-03-00-00-01找小游、主要应用领域
  • ArcGIS Pro 3.4 二次开发 - 公共设施网络
  • windows server2019 不成功的部署docker经历
  • python项目如何创建docker环境
  • 无 sudo 权限下 Conda 安装 GCC 全攻略:虚拟环境适配、版本冲突解决与实战指南
  • 负载均衡将https请求转发后端http服务报错:The plain HTTP request was sent to HTTPS port