当前位置: 首页 > backend >正文

开放词汇检测分割YOLOE从pytorch到caffe

开放词汇检测分割YOLOE从pytorch到caffe

  • 0. 前沿
    • 开放词汇检测的概念
    • CLIP模型
  • 1. YOLOE 环境配置
    • 1.1 虚拟环境
    • 1.2 YOLOE 模型推理测试
      • 1.2.1 文本提示检测和分割测试
      • 1.2.2 无提示检测和分割
  • 2.YOLOE网络结构分析
    • 2.1 网络结构概述
    • 2.2 可重参数化区域-文本对齐(Re-parameterizable region-text alignment: RepRTA)
    • 2.3 语义激活视觉提示编码器(Semantic-activated visual prompt encoder: SAVPE)
    • 2.4 懒惰区域-提示对比(Lazy region-prompt contrast: LRPC)
  • 3. YOLOE模型导出
    • 3.1 修改head.py
    • 3.2 修改`ultralytics/engine/exporter.py`
    • 3.3 `python export.py `导出onnx模型
  • 4. onnx转caffemodel

0. 前沿

一直在用YOLO系列进行目标检测、分割和关键点检测等任务,基于对YOLO-world的了解,进一步认识了开放词汇检测,简单来说就是在原有固定类别的检测器上进行类别数量提升,基于CLIP的文本embedding能力,可以将任意标签转换为512维度的特征向量,将其与图片目标特征进行对比学习,获得目标的匹配类别。YOLOE在检测的基础上补充了分割任务,能够直接实现实例分割的移植和部署;

在这里插入图片描述
从最后的部署应用来看,在考虑到边缘端的推理效率,采用了重参化移植,export时指定label后,模型的结构和原来的YOLOv8s是一样的,所以总体感觉开放词汇在边缘端还是趋向于闭集检测,优势在于能够进行预标注,对提高新样本的标注效率有一定的帮助。(基于当前认知的感受,后续补充)。本文将针对YOLOE从0到1进行模型的移植部署,整体属于入门级别,没有进行模型微调(微调后会对参与训练的样本精度提升,但其他样本骤降),只对预训练模型进行caffemodel的转换并部

http://www.xdnf.cn/news/13084.html

相关文章:

  • Clean Code 学习总结01 - 物理设计与命名艺术
  • [Java 基础]String 类
  • MCP和Function Calling
  • OpenCV CUDA模块光流计算-----实现Farneback光流算法的类cv::cuda::FarnebackOpticalFlow
  • Spring Boot 与 Kafka 的深度集成实践(二)
  • Flink 系列之二十二 - 高级概念 - 保存点
  • Linux命令cat /proc/net/snmp查看网络协议层面统计信息
  • 项目管理进阶:解析112页IPD集成产品开发高层培训【附全文阅读】
  • 秋叶包ComfyUI 新手入门攻略及实战指南
  • 11_数据表示与特征工程
  • 华为OD机试-最短木板长度-二分法(A卷,100分)
  • .Net 优秀框架 ABP全面详解
  • 推荐 github 项目:GeminiImageApp(图片生成方向,可以做一定的素材)
  • 第三章:局域网
  • FDA方向图的matlab仿真实现
  • 河北对口计算机高考MySQL笔记(完结版)(2026高考)持续更新~~~~
  • 【Elasticsearch基础】Elasticsearch批量操作(Bulk API)深度解析与实践指南
  • RocketMQ 客户端负载均衡机制详解及最佳实践
  • FFmpeg介绍
  • AI-Python机器学习与深度学习实践技术应用
  • 苹果端Cursor免费额度与模型受限终极解决方案
  • 【Elasticsearch】一个图书馆的案例解释 Elasticsearch
  • Pandas 可视化集成:数据科学家的高效绘图指南
  • 协议转换利器,profinet转ethercat网关的两大派系,各有千秋
  • C#中清空DataGridView的方法
  • RKNN开发环境搭建2-RKNN Model Zoo 环境搭建
  • DAY 26 函数专题1:函数定义与参数
  • 【HarmonyOS 5】鸿蒙中Stage模型与FA模型详解
  • ASR(语音识别)语音/字幕标注 通过via(via_subtitle_annotator)
  • pytorch卷积层权重之 二维互相关运算(corr2d) (亲测,已解决)