当前位置: 首页 > ds >正文

Backbone

Backbone

在计算机视觉中,Backbone(主干网络) 是深度学习模型的特征提取器,通常是用于从输入图像中提取高级语义特征的卷积神经网络部分,后续模块(如检测头、分割头等)就是基于这些特征进行推理。

下面是一些常用的主干网络(Backbone)及其特点分类:

🔹 1. ResNet 系列(Residual Networks)

  • 代表模型:ResNet-18, ResNet-50, ResNet-101, ResNet-152

  • 特点

    • 引入 残差连接(skip connection),解决深层网络的梯度消失问题;

    • 模型越深通常提取的特征越丰富,性能越好;

  • 应用场景:目标检测(Faster R-CNN、Mask R-CNN)、图像分类等。

🔹 2. VGG 系列

  • 代表模型:VGG-16, VGG-19

  • 特点

    • 结构简单,全部使用 3x3 卷积 + 池化;

    • 参数量大,计算开销大;

  • 现状:较老,已逐渐被 ResNet、MobileNet 等替代。

🔹 3. MobileNet 系列

  • 代表模型:MobileNetV1/V2/V3

  • 特点

    • 轻量级网络,适合移动端、嵌入式设备;

    • 使用 深度可分离卷积 大幅降低计算量;

  • 应用场景:实时检测、边缘设备部署。

🔹 4. EfficientNet 系列

  • 代表模型:EfficientNet-B0 ~ B7

  • 特点

    • 使用复合缩放策略同时放大网络的深度、宽度和分辨率;

    • 性能与速度兼顾,是一种高性价比的 backbone;

  • 应用场景:分类、检测、分割等任务。

🔹 5. ConvNeXt

  • 作者:Meta AI

  • 特点

    • 借鉴了 Transformer 的设计灵感,但仍使用纯 CNN 架构;

    • 在 ImageNet 上超越了许多 Transformer 模型;

  • 现代化的 CNN,兼顾精度与效率。

🔹 6. Swin Transformer

  • 特点

    • 基于窗口的自注意力机制,属于视觉 Transformer;

    • 支持多尺度特征提取,非常适合作为分割或检测任务的 backbone;

  • 已广泛用于 Mask R-CNN、Cascade R-CNN 等。

🔹 7. Vision Transformer (ViT)

  • 结构:纯 Transformer 架构,打破 CNN 框架;

  • 特点

    • 不用卷积,直接处理图像 patch;

    • 对训练数据规模和计算资源较为敏感;

  • 应用趋势:ViT + Hybrid CNN 架构逐渐成为主流。

📊 简单对比(以 ImageNet 为例):

BackboneParamsFLOPsTop-1 Acc特点说明
ResNet-5025M4 GF76.0%主流基线,高性能
MobileNetV23.4M0.3GF72.0%移动端友好,轻量
EfficientNet-B05.3M0.39GF77.1%性能优越,参数较少
Swin-T29M4.5GF81.3%视觉 Transformer,表现强
ViT-B/1686M17.6GF79.7%大模型,对数据依赖高
http://www.xdnf.cn/news/7999.html

相关文章:

  • Typescript 教程
  • Baklib智启企业AI知识管理
  • MySQL 主从复制搭建全流程:基于 Docker 与 Harbor 仓库
  • 杂记10---ldd获取依赖so名称并导出txt文件
  • 数字电子技术基础(六十二)——使用Multisim软件绘制边沿触发的D触发器和JK触发器
  • 2025年 PMP 6月 8月 专题知识
  • Python数据分析基础
  • LangChain入门和应用#1
  • 工商总局可视化模版-Echarts的纯HTML源码
  • CMake跨平台编译生成:从理论到实战
  • 现代计算机图形学Games101入门笔记(二十一)
  • 【Linux安装与维护】
  • 深入理解C#实例构造函数:对象初始化的关键
  • 动态规划3、悟到核心
  • 【DB2】SQL1639N 处理
  • 建立java项目
  • 免费iOS签名的能使用吗?
  • 【钱包协议】:WalletConnect 详解
  • 一步步解析 HTTPS
  • 网络安全管理之钓鱼演练应急预案
  • PCB设计教程【入门篇】——电路分析基础-元件数据手册
  • Nginx核心服务
  • 【机器学习基础】机器学习与深度学习概述 算法入门指南
  • R语言速查表
  • 什么是瞬态动力学?
  • 从芯片互连到机器人革命:英伟达双线出击,NVLink开放生态+GR00T模型定义AI计算新时代
  • ILRuntime中实现OSA
  • CAU人工智能class3 优化器
  • Python MD5加密算法脚本
  • Java线程池调优与实践经验