当前位置: 首页 > web >正文

【计算机视觉】目标检测:yoloV1~yoloV11项目论文及对比

在这里插入图片描述

以下是 YOLO (You Only Look Once) 系列模型从 V1 到 V11 的详细介绍和项目地址(截至2024年7月)。YOLO 是目标检测领域的里程碑模型,以其 实时性高精度 著称,广泛应用于自动驾驶、安防监控、工业检测等领域。


YOLOv1 (2016)

📌 论文: You Only Look Once: Unified, Real-Time Object Detection
📌 代码: Darknet (C 实现)
📌 特点

  • 首个 单阶段(one-stage) 目标检测模型,直接回归边界框和类别。
  • 使用 全卷积网络(FCN),速度快但精度较低。
  • 输入分辨率 448×448,在 Pascal VOC 上 mAP 63.4

YOLOv2 (YOLO9000, 2017)

📌 论文: YOLO9000: Better, Faster, Stronger
📌 代码: Darknet
📌 特点

  • 引入 Batch Normalization,提升训练稳定性。
  • 使用 Anchor Boxes 提高定位精度。
  • 提出 Darknet-19 骨干网络,比 V1 更快更准。
  • 支持 多尺度训练(Multi-Scale Training),输入分辨率可调。
  • 在 Pascal VOC 上 mAP 78.6,可检测 9000+ 类别(YOLO9000)。

YOLOv3 (2018)

📌 论文: YOLOv3: An Incremental Improvement
📌 代码: Darknet
📌 特点

  • 采用 Darknet-53 骨干网络(带残差连接)。
  • 引入 多尺度预测(FPN-like),提升小目标检测能力。
  • 使用 Binary Cross-Entropy (BCE) Loss 替代 Softmax 分类。
  • 在 COCO 上 mAP 33.0,速度 65 FPS(Titan X)。

YOLOv4 (2020)

📌 论文: YOLOv4: Optimal Speed and Accuracy of Object Detection
📌 代码: Darknet
📌 特点

  • 引入 CSPDarknet53 骨干网络,提升特征提取能力。
  • 采用 PANet + SPP 增强多尺度特征融合。
  • 使用 Mosaic Data AugmentationCIoU Loss 提升训练效果。
  • 在 COCO 上 mAP 43.5,速度 62 FPS(Tesla V100)。

YOLOv5 (2020)

📌 论文: 无官方论文(Ultralytics 团队开发)
📌 代码: Ultralytics YOLOv5 (PyTorch)
📌 特点

  • PyTorch 实现,更易部署和训练。
  • 引入 Focus 模块 减少计算量。
  • 支持 Auto Learning Rate & Batch Size
  • 提供 多个预训练模型(YOLOv5s, m, l, x)
  • 在 COCO 上 mAP 50.7(YOLOv5x)。

YOLOv6 (2022)

📌 论文: YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications
📌 代码: Meituan YOLOv6
📌 特点

  • 美团(Meituan) 团队开发,面向工业应用。
  • 采用 EfficientRep 骨干网络RepVGG 风格 结构。
  • 引入 Anchor-Free + SimOTA 标签分配策略。
  • 在 COCO 上 mAP 52.8(YOLOv6-L)。

YOLOv7 (2022)

📌 论文: YOLOv7: Trainable Bag-of-Freebies Sets New State-of-the-Art for Real-Time Object Detectors
📌 代码: WongKinYiu YOLOv7
📌 特点

  • 提出 Extended Efficient Layer Aggregation Network (E-ELAN)
  • 引入 Model Scaling & Compound Scaling 优化推理速度。
  • 支持 辅助训练头(Auxiliary Head) 提升小目标检测。
  • 在 COCO 上 mAP 56.8(YOLOv7-E6E)。

YOLOv8 (2023)

📌 论文: 无官方论文(Ultralytics 团队开发)
📌 代码: Ultralytics YOLOv8
📌 特点

  • 支持 目标检测 + 实例分割 + 姿态估计
  • 采用 Anchor-Free + Distribution Focal Loss
  • 提供 CLI & Python API,易于部署。
  • 在 COCO 上 mAP 53.9(YOLOv8x)。

YOLOv9 (2024)

📌 论文: YOLOv9: Learning What You Want to Learn Using Programmable Gradient Information
📌 代码: WongKinYiu YOLOv9
📌 特点

  • 提出 PGI (Programmable Gradient Information) 解决信息丢失问题。
  • 采用 GELAN (Generalized Efficient Layer Aggregation Network) 骨干。
  • 在 COCO 上 mAP 63.0(YOLOv9-E),SOTA 性能

YOLOv10 (2024)

📌 论文: YOLOv10: Real-Time End-to-End Object Detection
📌 代码: THU-MIG YOLOv10
📌 特点

  • 清华 MIG 团队 提出,无 NMS(Non-Maximum Suppression)。
  • 采用 Consistent Dual Assignments 提升端到端训练。
  • 在 COCO 上 mAP 56.8(YOLOv10-X),速度更快

YOLOv11 (2024)

📌 论文: 尚未正式发布(社区改进版)
📌 代码: 社区实现
📌 特点

  • 目前 非官方版本,部分改进包括:
    • 更轻量级设计(适合移动端)。
    • 改进的注意力机制(如 EMA、SimAM)。
    • 结合 Diffusion 模型 进行数据增强。

总结

版本年份骨干网络关键改进mAP (COCO)项目地址
YOLOv12016Darknet单阶段检测63.4 (VOC)Darknet
YOLOv22017Darknet-19Anchor Boxes78.6 (VOC)Darknet
YOLOv32018Darknet-53多尺度预测33.0Darknet
YOLOv42020CSPDarknet53PANet + SPP43.5Darknet
YOLOv52020CSPNetPyTorch 实现50.7Ultralytics
YOLOv62022EfficientRepAnchor-Free52.8Meituan
YOLOv72022E-ELAN辅助训练头56.8WongKinYiu
YOLOv82023CSPDarknet多任务支持53.9Ultralytics
YOLOv92024GELANPGI 机制63.0WongKinYiu
YOLOv102024CSPNet无 NMS56.8THU-MIG
YOLOv112024社区改进轻量化-社区

如何选择 YOLO 版本?

  • 工业部署 → YOLOv5 / YOLOv8(PyTorch 生态友好)
  • 最高精度 → YOLOv9 / YOLOv10
  • 移动端/嵌入式 → YOLOv5s / YOLOv8n
  • 学术研究 → YOLOv7 / YOLOv9

YOLO 系列仍在快速发展,建议关注 Ultralytics、Meituan、WongKinYiu 等团队的最新研究! 🚀

http://www.xdnf.cn/news/3653.html

相关文章:

  • 【信息系统项目管理师-论文真题】2011上半年论文详解(包括解题思路和写作要点)
  • LVGL -文本显示 英文、中文
  • MaC QT 槽函数和Lambda表达式
  • Leetcode刷题记录29——矩阵置零
  • 【JavaScript】性能优化:打造高效前端应用
  • 数据赋能(212)——质量管理——统一性原则
  • ROS2学习笔记|实现订阅消息并朗读的详细步骤
  • Easy云盘总结篇-登录注册
  • C# 编程核心:控制流与方法调用详解
  • 力扣每日一题 ​838. 推多米诺​
  • PyCharm中全局搜索无效
  • 软件测试名词科普:驱动模块、桩模块
  • springAop代理责任链模式源码解析
  • Socket-TCP
  • 【信息系统项目管理师】【2017年-2024年】计算画图题汇总——案例分析
  • [更新完毕]2025东三省B题深圳杯B题数学建模挑战赛数模思路代码文章教学:LED显示屏颜色转换设计与校正
  • ES6入门---第二单元 模块三:对象新增、
  • 深入理解 HttpExchange_Java 中构建 HTTP 服务的基础组件
  • 0基础 | STM32 | TB6612电机驱动使用
  • 2025年- H22-Lc130-206. 反转链表(链表)---java版
  • FreeRtos实战从入门到精通--任务创建和删除(动态方法)--事了拂衣去,深藏功与名
  • scikit-learn在监督学习算法的应用
  • linux下,ollama会把模型文件保存在哪里?
  • 神经网络基础-从零开始搭建一个神经网络
  • 【掌握 DDL】:SQL 中的数据库与表管理
  • 安卓基础(悬浮窗分级菜单和弹窗)
  • 【现代深度学习技术】现代循环神经网络04:双向循环神经网络
  • 游戏引擎学习第256天:XBox 控制器卡顿和修复 GL Blit 伽玛问题
  • java学习之数据结构:三、八大排序
  • 生成器模式(Builder Pattern)