当前位置: 首页 > ai >正文

第Y1周打卡——调用官方权重进行检测

  • 🍨 本文为🔗365天深度学习训练营中的学习记录博客
  • 🍖 原作者:K同学啊

一、下载源码

GitHub - ultralytics/yolov5: YOLOv5 🚀 in PyTorch > ONNX > CoreML > TFLite

二、安装环境

解压zip文件后,在文件目录内,打开cmd后输入:pip install -r requirements.txt

三、图片识别

python detect.py --source data\R.jpg --weights yolov5s.pt --img 640

四、视频识别

python detect.py --source MyVideo_2.mp4

总结:

学习收获

  1. 源码理解与环境搭建:通过从GitHub下载YOLOv5源代码,并成功配置运行环境,我对PyTorch框架有了更深的理解。在解决依赖项安装过程中的各种问题时,也锻炼了我的问题排查能力。

  2. 图片和视频识别实战:亲手执行图像和视频的目标检测任务,使我对YOLOv5的实际应用有了直观的感受。特别是看到模型能够准确地识别出复杂的场景中的物体,极大地激发了我的学习兴趣。

  3. 技术文档阅读能力提升:在学习过程中,频繁参考Ultralytics官方文档和其他在线资源,我的技术文档阅读能力和快速学习新技能的能力得到了提升。

遇到的挑战与解决方案

  • 环境配置难题:最初在尝试安装requirements.txt中的依赖项时遇到了一些兼容性问题。通过查阅社区讨论、更新Python版本以及创建新的虚拟环境,最终解决了这些问题。
  • 模型优化困惑:在探索不同版本的模型(如yolov5s.ptyolov5m.pt等)时,对于如何选择适合特定应用场景的模型感到迷茫。经过多次实验对比不同模型的表现,逐渐积累了经验。
http://www.xdnf.cn/news/9045.html

相关文章:

  • 每日算法 -【Swift 算法】字符串转整数算法题详解:myAtoi 实现与正则表达式对比
  • 直线参数方程何时必须化为标准形式 |新高考已删
  • golang channel 的特点、原理及使用场景
  • 人工智能 - Magentic-UI与Browser Use 技术选型
  • C++基础算法————递推
  • Neural Blind Deconvolution Using Deep Priors论文阅读
  • 【Dify系列教程重置精品版】第十章:Dify与RAG
  • Guard Trace 值得吗?
  • 3.python操作mysql数据库
  • 切换目录大全
  • Voice Conversion语音转换
  • PHP:赋能Web开发的经典语言与未来演进
  • XSS跨站脚本攻击的原理、危害与防御
  • 基于PDF流式渲染的Word文档在线预览技术
  • 用MMdetection框架训练自己的数据集(全流程实战)
  • GitAny - 無需登入的 GitHub 最新倉庫檢索工具
  • AbMole| Erastin(571203-78-6,M2679,铁死亡诱导剂)
  • 基于MATLAB的大规模MIMO信道仿真
  • 系统架构中的限流算法(一)
  • 两个Ubuntu机器,设置共享目录实时同步
  • React的单向数据绑定
  • 力扣热题-有向图中最大颜色值
  • 二十八、面向对象底层逻辑-SpringMVC九大组件之ViewResolver接口设计
  • ASCII码对应表
  • call的作用是什么,为什么要使用它?
  • AI工具使用的最佳实践,如何通过AI工具提高创作与工作效率
  • react基础知识(下)
  • A-9 OpenCasCade读取STEP文件中的NURBS曲面
  • 知道Metasploit 吗?
  • C 语言学习笔记(指针6)