当前位置: 首页 > news >正文

使用YOLOv11实现水果类别检测:从数据到模型训练的全过程

项目背景

在日常生活中,水果的类别识别直接影响库存管理和质量控制。传统检测依赖人工,效率低下且主观。通过计算机视觉,我们可以自动化这个过程。YOLO系列模型以其速度和准确性闻名,这次我使用YOLOv11n进行训练,目标是检测31种水果类别,包括苹果、香蕉、橙子等。

数据集来源于公开来源,图像标注为YOLO格式,包含训练、验证和测试集。nc=31,names包括’fresh_apple’到’rotten_tomato’等。
在这里插入图片描述

方法步骤

  1. 数据准备:数据集已准备好,包含标注图像。

在这里插入图片描述

  1. 模型训练:使用训练脚本,配置YOLO数据。训练参数:epochs=50, batch=16, imgsz=640。

    以下是训练脚本的主要代码:

    from ultralytics import YOLO
    import os
    import glob
    import torchdef main():model = YOLO('models/yolo11n.pt')yaml_path = 'data/data.yaml'results = model.train(data=yaml_path, epochs=50, batch=16, imgsz=640, name='yolo11n_fruit', project='fruit_results')print("Training completed. Results saved in:", results.save_dir)if __name__ == '__main__':main()
    

    训练命令:python train_fire_smoke_tassel.py

    结果保存在fruit_results/yolo11n_fruit_20250716_210401

在这里插入图片描述

  1. 模型验证:使用test_saved_model.py验证,加载best.pt模型。

    以下是验证脚本的主要代码:

    from ultralytics import YOLO
    import os
    import globdef main():yaml_path = 'data/data.yaml'results_dir = 'fruit_results'latest_run = max(glob.glob(os.path.join(results_dir, 'yolo11n_fruit_*')), key=os.path.getmtime)model_path = os.path.join(latest_run, 'weights', 'best.pt')model = YOLO(model_path)metrics = model.val(data=yaml_path)print(f"Validation metrics: {metrics}")if __name__ == '__main__':main()
    

    关键指标:

    • mAP50: 0.709
    • mAP50-95: 0.421
    • Precision: 0.675
    • Recall: 0.715

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

结果分析

在这里插入图片描述

模型在验证集上表现不错,mAP50达0.709,表示中等难度下的检测准确。Recall较高,意味着漏检少,适合实际应用。但mAP50-95较低,说明小目标或复杂背景需优化。

预测示例:

在这里插入图片描述

未来改进

  • 增加数据增强,提升鲁棒性。
  • 尝试更大模型如YOLOv11m。
  • 部署到移动端,实现实时检测。
http://www.xdnf.cn/news/1135027.html

相关文章:

  • 【SpringBoot】实战-开发接口-用户-注册
  • Java—异常Exception
  • 【技术追踪】基于检测器引导的对抗性扩散攻击器实现定向假阳性合成——提升息肉检测的鲁棒性(MICCAI-2025)
  • github上传大文件(多种解决方案)
  • Buffer Pool
  • 分布式系统高可用性设计 - 监控与日志系统
  • 能行为监测算法:低成本下的高效管理
  • LVS集群调度器
  • Python高级编程技巧探讨:装饰器、Patch与语法糖详解
  • 第六章 OBProxy 路由与使用运维
  • rLLM:用于LLM Agent RL后训练的创新框架
  • Git版本控制完全指南:从入门到精通
  • Nginx,MD5和Knife4j
  • NLP:LSTM和GRU分享
  • 人工智能之数学基础:神经网络之多样本矩阵参数求导
  • C++ - 仿 RabbitMQ 实现消息队列--sqlite与gtest快速上手
  • 光纤基础知识
  • lua(xlua)基础知识点记录一
  • IIS-网站报500.19错误代码0x8007000d问题解决
  • “重复”定义函数的睿智(Python/与ai助手“智普清言”深度交流)
  • Java后端开发核心笔记:分层架构、注解与面向对象精髓
  • java解析word文档
  • Linux 716 数据库迁移
  • x86版Ubuntu的容器中运行ARM版Ubuntu
  • 零基础学Vue3组件化开发
  • 统计功效是什么?
  • VR 污水厂初体验:颠覆传统认知​
  • 广州 VR 森林防火系统功能探究​
  • AI应用核心转向Context Engineering
  • 在UE中如何操作视图的大小,方位,移动