当前位置: 首页 > news >正文

病虫害数据集

数据是泰迪杯主办方提供的已经标记好的数据,4k画质的图片,总大小8个G

链接:https://pan.baidu.com/s/1fvmNHGrLvflEovjfCjDLOw?pwd=6666 
提取码:6666 

虫害包括:

八点灰灯蛾

褐飞虱属

白背飞虱

二化螟

蟋蟀

黄足猎蝽

黄毒蛾

粘虫

 

农田虫害识别优秀作品 

https://www.tipdm.org/u/cms/www/202206/27143450a8sn.pdf 

解决方案

在上述背景研究、问题分析和相关研究的基础之上,我们针对本次农作物害虫识 别任务,采用基于两阶段的目标检测算法 Casecade RCNN 和结合 Swin-Transformer 的 Mask RCNN 算法作为基本框架,进行模型融合,并使用离线数据增强和在线数据增强 组合,以及 SWA(随机权重平均)进一步进行性能的提升。

针对 1.2 提出的四个问题,相应采用以下解决方案:

1) 目前主流的目标检测算法都是基于两阶段的方法(Fast RCNNFaster RCNN、Mask RCNN等)以及一阶段的方法(YOLO系列、SSD等),相比 于对识别速度的要求,农作物害虫检测更偏向于算法识别精确度的要求,故 选用主流的两阶段目标检测方法作为模型:Cascade Mask RCNN ,并使用目 前在目标检测领域效果最好的 Swin-Transformer 模型作为我们的特征提取层。

2) 针对某些类别目标太小以及个别类别样本数目,我们采用 copy and paste 方 法离线数据增强进行扩充数据集,并且采用随机反转、旋转、高斯噪声等在线数据增强进一步在训练之前处理数据集。以及对训练集和测试集数据使用 多尺度进行训练和预测,增加对小目标的识别效果。

3) 为了能更好的提升模型的识别效果,进一步使用每个模型不同的 epoch 的权 值进行 SWA,并把使用两个模型 SWA 后的网络权重的预测结果进行 NMS, 获取模型融合后的检测结果。

对于目标检测,基于深度学习的主流模型大致分为两类:

1)两阶段目标检测算

法:Fast RCNNFaster RCNNMask RCNNCascade Mask RCNN 等,这些方法首先

产生候选区域(region proposals),然后对候选区域进行分类;

2)一阶段检测算法:

不需要 region proposals 阶段,直接产生目标的类别概率和位置坐标值,如 Yolo 系列和

SSD

优缺点分析

优点:

通过对农作物害虫图片的数据集处理和进行数据增强,能够有效的应对长尾 效应和多尺度目标问题;

选择 Resnet50 Cascade Mask RCNN Swin-S Cascade Mask RCNN 作为主要模 型,更能贴合农作物害虫识别的目标检测任务;

采用 K-means 聚类完成锚框长宽比的确定,使用 Smooth L1 损失函数和 Soft NMS,更能符合害虫识别的应用场景;

基于随机权重平均和多模型融合的方法,让网络识别效果更好,缓解误检和 漏检的可能性。

缺点:

由于采用 Swin-S Cascade Mask RCNN Resnet50 Cascade Mask RCNN 两个模 型进行训练,以及采用训练时和测试时的多尺度,导致模型的训练和检测, 需要耗费大量的显存资源以及时间成本;

基于 copy and paste 的数据扩充方法,还是有一定程度存在与背景不符的可能 性,存在少数图片的重叠情况,应该进一步考虑。

 

http://www.xdnf.cn/news/1085509.html

相关文章:

  • 「Windows/Mac OS」AIGC图片生成视频 ,webui + stable-diffusion环境部署教程
  • AI编程才刚起步,对成熟的软件工程师并未带来质变
  • 【学习笔记】大数定理,频率与概率,均值与期望的区别
  • 深入解析TCP:可靠传输的核心机制与实现逻辑(三次握手、四次挥手、流量控制、滑动窗口、拥塞控制、慢启动、延时应答、面向字节流、粘包问题)
  • Java 命令行参数详解:系统属性、JVM 选项与应用配置
  • PCA通过“找最大方差方向”实现降维,本质是用更少的变量捕捉原始数据的主要模式
  • 3S技术+ArcGIS/ENVI全流程实战:水文、气象、灾害、生态、环境及卫生等领域应用
  • 深度学习7(梯度下降算法改进)
  • 使用Ideal创建一个spring boot的helloWorld项目
  • TMC4361A 使用(未验证)
  • 如何排查服务器中已经存在的后门程序?
  • 【应急响应】Linux 自用应急响应工具(LinuxCheckShoot)
  • 接口漏洞怎么抓?Fiddler 中文版 + Postman + Wireshark 实战指南
  • 提示工程(Prompt Engineering)研究进展
  • Camera相机人脸识别系列专题分析之十六:人脸特征检测FFD算法之libcvface_api.so数据结构详细注释解析
  • AWS VPC Peering
  • Linux中程序的limits中的Max open files的配置由哪些参数决定
  • 明星AI自动化测试工具Midscene.js源码解析
  • Pr插件图文安装教程
  • 实用机器学习
  • C盘瘦身 -- 虚拟内存文件 pagefile.sys
  • 华为OD机试 2025B卷 - 字符串加密 (C++ Python JAVA JS C语言)
  • Python实现文件夹中文件名与Excel中存在的文件名进行对比,并进行删除操作
  • 剑指offer第2版:动态规划+记忆化搜索
  • 多表查询~
  • vue3使用summernote
  • OpenStack云平台管理
  • 回溯题解——子集【LeetCode】输入的视角(选或不选)
  • uniapp运行项目到ios基座
  • 【图像与信号处理】基于可微分二值化网络(DBNet)与循环卷积神经网络(CRNN)的电梯铭牌和限速器检验单识别方法