当前位置: 首页 > backend >正文

2025-0803学习记录21——地表分类产品的精度验证

从去年11月开始做地表分类,时至今日竟然发现自己对“分类产品的验证”和“分类器的精度验证”傻傻分不清。


一、地表分类产品精度验证的目的

地表分类产品出来之后,不能只看模型训练时的精度(如训练精度、交叉验证精度),更重要的是验证最终分类图的精度,即:这个图到底准不准

这叫做 “分类图的外部精度验证”,而不是“分类器本身的验证”。

二、常用的精度验证方法

✅ 1. 基于独立验证样本的混淆矩阵(最常用最标准)

📌 原理:

对比“地表分类结果”和“验证点的真实标签”,构建混淆矩阵来评估准确性。

  • 从地面调查、Google Earth高分辨率影像、已有权威LULC数据集中采用与获取训练样本相同的策略,在空间上均匀抽样,随机选取几百到几千个样本作为独立验证样本;

  • 与分类图进行逐点对比,得到混淆矩阵(confusion matrix);

  • 计算指标:

    • 总体精度(Overall Accuracy, OA):所有分类正确的比例;

    • Kappa系数(Kappa):考虑了随机正确的可能性,值越高越可靠;

    • 用户精度(User’s Accuracy, UA):对用户来说,这个类别有多少是对的(预测为A的里面有多少是真A);

    • 制图者精度(Producer’s Accuracy, PA):对制图者来说,A类别有多少被正确分类(真A中有多少被分对了);

    • F1-score:综合考虑精度与召回率;

✅ 适用情况:

  • 有一定数量的高质量独立验证点

  • 对分类图进行严格的定量评估

注意:验证样本的数量最好是每一类不少于30个,总数不少于300。

✅ 2. 与其他产品进行视觉解译对比验证(定性分析)

📌 原理:

通过人眼对比分类结果与高分遥感影像或已有产品的可视图层,观察是否分类合理。

  • 把分类产品和已有高精度LULC产品(如FROM-GLC10、GLC-FCS10等)或高分遥感影像对比;

  • 通过人眼解译典型区域的分类正确性,评价不同地物类型的识别效果;

✅ 优点:

  • 简单直观

  • 适合对典型区域、关键类别做定性分析

😟 局限:

  • 主观性强,不能量化

  • 不适合大范围、复杂类别分析

...同时也要注意,这种方法说服力较差,可能无法受到认可(比如我的Z导和某个期刊的编辑)...

✅ 3. 多源对比验证(定量分析)

📌 原理:

将分类结果与已有权威LULC产品(如FROM-GLC10、GLC-FCS10、MODIS-LULC等)进行对比,看两者在相同区域的一致性。

  • 在Google Earth影像上均匀随机地选取一定量的验证样本,对应着验证样本将自己的分类产品与其他已有LULC产品的进行一致性交叉对比;

📈 可以做的分析包括:

  • 像元一致性比例(相同位置分类一致的比例)

  • 分类差异图(Difference Map)

  • 每类之间的交叉对比矩阵

✅ 优点:

  • 无需地面样本,也能进行大尺度验证

  • 可体现你产品在某些类别上的优势或劣势

😟 局限:

  • 不同产品的分类体系、精度、时间点可能不同,需谨慎解释差异

✅ 4. 空间一致性分析(定性分析)

📌 原理:

分析分类图在空间分布上的合理性,是否符合地貌、坡度、气候、植被生态学规律。

✅ 优点:

  • 用于“可信度检验”和“生态合理性讨论”

  • 可以借助 DEM、Slope、NDVI 等辅助因子分析空间一致性

三、建议使用组合策略

方式是否建议你采用?原因
独立验证点 + 混淆矩阵✅强烈推荐最标准的量化验证
视觉对比解译✅推荐适合展示具体区域的优势
与其他产品对比✅推荐辅助讨论结果差异
空间合理性分析✅推荐用于讨论部分分类差异的解释性

四、“分类产品”和“分类器”精度验证的核心区别

项目分类器的验证(模型精度)分类产品的验证(图像精度)
✅ 验证对象分类器本身(比如SVM、RF的“性能”)最终生成的分类图(地图)
✅ 样本来源来自样本集(训练+测试划分)来自独立于样本集的新数据或外部验证点
✅ 方法交叉验证、留出法(hold-out)、混淆矩阵与真实标签(独立验证点)对比,混淆矩阵、目视解译等
✅ 用途判断模型是否学得好判断“地图”能不能用,有多准

五、举个例子

有1000个样本点,想训练SVM模型。

💻 (1)分类器的验证(模型性能评估)

将1000个样本拆成:

  • 700个用于训练(training)

  • 300个用于测试(testing)

训练了SVM模型后,用那300个测试点来检验分类器的“学得好不好”。

👉 这个测试集来自我们亲手选的样本集。它用来评估“模型学习能力”。

🗺(2)分类产品的验证(分类图的精度)

接下来我们用训练好的SVM模型,把整张影像图都分类了,得到了LULC地图。

我们想知道:

这张图到底准不准?

于是去GE上人工标了500个地物点(或者用FROM-GLC10标注了验证点),这些不是之前模型训练中用过的数据

然后把这300个验证点拿来和分类图比一比,看分类结果对不对,这就是:
👉 最终产品的外部精度验证

http://www.xdnf.cn/news/16867.html

相关文章:

  • MySQL存储过程和触发器
  • 【网络安全】日志文件格式
  • 「源力觉醒 创作者计划」_文心大模型4.5系列开源模型, 从一行代码到一个生态:聊聊开源战略那些事儿,顺便扯扯文心大模型 4.5 的使用心得
  • 题解:P4447 [AHOI2018初中组] 分组
  • ospf综合
  • NX947NX955美光固态闪存NX962NX966
  • C++ STL 组件及其关系:从模块化设计到图形化展示
  • [硬件电路-124]:模拟电路 - 信号处理电路 - 测量系统的前端电路详解
  • HTTP数据请求
  • 【密码学】5. 公钥密码
  • 【Linux】多路转接之epoll
  • pytorch简单理解
  • 幂等性介绍和下单接口幂等性保证实现方案
  • python创建一个excel文件
  • realIADD3复现笔记
  • 【BTC】挖矿难度调整
  • AbstractExecutorService:Java并发核心模板解析
  • 入门MicroPython+ESP32:《点亮LED灯》
  • php完整处理word中表单数据的方法
  • K8S部署ELK(一):部署Filebeat日志收集器
  • Vue3+ts自定义指令
  • Linux 动静态库的制作和使用
  • 笔记:C语言中指向指针的指针作用
  • DyWA:用于可推广的非抓握操作的动态自适应世界动作模型
  • 【高等数学】第七章 微分方程——第七节 常系数齐次线性微分方程
  • UniappDay07
  • 电力系统分析学习笔记(二)- 标幺值计算与变压器建模
  • 基于深度学习的医学图像分析:使用GAN实现医学图像增强
  • 重型机械作业误伤预警响应时间缩短80%!陌讯多模态识别算法在工程现场的应用优化
  • 安卓自动点击器:设置点击周期 / 滑动,抢票、游戏刷日常秒会