当前位置: 首页 > java >正文

机器学习基础理论 - 分类问题评估指标

几个定义:混淆矩阵

  • TP: True Positives, 表示实际为正例且被分类器判定为正例的样本数
  • FP: False Positives, 表示实际为负例且被分类器判定为正例的样本数
  • FN: False Negatives, 表示实际为正例但被分类器判定为负例的样本数
  • TN: True Negatives, 表示实际为负例且被分类器判定为负例的样本数

一个小技巧, 第一个字母表示划分正确与否, T 表示判定正确(判定正确), F表示判定错误(False); 第二个字母表示分类器判定结果, P表示判定为正例, N表示判定为负例。

几个常规的指标

Accuracy: $$ accuracy = \frac{TP + TN}{TP + FP + FN + TN}= \frac{正确预测的样本数}{所有的样本数} \ $$ Accuracy 能够清晰的判断我们模型的表现,但有一个严重的缺陷: 在正负样本不均衡的情况下,占比大的类别往往会成为影响 Accuracy 的最主要因素,此时的 Accuracy 并不能很好的反映模型的整体情况。

Precision: $$ Precision = \frac{TP}{TP + FP} \ Precision = \frac{\sum_{l=1}^{L}TP_l}{\sum_{l=1}^LTP_l + FP_l} = \frac{\text{label 预测为 l 且预测正确的样本个数}}{\text{label 预测为 l 样本个数}} \ $$ Recall: $$ Recall = \frac{TP}{TP + FN} \ Recall = \frac{\sum_{l=1}^L TP_l}{ \sum_{l=1}^LTP_l + FN_l} = \frac{\text{label 预测为 l 且预测正确的样本个数}}{\text{真实样本中所有 label 为 l 的样本个数}} $$

Precision 与 Recall 的权衡

精确率高,意味着分类器要尽量在 “更有把握” 的情况下才将样本预测为正样本, 这意味着精确率能够很好的体现模型对于负样本的区分能力,精确率越高,则模型对负样本区分能力越强。

召回率高,意味着分类器尽可能将有可能为正样本的样本预测为正样本,这意味着召回率能够很好的体现模型对于正样本的区分能力,召回率越高,则模型对正样本的区分能力越强。

从上面的分析可以看出,精确率与召回率是此消彼长的关系, 如果分类器只把可能性大的样本预测为

http://www.xdnf.cn/news/2355.html

相关文章:

  • 【AI模型学习】GPT——从v1到v3
  • JavaScript输出数据的方法
  • 高并发架构设计之缓存
  • 快速上手 MetaGPT
  • 【Flutter】Flutter + Unity 插件结构与通信接口封装
  • 继续 那个错误分析
  • 机器学习-入门-线性模型(1)
  • 量子纠缠式架构:当微服务同时存在于所有节点时,CAP定理是否依然成立?
  • R中实现数值求导的包numDeriv
  • deepSeek浅谈对vue的mixin的理解,用于什么应用场景?
  • 探索DeepWiki:GitHub源码阅读的变革性工具
  • 从零构建云原生秒杀系统——后端架构与实战
  • Win10安装 P104-100 驱动
  • 衡量矩阵数值稳定性的关键指标:矩阵的条件数
  • Golang | 搜索表达式
  • 【c++】AVL树模拟实现
  • 从基础到实战的量化交易全流程学习:1.3 数学与统计学基础——概率与统计基础 | 基础概念
  • 深入详解人工智能数学基础—概率论-KL散度在变分自编码器(VAE)中的应用
  • 驯龙日记:用Pandas驾驭数据的野性
  • 《2025全球机器学习技术大会:阿里云讲师张玉明深度剖析通义灵码AI程序员》
  • prometheus手动添加k8s集群外的node-exporter监控
  • 国家与省市县 标准地图服务网站 审图号地图下载
  • 【Redis】zset类型
  • 本安型交换机 + TSN:煤矿智能化的关键拼图
  • 2025蓝桥杯省赛网络安全组wp
  • 无人机超声波避障技术要点与难点!
  • 火语言RPA--钉钉群通知
  • 【Web API系列】深入解析 Web Service Worker 中的 WindowClient 接口:原理、实践与进阶应用
  • LCD1602液晶显示屏详解(STM32)
  • Python爬虫(8)Python数据存储实战:JSON文件读写与复杂结构化数据处理指南