当前位置: 首页 > backend >正文

Sklearn 机器学习 数值指标 entropy熵函数

💖亲爱的技术爱好者们,热烈欢迎来到 Kant2048 的博客!我是 Thomas Kant,很开心能在CSDN上与你们相遇~💖

在这里插入图片描述

本博客的精华专栏:
【自动化测试】 【测试经验】 【人工智能】 【Python】


在这里插入图片描述

Sklearn 机器学习中的数值指标:Entropy 熵函数详解

在构建机器学习模型,特别是决策树(Decision Tree)时,我们经常会遇到一个关键性的数值指标:Entropy 熵。它是信息论中的核心概念,在评估模型中每个划分点的信息增益时起到了重要作用。

本文将带你深入理解熵函数的定义、数学推导、在 Sklearn 中的实际作用,并辅以代码示例帮助你快速掌握它的实际应用。


📘 一、什么是 Entropy(熵)?

在信息论中,熵(Entropy)表示系统的不确定性或信息的混乱程度。由香农(Claude Shannon)提出的熵公式被广泛应用于机器学习的特征划分。

设有一个离散随机变量 X X X,它有 n n n 个可能的取值 { x 1 , x 2 , . . . , x n } \{x_1, x_2, ..., x_n\} { x1,x2,...,xn},其概率分布为 P ( x i ) P(x_i) P(xi),则熵定义为:

H ( X ) = − ∑ i = 1 n P ( x i ) log ⁡ 2 P ( x i ) H(X) = - \sum_{i=1}^n P(x_i) \log_2 P(x_i) H(X)=i=1

http://www.xdnf.cn/news/16297.html

相关文章:

  • Qt 与 WebService 交互开发
  • 配置nodejs
  • 【CTF-WEB-SQL】SQL注入基本流程-错误注入(sql-labs的Less5)(updatexml)
  • DOM元素添加技巧全解析
  • 如果在分支A上修改了内容,想要提交更新内容的话,如何与develop上的主分支的最新的代码拉齐
  • 面试问题总结——关于OpenCV(二)
  • GStreamer与OpenCV集成
  • 网络基础19--OSPF路由业务多区域
  • 解决VSCode中Github Copilot无法登陆的问题
  • HTTPS的基本理解以及加密流程
  • 掌握JavaScript函数封装与作用域
  • 学习随笔录
  • C#与C++交互开发系列(二十四):WinForms 应用中嵌入C++ 原生窗体
  • 达梦[-2894]:间隔表达式与分区列类型不匹配
  • [硬件电路-93]:模拟器件 - 晶体管的静态工作点,让晶体管工作在其放大电路舞台的中央!!!
  • MyBatis Plus 对数据表常用注解
  • ​机器学习从入门到实践:算法、特征工程与模型评估详解
  • 计算机中的单位(详细易懂)
  • 关于数据库表id自增问题
  • MySQL存储引擎深度解析与实战指南
  • 告别虚函数性能焦虑:深入剖析C++多态的现代设计模式
  • 数组相关学习
  • 基于深度学习的胸部 X 光图像肺炎分类系统(五)
  • 解决笔记本合盖开盖DPI缩放大小变 (异于网传方法,Win11 24H2)
  • 20分钟学会TypeScript
  • 若依框架 ---一套快速开发平台
  • 从零本地部署使用Qwen3-coder进行编程
  • NX848NX854美光固态闪存NX861NX864
  • Dockerfile 文件及指令详解
  • Java面试题及详细答案120道之(001-020)