当前位置: 首页 > news >正文

【每天一个知识点】熵(Entropy)

熵(Entropy)”是信息论、热力学、机器学习等多个领域的核心概念。它可以用一句话概括为:

🔑 熵表示系统的不确定性或信息混乱程度。


📚 一、信息论中的熵(Information Entropy)

在 Claude Shannon 的信息论中,熵衡量的是消息来源的平均信息量,也可视为我们从一个系统中获得的信息的不确定性。

📐 数学定义(离散情形)

设一个离散随机变量 XX 的概率分布为 p(x)p(x),则其熵定义为:

  • 单位是 bit(比特)

  • 如果某事件越不确定(概率越小),它的信息量越大

  • 如果所有事件概率一致(最混乱),熵最大

🌰 举个例子:

  • 抛一个公平的硬币:

  • 如果硬币总是正面,熵为 0(完全确定)


🔍 二、熵的图解理解

想象你要猜一个盒子里藏的是哪种球:

  • 如果盒子中是 50% 红球 + 50% 蓝球 → 熵高,难猜

  • 如果是 100% 红球 → 熵低,容易猜


📊 三、机器学习中的熵应用

1. 决策树中的信息增益(Information Gain)

  • 熵用来衡量特征对数据分类的不确定性减少程度

  • 决策树(如 ID3、C4.5)使用“熵下降”来选择分裂特征

2. 聚类/聚合中的熵损失

  • 在聚类或分类时,类别越“纯”,熵越小

  • 可用于聚类质量评估、联合聚类中的信息一致性判断

3. 表征多样性、熵正则化

  • 在深度学习中,用熵来鼓励输出分布多样性(如GAN中的判别器)

  • 熵小:模型过度自信;熵大:模型不确定性强


🔁 四、与其他概念对比

概念定义与熵的关系
信息量(Information Content)I(x)=−log⁡p(x)I(x) = -\log p(x)熵是信息量的期望
交叉熵(Cross Entropy)比较两个分布的平均编码代价包含熵 + KL散度
KL散度(相对熵)度量两个分布的差异是熵差的一部分

🧠 五、直观理解

场景熵高还是低?
完全随机的骰子熵高(最大)
只出某一个点的骰子熵低(最小)
80% 是某一个结果熵中等偏低

http://www.xdnf.cn/news/118477.html

相关文章:

  • Redis 核心应用场景
  • Linux 网络基础三 (数据链路层协议:以太网协议、ARP 协议)
  • Linux系统的延迟任务及定时任务
  • 济南国网数字化培训班学习笔记-第二组-6-输电线路现场教学
  • 一个开源且具有直观视觉界面的 API,可实现 DeepSeek 与 SillyTavern 的非官方集成。
  • 关于QT信号、槽、槽函数的讲解
  • Flutter Dart 循环语句 for while do..while break、continue
  • 第二章、安全认证
  • JavaWeb:Web介绍
  • 【Java实战经验】泛型-类型灵活使用与限制
  • 在线地图工具geojson.io
  • 【数据可视化-28】2017-2025 年每月产品零售价数据可视化分析
  • 第53讲 农学科研中的AI伦理与可解释性——探索SHAP值、LIME等可解释工具与科研可信性建设之道
  • 【嵌入式系统设计师(软考中级)】第二章:嵌入式系统硬件基础知识(3)
  • Linux的时间函数
  • 【k8s】k8s是怎么实现自动扩缩的
  • 移动通信行业术语
  • centos7使用yum快速安装最新版本Jenkins-2.462.3
  • 第六章 QT基础:6、QT的Qt 时钟编程
  • C语言编程--15.四数之和
  • Sharding-JDBC 系列专题 - 第十篇:ShardingSphere 生态与未来趋势
  • NLP高频面试题(五十三)——深度学习正则化详解
  • JAVA设计模式——(六)装饰模式(Decorator Pattern)
  • Matlab 复合多层结构的隔声研究
  • 【1区SCI】Fusion entropy融合熵,多尺度,复合多尺度、时移多尺度、层次 + 故障识别、诊断-matlab代码
  • MATLAB 中的图形绘制
  • unity Animation学习,精准控制模型动画播放
  • 【星海出品】Calico研究汇总
  • Flink 源码编译
  • 1、AI及LLM基础:Python语法入门教程