当前位置: 首页 > news >正文

大语言模型涉及的一些概念(持续更新)

1、entropy

在自然语言处理(NLP)和机器学习中,entropy(熵)是一个非常重要的概念,来自信息论(Information Theory),本质上是用来衡量“不确定性”或“信息量”的。

通俗理解 Entropy(熵)

熵 = 不确定性 = 随机程度

举例:

  • 如果一个模型输出的概率分布是:
    {"猫": 0.33, "狗": 0.33, "鸟": 0.34}
    → 表示模型非常不确定 → 熵高

  • 如果输出是:
    {"猫": 0.98, "狗": 0.01, "鸟": 0.01}
    → 模型很有把握 → 熵低

2、token

什么是 Token?

Token(标记) 是把文本分割成模型可理解的“最小单位”,可以是:

类型示例描述
单词级 token["I", "am", "happy"]一个词就是一个 token(粗粒度)
子词级 token["un", "happi", "ness"]把词拆成词根+后缀(BPE等方法)
字符级 token["h", "e", "l", "l", "o"]每个字符一个 token(细粒度)

不同模型和 tokenizer 使用不同的分词策略。

 

http://www.xdnf.cn/news/1234297.html

相关文章:

  • Azure DevOps 中的代理
  • 知识点汇集(二)-misc
  • 【数据结构】哈希表实现
  • 数据结构:在链表中插入节点(Inserting in a Linked List)
  • 蛇形卷积介绍
  • AVDTP Media Packet 报文深度解析:蓝牙音频流的幕后功臣
  • Celery-分布式任务队列
  • linux2.6 和 unix-v6 源码实验
  • K8S服务发现原理及开发框架的配合
  • 利用AI渲染技术提升元宇宙用户体验的技术难点有哪些?
  • 语义分割--deeplabV3+
  • Navicat连接远程服务器上的mysql
  • ubuntu24.04安装selenium、chrome、chromedriver
  • elk快速部署、集成、调优
  • [Oracle] TO_DATE()函数
  • 二叉树算法之【前序遍历】
  • GitOps:云原生时代的革命性基础设施管理范式
  • 每日五个pyecharts可视化图表-bars(2)
  • Python Seaborn【数据可视化库】 全面讲解
  • 基于图像识别与分类的中国蛇类识别系统
  • k8s日志收集
  • zookeeper常见命令和常见应用
  • SpringBoot学习总结
  • python学智能算法(三十一)|SVM-Slater条件理解
  • Vim编辑器详解:从入门到高效使用
  • 【Unity】背包系统 + 物品管理窗口 (上)
  • 【一天一个知识点】RAG遇见推理
  • 谷歌开源Agent框架ADK快速入门
  • 前端应用权限设计面面观
  • 防御综合实验