当前位置: 首页 > ai >正文

语义熵怎么增强LLM自信心的

语义熵怎么增强LLM自信心的

在这里插入图片描述

一、传统Token熵的问题(先理解“痛点”)

比如模型回答“阿司匹林是否治疗头痛?”→ 输出“是”

  • 传统Token熵:只看“词的概率”,比如“是”这个词的概率特别高(Token熵0.2,数值低说明确定性强 )。
  • 但实际风险:医学场景里,“是”的字面肯定,不代表语义上绝对正确(比如阿司匹林能缓解头痛,但有禁忌症、不能随便用 )。传统Token熵没考虑语义层面的“模糊性、风险”,可能输出看着确定,实际语义上漏洞大。

二、语义熵的核心逻辑(解决什么问题?)

语义熵想干的事:不只看“选了哪个词”,更看“语义是否严谨、有没有隐藏风险”

  • 怎么做?→ 用“核函数”算词之间的语义相似性(比如“缓解”“治疗”“止痛”在语义上是相关的 ),再构建一个“语义密度”的概率分布(类似:哪些语义是模型实际想表达的?有多集中?)。
  • 公式简化理解:
http://www.xdnf.cn/news/15700.html

相关文章:

  • Django母婴商城项目实践(八)- 数据渲染与显示之首页
  • 计算机网络:(十一)多协议标记交换 MPLS
  • 安全隔离新选择:SiLM5768L系列 - 集成互锁功能的高速六通道数字隔离器
  • 用户中心——比如:腾讯的QQ账号可以登录到很多应用当中 01
  • Spring Boot入门
  • Web开发 03
  • k8s快速部署(亲测无坑)
  • 2G和3G网络关闭/退网状态(截止2025年7月)
  • C语言:预处理
  • 苍穹外卖项目日记(day12)
  • A33-vstar报错记录:ERROR: build kernel Failed
  • 【PTA数据结构 | C语言版】我爱背单词
  • 五分钟掌握 TDengine 数据文件的工作原理
  • 鸿蒙开发--端云一体化--云对象
  • C++ 程序设计考量表
  • 人工智能day9——模块化编程概念(模块、包、导入)及常见系统模块总结和第三方模块管理
  • SGLang 推理框架核心组件解析:请求、内存与缓存的协同工作
  • mpiigaze的安装过程一
  • 美团闪购最新版 mtgsig1.2
  • 语音大模型速览(三)- cosyvoice2
  • Maven学习总结(62)—— Maven 打包瘦身和提速解决方案
  • 应急响应-Windows资源监视器
  • HTTPie: 开发者友好的http客户端工具
  • 深度学习零基础入门(3)-图像与神经网络
  • 读书笔记(学会说话)
  • 嵌入式系统内核镜像相关(十六)
  • 数据查找 二叉查找树
  • # Redis-stable 如何在Linux系统上安装和配置
  • java常见的jvm内存分析工具
  • C语言-一维数组,二维数组