当前位置: 首页 > news >正文

Top-p采样:解锁语言模型的创意之门

Top - p采样 是什么:核采样:排序,累计到0.7,随机选择

在自然语言生成和大规模语言模型推理中,Top - p采样(又叫核采样,Nucleus Sampling)是一种基于累积概率的采样策略。

Top - p介绍

Top - p中的p是一个概率阈值,取值范围是0到1。它表示在生成文本时,从概率分布中选择累计概率大于或等于p的最小词集,然后从这个词集中随机选择一个词作为输出。
例如,如果p = 0.7,那么模型会从概率分布中选出累计概率达到0.7的那些词,然后从中随机挑选一个作为下一个生成的词。较低的p值会使模型更倾向于选择最可能的词,生成的文本更可预测和重复;较高的p值则会让模型考虑更大的词集,生成的文本更多样和有创意。

原理:排序,累计到0.7,随机选择

  • 概率排序与累积:模型在生成每个词时,会先对词汇表中的所有词计算一个概率分布(通常通过Softmax函数得到)。将这些词按照概率从核采样,然后依次累加这些词的概率,直到累加的概率大于或等于设定的p值为止,此时所包含的词就构成了用于采样的候选词集
  • 随机采样:从得到的候选词集中,按照它们各自的概率进行随机采样,选择其中一个词作为生成的结果。
http://www.xdnf.cn/news/466129.html

相关文章:

  • Da14531蓝牙特征值1读没有回调解决
  • 掌握Multi-Agent实践(七):基于AgentScope分布式模式实现多智能体高效协作[并行加速大模型辅助搜索、分布式多用户协同辩论赛]
  • 基于智能推荐的就业平台的设计与实现(招聘系统)(SpringBoot Thymeleaf)+文档
  • 鸿蒙OSUniApp 制作简洁高效的标签云组件#三方框架 #Uniapp
  • [吾爱出品] 中医问诊辅助记录软件
  • Missashe考研日记—Day37-Day43
  • SAP ABAP 中驼峰字段名转 JSON 的实现方案
  • DG-3F三指机械灵巧手,3手指和12关节,单爪即可实现最高效率
  • 1.1 认识编程与C++
  • 7、MinIO服务器简介与安装
  • Figma 新手教程学习笔记
  • 高项-逻辑数据模型
  • 【数字图像处理】半开卷复习提纲
  • C40-指针
  • 在线文档管理系统 spring boot➕vue|源码+数据库+部署教程
  • 用vlookup函数根据基因名查找基因对应的CNV数据
  • Scratch作品 | 3D原野漫游
  • 班会内容模板
  • Obsidian Callouts标注框语法
  • 从卡顿到丝滑:JavaScript性能优化实战秘籍
  • 人大金仓数据库 与django结合
  • 【BotSharp详细介绍——一步步实现MCP+LLM的聊天问答实例】
  • 火山引擎发展方向
  • 虚拟网络编辑器
  • ArcGIS Pro地块图斑顺序编号(手绘线顺序快速编号)-004
  • InforSuite AS 可以发布django和vue项目是否可行
  • 机器学习笔记3
  • C++核心编程--3 函数提高
  • AAC 协议
  • 计量——异方差的检验及其修正