当前位置: 首页 > news >正文

模型各个参数详解

1.maxContext:最大上下文长度

(1)大模型(如 ChatGPT、Claude 等)能同时“记住”并处理的文本长度上限。
(2)最大上下文长度 ≈ 模型的“记忆力容量”:容量越大,能同时处理的信息越多。
(3)当你的问题+历史对话超过这个值时,模型会将超出的部分截断。

2.maxResponse: 最大回复

(1)maxResponse:模型一次性回复输出的最大token数。

3.quoteMaxToken: 最大引用内容

(1)quoteMaxToken:模型在回复中,能引用的知识库内容的最大token数。

4.maxTemperature:最大温度

(1)maxTemperature:温度越低回答越严谨,少废话。

5.记忆轮数(仅简易模式) link

可以配置模型支持的记忆轮数,如果模型的超出上下文,系统会自动截断,尽可能保证不超模型上下文。

所以尽管配置 30 轮对话,实际运行时候,不一定会达到 30 轮。

5.函数调用

支持函数调用的模型,在使用工具时更加准确。

6.回复上限

最大回复 token 数量。注意,是回复的Tokens!不是上下文 tokens。

通常,回复上限=min(模型允许的最大回复上限, 最大上下文-已用上下文)

所以,一般配置模型时,不会把最大上下文配置成模型实际最大上下文,而是预留预定空间给回答,例如 128k 模型,可以配置 max_context=115000

max_tokens: 限制的是模型在生成回复时最多可以输出的 token 数量

http://www.xdnf.cn/news/630307.html

相关文章:

  • Aciviti工作流
  • 【栈OJ题解】有效的括号
  • 6个月Python学习计划 Day 3
  • 力扣热题——查找包含给定字符的单词
  • 多模态智能体架构
  • 236.二叉树的最近公共祖先
  • Day35打卡 @浙大疏锦行
  • 深度解析NL2SQL:从语义理解到工程实践的全链路探索
  • DC-DC电路的自举电容电路原理
  • Linux(7)——进程(概念篇)
  • 介绍一下什么是反射(面试题详细讲解)
  • VBA 读取指定范围内的单元格数据,生成csv文件
  • 英语学习5.24
  • Java中是值传递还是引用传递 ?
  • vue2中el-table 实现前端分页
  • 5.Java 面向对象编程入门:类与对象的创建和使用​
  • uint8_t是什么数据类型?
  • WSL 基础命令
  • 整平机实战手册:从参数调试到工艺优化的全流程指南
  • “天启” AI 技术演进任重道远
  • 为什么我输入对了密码,还是不能用 su 切换到 root?
  • 推荐系统里真的存在“反馈循环”吗?
  • WordPress多语言插件安装与使用教程
  • 2025年电工杯数学建模B题【垃圾运输】原创论文分享
  • 医学影像科研概述与研究伦理
  • [软件测试_4] 沟通技巧 | 测试用例 | 设计方法
  • 大模型推理 memory bandwidth bound (5) - Medusa
  • 一本通1307:【例1.3】高精度乘法 1308:【例1.5】高精除
  • 矩阵乘法--Python
  • Linux—进程池实现