提示词工程框架:CoT、ToT、GoT、PoT( 链式提示)
提示词工程框架:CoT、ToT、GoT、PoT
- 1、提示词工程
- 1. **Zero-Shot(零样本提示)**
- 2. **Few-Shot(少样本提示)**
- 关键区别
- 2、工程框架( 链式提示Chain)
- 3、COT思维链(Chain of Thought)
- 4、CoT、ToT、GoT、PoT
- **1. CoT(Chain of Thought,思维链)**
- **定义**
- **核心方法**
- **应用场景**
- **优势**
- **2. ToT(Tree of Thought,思维树)**
- **定义**
- **核心方法**
- **应用场景**
- **优势**
- **3. GoT(Graph of Thought,思维图)**
- **定义**
- **核心方法**
- **应用场景**
- **优势**
- **4. PoT(Plan of Thought,思维规划)**
- **定义**
- **核心方法**
- **应用场景**
- **优势**
- **对比总结**
- **实践建议**
- 5、DeepSeekMath论文参考
- 6、分类汇总( 提示词工程框架)
- 汇总1
- 汇总2
- 一、技术演进路径分类
- 1. 直接提示(Prompt)
- 2. 链式提示(Chain)
- 3. 图谱提示(Graph)
- 4. 生成类提示(Generate)
- 5. 集成式提示(Integrate)
- 二、功能与应用分类
- 1. 逻辑与顺序处理
- 2. 上下文理解与记忆
- 3. 特异性与针对性
- 4. 元认知与自我反思
- 5. 多模态与跨学科
- 三、结构化模板分类
- 1. 任务分解型框架
- 2. 交互引导型框架
- 3. 验证优化型框架
- 四、企业级架构分类
- 1. 分层提示架构
- 2. 安全增强范式
- 五、工具与生态分类
- 1. 检索增强生成(RAG)
- 2. 智能体(Agent)
- 六、最新趋势与前沿技术
- 选择指南
- 汇总3
- **一、按设计原则分类**
- **二、按结构化程度分类**
- **三、按任务场景分类**
- **四、高级优化技术**
- **五、选择框架的建议**
- 汇总4
- **一、结构化提示框架**
- **1. CLEVER框架**
- **2. ICIO框架**
- **3. BROKE框架**
- **4. RASCEF框架**
- **二、推理增强框架**
- **1. 思维链(Chain-of-Thought, CoT)**
- **2. 自洽性提示(Self-Consistency)**
- **3. 工具增强提示(Tool-Augmented Prompting)**
- **三、优化与控制框架**
- **1. 提示调优(Prompt Tuning)**
- **2. 动态提示(Dynamic Prompting)**
- **3. 约束导向提示**
- **四、评估与监控框架**
- **1. 自动化评估工具**
- **2. 多维度评估指标**
- **五、领域专用框架**
- **1. 多模态提示**
- **2. 医疗/法律领域框架**
- **六、新兴趋势与挑战**
- **1. 自动化提示生成**
- **2. 隐私与安全**
- **3. 提示工程的工程化**
- **总结**
- 汇总5
- **1. ICIO 框架**
- **2. CRISPE 框架**
- **3. BROKE 框架**
- **4. RASCEF 框架**
- **5. CO-STAR 框架**
- **6. RODES 框架**
- **总结与对比**
- **选择建议**
1、提示词工程
提示词工程(Prompt Engineering) 是指通过设计、优化与语言模型(如 ChatGPT、豆包等)交互的提示词(Prompt),引导模型生成更精准、符合预期的输出的技术。它是充分发挥大语言模型能力的关键技能,广泛应用于内容生成、代码开发、数据分析、教育辅助等领域。
提示词工程中的 Zero-Shot 和 Few-Shot 是两种核心方法,以下通过简单示例说明:
1. Zero-Shot(零样本提示)
- 定义:直接向模型提出任务,不提供任何示例或步骤指导,仅依赖模型的预训练知识完成任务 。
- 示例:
提示词:"将以下英文句子翻译成中文:'Hello, how are you?'"
模型输出:"你好,最近怎么样?"
此场景中,模型未获得任何翻译示例,仅通过自身知识完成任务 。
2. Few-Shot(少样本提示)
- 定义:在提示词中提供少量任务示例,帮助模型理解任务逻辑并生成答案 。
- 示例:
提示词:
任务:将英文句子翻译成中文。
示例1:输入"I love NLP" → 输出"我热爱自然语言处理"
示例2:输入"AI is fun" → 输出"人工智能很有趣"
现在翻译:'LangChain is powerful'
模型输出:"LangChain 很强大"
这里通过提供2个示例,模型能更准确地学习翻译模式 。
关键区别
- Zero-Shot 依赖模型的通用知识,适合简单任务;
- Few-Shot 通过示例降低任务理解难度,适合复杂或特定场景 。
2、工程框架( 链式提示Chain)
提示词工程框架( 链式提示Chain)
其他提示词工程框架,思维链CoT主要是线性的,多个推理步骤连成一个链条。在思维链基础上,又衍生出ToT、GoT、PoT等多种推理模式。这些和CoT一样都属于提示词工程的范畴。CoT、ToT、GoT、PoT等提示词工程框架大幅提升了大模型的推理能力,让我们能够使用大模型解决更多复杂问题,提升了大模型的可解释性和可控性,为大模型应用的拓展奠定了基础。
参考:https://blog.csdn.net/kaka0722ww/article/details/147950677
3、COT思维链(Chain of Thought)
COT详细原理参考:CoT论文笔记
2022 年 Google 论文《Chain-of-Thought Prompting Elicits Reasoning in Large Language Models》中首次提出,通过让大模型逐步参与将一个复杂问题分解为一步一步的子问题并依次进行求解的过程可以显著提升大模型的性能。而这些推理的中间步骤就被称为思维链(Chain of Thought)。
思维链提示(CoT Prompting),在少样本提示中加入自然语言推理步骤(如“先计算…再相加…”),将问题分解为中间步骤,引导模型生成连贯推理路径。
-
示例:标准提示仅给“问题-答案”,思维链提示增加“问题-推理步骤-答案”(如)。
-
区别于传统的 Prompt 从输入直接到输出的映射 <input——>output> 的方式,CoT 完成了从输入到思维链再到输出的映射,即 <input——>reasoning chain——>output>。如果将使用 CoT 的 Prompt 进行分解,可以更加详细的观察到 CoT 的工作流程。
-
示例对比(传统 vs. CoT)
-
传统提示
问题:1个书架有3层,每层放5本书,共有多少本书? 答案:15本
-
CoT 提示
问题:1个书架有3层,每层放5本书,共有多少本书? 推理: 1. 每层5本书,3层的总书数 = 5 × 3 2. 5 × 3 = 15 答案:15本
-
关键类型
-
零样本思维链(Zero-Shot CoT)
无需示例,仅通过提示词(如“请分步骤思考”)触发模型生成思维链。适用于快速引导模型进行推理。 -
少样本思维链(Few-Shot CoT)
提供少量带思维链的示例,让模型模仿示例结构进行推理。例如,先给出几个问题及其分解步骤,再让模型处理新问题。
如图所示,一个完整的包含 CoT 的 Prompt 往往由指令(Instruction),逻辑依据(Rationale),示例(Exemplars)三部分组成。一般而言指令用于描述问题并且告知大模型的输出格式,逻辑依据即指 CoT 的中间推理过程,可以包含问题的解决方案、中间推理步骤以及与问题相关的任何外部知识,而示例则指以少样本的方式为大模型提供输入输出对的基本格式,每一个示例都包含:问题,推理过程与答案。
以是否包含示例为区分,可以将 CoT 分为 Zero-Shot-CoT 与 Few-Shot-CoT,在上图中,Zero-Shot-CoT 不添加示例而仅仅在指令中添加一行经典的“Let’s think step by step”,就可以“唤醒”大模型的推理能力。而 Few-Shot-Cot 则在示例中详细描述了“解题步骤”,让大模型照猫画虎得到推理能力。
提示词工程框架( 链式提示Chain):其他提示词工程框架,思维链CoT主要是线性的,多个推理步骤连成一个链条。在思维链基础上,又衍生出ToT、GoT、PoT等多种推理模式。这些和CoT一样都属于提示词工程的范畴。CoT、ToT、GoT、PoT等提示词工程框架大幅提升了大模型的推理能力,让我们能够使用大模型解决更多复杂问题,提升了大模型的可解释性和可控性,为大模型应用的拓展奠定了基础。
参考:
https://blog.csdn.net/kaka0722ww/article/details/147950677
https://www.zhihu.com/tardis/zm/art/670907685?source_id=1005
4、CoT、ToT、GoT、PoT
在提示词工程(Prompt Engineering)领域,CoT、ToT、GoT、PoT 是近年来提出的重要框架,用于提升大语言模型(LLM)在复杂任务中的推理能力。它们通过结构化的提示设计,引导模型生成更具逻辑性、系统性的思考过程。以下是对这些框架的详细解析:
1. CoT(Chain of Thought,思维链)
定义
通过提示引导模型将复杂问题拆解为分步推理链条,逐步推导答案,而非直接给出结论。核心思想是让模型显式表达“思考过程”,类似人类解决问题时的逐步分析。
核心方法
- 提示词结构:在问题后添加引导词,如
“让我们一步步思考...”
、“首先,分析问题...其次...”
。 - 示例驱动:通过示例展示分步推理过程(如数学题解答步骤),让模型模仿。
- 变种:
- Self-Ask:模型通过自我提问逐步澄清问题(如“我需要先确定X,再验证Y”)。
- Few-Shot CoT:提供少量带推理链的示例,引导模型生成类似逻辑。
应用场景
- 数学推理、逻辑谜题、常识问答:如解决“鸡兔同笼”问题时,分步计算头数和脚数。
- 代码生成:拆解编程任务为模块设计、算法选择、代码编写步骤。
优势
- 提升模型对复杂问题的理解能力,减少“跳跃性错误”。
- 增强结果的可解释性,便于人类追溯推理漏洞。
2. ToT(Tree of Thought,思维树)
定义
将问题求解视为树状搜索过程:模型生成多个可能的解题路径(分支),对每条路径的中间结果进行评估,选择最优分支继续探索,直至找到答案。类似“广度优先搜索”或“深度优先搜索”。
核心方法
- 多路径生成:提示模型列出多种可能的解题思路(如“可能的解法有A、B、C…”)。
- 状态评估:对每个中间状态(如推理到某一步的结论)进行打分,筛选高潜力路径(可结合人类反馈或模型自身评估)。
- 递归搜索:对选中的分支继续展开子节点,直至达到终止条件(如得出答案或无法继续)。
应用场景
- 需要探索多种可能性的任务:如拼图游戏、围棋策略、科学假设验证。
- 开放式问题:如创意写作(生成多个故事走向并评估)、复杂决策(对比不同方案的利弊)。
优势
- 避免单一思维链的局限性,通过并行探索提升解题成功率。
- 适用于存在多个可行解的场景,可优化答案质量。
3. GoT(Graph of Thought,思维图)
定义
将问题拆解为图结构,节点代表关键概念或中间结论,边代表概念间的关系(如因果关系、依赖关系)。模型通过遍历图节点,整合多源信息进行推理。
核心方法
- 知识图谱集成:结合外部知识图谱(如Wikidata),将问题与图谱中的实体关联。
- 多跳推理:通过“节点-边-节点”的路径跳转,完成跨领域知识整合(如“历史事件→经济影响→社会文化变化”)。
- 提示词设计:引导模型显式构建概念关系图,例如“列出与X相关的所有因素,并标注它们的关联强度”。
应用场景
- 复杂知识推理:如历史事件分析(多方因素如何相互作用导致结果)、科学理论推导。
- 跨领域问答:如“气候变化对农业经济的影响”需整合气候学、经济学、社会学知识。
优势
- 支持处理多维度、非线性的复杂关系,适合需要全局视角的任务。
- 可扩展性强,易于整合外部知识库。
4. PoT(Plan of Thought,思维规划)
定义
强调预先制定解决问题的总体规划,将任务分解为明确的阶段或子目标,按计划逐步执行。类似于项目管理中的WBS(工作分解结构)。
核心方法
- 分层规划:将任务分为高层目标(如“完成市场分析报告”)和低层子任务(如“数据收集→趋势分析→结论撰写”)。
- 时序约束:提示模型考虑任务的时间顺序和依赖关系(如“必须先完成A,才能进行B”)。
- 动态调整:在执行过程中根据反馈优化计划(如遇到障碍时切换子任务顺序)。
应用场景
- 长文本生成:如撰写论文时,先规划大纲(引言→文献综述→方法论→结论),再填充内容。
- 多步骤操作:如机器人指令规划(“第一步移动至A点,第二步抓取物体,第三步运输至B点”)。
优势
- 提升任务执行的条理性,减少冗余或遗漏。
- 适合需要分阶段完成的复杂任务,降低认知负荷。
对比总结
框架 | 核心逻辑 | 结构特点 | 适用任务类型 | 典型场景 |
---|---|---|---|---|
CoT | 线性分步推理 | 链式结构 | 单路径、逐步推导问题 | 数学题、逻辑推理 |
ToT | 多路径搜索与评估 | 树状结构 | 多解探索、需全局优化的问题 | 游戏策略、创意生成 |
GoT | 图结构关系整合 | 网状结构 | 多维度关联、跨领域推理问题 | 知识图谱问答、复杂因果分析 |
PoT | 分层规划与任务分解 | 层级结构 | 分阶段执行、时序依赖问题 | 项目管理、长文本生成 |
框架对比与适用场景
框架 | 结构特点 | 优势场景 | 典型应用案例 |
---|---|---|---|
CoT | 线性链式 | 数学推理、分步逻辑问题 | 计算苹果数量变化 |
ToT | 树状多分支 | 创意生成、多方案决策 | 广告活动策划 |
GoT | 有向图(任意结构) | 复杂任务分解、信息融合 | 文档合并、排序优化 |
PoT | 可执行程序 | 数值计算、代码生成 | 数学公式求解 |
总结与趋势
- CoT仍是基础范式,尤其适合教育、逻辑推理场景。
- GoT凭借图结构的灵活性,成为处理复杂任务的新标杆,可能逐步取代ToT。
- PoT在需要高精度计算的领域(如工程、金融)具有不可替代性。
- 未来趋势:结合多框架优势(如GoT+PoT)设计混合型提示策略,或开发自动化提示生成工具(如网页3中的ROCE框架)。
实践建议
- 简单问题:优先使用CoT,保持推理的简洁性。
- 开放问题:尝试ToT,探索多种可能性后再收敛答案。
- 复杂知识问题:结合GoT,利用外部知识图谱增强推理深度。
- 长流程任务:采用PoT,确保任务按计划有序推进。
这些框架可单独使用,也可组合(如ToT+CoT:在树状路径中嵌入分步推理),具体需根据任务特性灵活设计提示词。
5、DeepSeekMath论文参考
COT论文地址:https://arxiv.org/abs/2201.11903
[Submitted on 28 Jan 2022 (v1), last revised 10 Jan 2023 (this version, v6)]
We construct a mathematical instruction-tuning dataset covering
English and Chinese problems from different mathematical fields and of
varying complexity levels: problems are paired with solutions in
chain-of-thought (CoT) (Wei et al., 2022), program-of-thought (PoT)
(Chen et al.,2022; Gao et al., 2023), and tool-integrated reasoning
format (Gou et al., 2023). The total number of training examples is
776K.
我们构建了一个涵盖不同数学领域和不同复杂程度的中英文数学问题的指令微调数据集:这些问题与思维链(CoT)(Wei等人,2022)、程序思维(PoT)(Chen等人,2022;Gao等人,2023)和工具集成推理格式(Gou等人,2023)的解决方案配对。训练示例总数为77.6万。
COT:
J. Wei, X. Wang, D. Schuurmans, M. Bosma, B. Ichter, F. Xia, E. H. Chi, Q. V. Le, and D. Zhou.
Chain-of-thought prompting elicits reasoning in large language models. In NeurIPS, 2022.
URL http://papers.nips.cc/paper_files/paper/2022/hash/9d5609613524ecf
4f15af0f7b31abca4-Abstract-Conference.html.
程序思维(PoT):
W. Chen, X. Ma, X. Wang, and W. W. Cohen. Program of thoughts prompting: Disentangling
computation from reasoning for numerical reasoning tasks. CoRR, abs/2211.12588, 2022. doi:
10.48550/ARXIV.2211.12588. URL https://doi.org/10.48550/arXiv.2211.12588.
L. Gao, A. Madaan, S. Zhou, U. Alon, P. Liu, Y. Yang, J. Callan, and G. Neubig. PAL: program-aided language models. In A. Krause, E. Brunskill, K. Cho, B. Engelhardt, S. Sabato, and J. Scarlett, editors, International Conference on Machine Learning, ICML 2023, 23-29 July 2023, Honolulu, Hawaii, USA , volume 202 of Proceedings of Machine Learning Research,pages 10764–10799. PMLR, 2023. URL https://proceedings.mlr.press/v202/gao23f.html.
工具集成推理格式:
Z. Gou, Z. Shao, Y. Gong, Y. Shen, Y. Yang, M. Huang, N. Duan, and W. Chen. Tora: A tool-integrated reasoning agent for mathematical problem solving. CoRR, abs/2309.17452, 2023.doi: 10.48550/ARXIV.2309.17452. URL https://doi.org/10.48550/arXiv.2309.17452.
6、分类汇总( 提示词工程框架)
汇总1
以下是LLM提示词工程框架的分类汇总,结合不同技术特点和应用场景进行系统性梳理:
一、基础提示框架分类
-
单一提示技术
• Zero-Shot:仅通过自然语言指令引导模型完成任务• One-Shot/Few-Shot:提供1个或多个示例辅助模型理解任务
• Chain of Thought (CoT):通过分解推理步骤提升复杂问题解决能力
• Program-Aided Language Models (PAL):结合代码逻辑扩展推理链
-
多重提示技术
• 投票排名:如自我一致性(Self-Consistency),通过多路径推理投票选择最优解• 分而治之:包括提示链(Prompt Chain)、Least-to-Most提示等任务拆解策略
• 自我评估:如思维树(Tree of Thought, ToT),允许模型回溯并验证推理路径
二、结构化提示框架
-
经典方法论框架
• ICIO框架:包含指令(Instruction)、背景(Context)、输入数据(Input Data)、输出指示器(Output Indicator)• CRISPE框架:涵盖角色(Role)、背景(Insight)、任务(Statement)、格式(Personality)、实验(Experiment)
• BROKE框架:聚焦背景(Background)、角色(Role)、目标(Objectives)、关键结果(Key Result)、迭代优化(Evolve)
• RASCEF框架:整合角色(Role)、行动(Action)、步骤(Script)、上下文(Content)、示例(Example)、格式(Format)
-
动态增强框架
• RAG(检索增强生成):结合外部知识库优化输出准确性• Agent框架:如Reflexion(自我反思)、ReAct(推理-行动循环)
三、推理路径优化框架
-
链式推理技术
• CoT-SC(思维链自洽性):多推理路径的一致性验证• Tree of Thought (ToT):树状结构探索多分支推理
• Graph of Thought (GoT):图结构实现非线性推理聚合
-
算法化推理技术
• Algorithm of Thought (AoT):模拟深度/广度优先搜索算法• Skeleton of Thought (SoT):首先生成逻辑框架再填充细节
• Program of Thoughts (PoT):通过代码生成实现数学推理
四、应用场景导向分类
-
内容生成优化
• 定向激励提示:通过关键词引导生成方向• 知识生成提示:先生成相关知识再整合输出
-
系统交互增强
• LangChain工具链:集成外部工具实现多模态处理• AutoGPT框架:自主任务分解与迭代
五、进阶融合技术
-
多模态提示工程
• 结合图像/音频等非文本信息构建推理链• 如视频生成中的场景描述-风格迁移-动态控制框架
-
自动化优化技术
• Automatic Prompt Engineer:通过LLM自动生成和筛选提示• 强化反馈提示:基于用户反馈迭代优化提示策略
- 引用说明
- 单一/多重提示技术分类(来源:CSDN博客《LLM提示工程技术分类》)
- 结构化框架ICIO/CRISPE/BROKE(来源:CSDN博客《提示词4大经典框架》)
- 18种框架及Agent应用(来源:WayToAGI《与知识库对话》)
- 链式思维与生成知识策略(来源:CSDN博客《LLM高阶应用指令工程》)
- 推理路径框架对比(来源:CSDN博客《提示工程16种方式》)
- 链式/图谱/生成类提示(来源:CSDN博客《提示工程分类解析》)
- 系统指令与角色框架(来源:博客《玩转LLM大模型》)
如需具体案例或某类框架的详细实现方法,可进一步提供应用场景以便针对性说明。
汇总2
以下是当前主流的LLM提示词工程框架分类汇总,结合技术演进路径、功能特性和应用场景进行结构化梳理:
一、技术演进路径分类
1. 直接提示(Prompt)
- 核心特征:通过指令设计直接引导模型输出,不依赖复杂推理链。
- 子类技术:
- 零样本提示(Zero-shot):仅通过自然语言指令触发模型能力,如“将以下文本分类为积极或消极:[文本]”。
- 少样本提示(Few-shot):提供1-5个示例引导模型理解任务格式,适用于领域知识迁移(如法律文书解析)。
- 方向性刺激提示(Directional Stimulus):通过关键词约束生成方向,例如在医疗场景中限定输出为“基于循证医学的建议”。
- ReAct框架:结合推理(Reasoning)与行动(Action),通过外部工具调用(如API)补充信息,例如调用天气API生成旅行建议。
2. 链式提示(Chain)
- 核心特征:通过多步骤推理链拆解复杂任务,提升可解释性。
- 子类技术:
- 思维链(CoT):强制模型生成中间推理步骤,显著提升数学、逻辑任务准确率(如数学应用题)。
- 多模态思维链:融合文本、图像等多模态信息进行推理,例如分析医学影像时结合报告文本。
- 思维树(ToT):允许模型探索多个推理路径并自我评估,适用于创意写作、路径规划等开放性任务。
3. 图谱提示(Graph)
- 核心特征:基于知识图谱或结构化数据引导模型推理。
- 应用场景:人物关系分析、犯罪线索推理、复杂事件时间线构建。
4. 生成类提示(Generate)
- 核心特征:通过生成中间知识或提示词优化模型表现。
- 子类技术:
- 自动提示工程(APE):利用模型自动生成候选提示并评估,例如通过遗传算法优化提示词。
- 知识生成提示(Generate Knowledge):先生成相关背景知识再整合到回答中,提升常识推理准确性。
5. 集成式提示(Integrate)
- 核心特征:融合多种技术或工具形成闭环系统。
- 典型框架:
- RAG-MCP:结合检索增强生成(RAG)与模型上下文协议(MCP),动态选择外部工具(如数据库、API),适用于实时数据处理。
- Agent系统:如Reflexion框架,通过语言反馈强化模型决策,在编程、客服等需要多轮交互的场景中表现突出。
二、功能与应用分类
1. 逻辑与顺序处理
- 技术:思维链(CoT)、程序辅助语言模型(PAL)、最少到最多提示(Least-to-Most)。
- 场景:数学证明、代码调试、法律条文解析。
2. 上下文理解与记忆
- 技术:动态上下文提示(DynaPrompt)、多阶段校验框架(CO-STAR)。
- 场景:长对话管理、个性化推荐、实时交互系统(如AI客服)。
3. 特异性与针对性
- 技术:角色提示(Role Prompting)、领域限定提示(如医疗CRISPE框架)。
- 场景:专业写作(学术论文、商业报告)、垂直领域问答(金融、医疗)。
4. 元认知与自我反思
- 技术:自洽性提示(Self-consistency)、反思框架(Reflexion)。
- 场景:创意内容生成(小说、广告)、复杂决策支持(投资策略、政策制定)。
5. 多模态与跨学科
- 技术:多模态思维链、图文联合提示。
- 场景:教育课件生成(结合图表与文字)、艺术创作(图像描述+文本续写)。
三、结构化模板分类
1. 任务分解型框架
- APE框架:行动(Action)-目的(Purpose)-期望(Expectation),适用于目标明确的任务(如营销方案设计)。
- BROKE框架:背景(Background)-角色(Role)-目标(Objectives)-关键结果(Key Results)-演变(Evolve),结合OKR方法论,适合项目管理类任务。
2. 交互引导型框架
- CHAT框架:角色(Character)-背景(History)-目标(Aim)-任务(Task),强化对话连贯性,适用于客服、心理咨询。
- CRISPE框架:能力(Capacity)-角色(Role)-洞察(Insight)-任务(Statement)-个性(Personality),注重输出风格控制,适合创意写作。
3. 验证优化型框架
- COAST框架:背景(Context)-目标(Objectives)-行动(Action)-支持(Support)-技术(Technology),强调资源整合与可行性分析,适合技术方案设计。
- TRACE框架:任务(Task)-规则(Rule)-辅助(Assist)-检查(Check)-评估(Evaluate),内置防错机制,适用于技术文档生成。
四、企业级架构分类
1. 分层提示架构
- Google白皮书分类:
- 系统提示:定义任务全局目标(如“你是一名专业律师”)。
- 角色提示:细化模型行为(如“用简洁的法律术语回答”)。
- 上下文提示:注入特定领域知识(如“根据最新《民法典》条款”)。
2. 安全增强范式
- 技术:对抗性提示检测、动态伦理约束框架。
- 应用:金融风控(避免泄露敏感数据)、医疗咨询(确保合规性)。
五、工具与生态分类
1. 检索增强生成(RAG)
- 技术:结合向量数据库检索外部知识,提升事实性回答准确性,如企业知识库问答。
2. 智能体(Agent)
- 框架:ReAct(推理+行动)、Reflexion(语言反馈强化)。
- 场景:多步骤任务执行(旅行规划、代码开发)。
六、最新趋势与前沿技术
- 多模态提示标准化:跨文本、图像、代码的统一指令体系,如医疗诊断系统结合X光片与报告文本。
- 自动化工具链:通过APE技术自动生成、评估提示词,降低人工成本。
- 动态伦理约束:在提示中嵌入合规性检查模块,如法律文书生成时自动校验GDPR条款。
选择指南
- 简单任务:优先使用零样本/少样本提示或结构化模板(如APE、CHAT)。
- 复杂推理:采用思维链、思维树或RAG-MCP框架。
- 专业领域:结合垂直领域框架(如Med-CRISPE)和角色提示。
- 企业级应用:参考Google分层架构,构建提示中台并集成安全增强模块。
通过以上分类体系,开发者可根据任务需求、模型能力和资源条件灵活选择或组合提示词工程框架,最大化LLM的应用价值。
汇总3
以下是大型语言模型(LLM)提示词工程(Prompt Engineering)框架的分类汇总,涵盖主流方法论及核心设计原则,帮助系统性优化提示词效果:
一、按设计原则分类
-
CRISPE框架
- Context(背景):明确任务背景和上下文
- Role(角色):定义LLM需扮演的角色
- Instruction(指令):具体操作步骤或要求
- Style(风格):输出内容的语言风格(如专业、简洁、幽默)
- Purpose(目标):最终需达成的目标
- Examples(示例):提供示例辅助理解
-
BROKE框架
- Background(背景):任务背景信息
- Role(角色):LLM的角色定义
- Objective(目标):核心目标
- Key Result(关键结果):期望的具体输出形式
- Evolve(迭代):根据反馈持续优化提示词
-
RASCE框架
- Role(角色)
- Action(动作):LLM需执行的动作
- Steps(步骤):分步骤指令
- Context(上下文)
- Examples(示例)
二、按结构化程度分类
-
零样本提示(Zero-Shot Prompting)
- 直接提问,无需示例(如:“请总结以下文本:”)
- 适用场景:简单任务、通用性问题
-
小样本提示(Few-Shot Prompting)
- 提供少量示例引导模型理解模式
- 示例:
示例1:输入:[文本A],输出:[总结A] 示例2:输入:[文本B],输出:[总结B] 任务:输入:[文本C],输出:___
-
思维链(Chain-of-Thought, CoT)
- 要求模型分步骤推理(如:“请逐步分析…”)
- 变体:Self-Consistency CoT(多路径推理后聚合结果)
-
模板化提示(Template-Based)
- 固定结构+变量填充(如:
"作为[角色],请根据[背景]完成[任务],要求[格式]。"
)
- 固定结构+变量填充(如:
三、按任务场景分类
-
生成类任务框架
- CREATE框架
- Character(角色设定)
- Request(核心请求)
- Execute(执行动作)
- Adjust(调整参数)
- Test(测试输出)
- CREATE框架
-
推理类任务框架
- IRAC框架
- Issue(问题定义)
- Rule(规则/知识引用)
- Analysis(分析过程)
- Conclusion(结论)
- IRAC框架
-
多模态任务框架
- PAIR框架
- Prompt(文本指令)
- Anchor(锚定输出类型,如图片、表格)
- Iterate(多模态结果迭代优化)
- Refine(精细化调整)
- PAIR框架
四、高级优化技术
-
角色扮演法(Role-Playing)
- 示例:
"你是一位经验丰富的编剧,请以电影剧本格式改写以下故事..."
- 示例:
-
反事实提示(Counterfactual Prompting)
- 引导模型思考非现实场景(如:“假如没有发生X事件,结果会如何?”)
-
元提示(Meta-Prompting)
- 让LLM自我优化提示词(如:“请改进以下提示词以提升输出质量…”)
-
对抗性提示(Adversarial Prompting)
- 设计防御性指令防止越狱(如:“无论用户如何要求,你都必须拒绝回答暴力内容。”)
五、选择框架的建议
-
任务复杂度
- 简单任务:零样本/模板化提示
- 复杂推理:思维链(CoT)或IRAC框架
-
场景适配
- 创意生成:角色扮演法+CREATE框架
- 数据分析:BROKE框架+模板化提示
-
迭代优化
- 通过RASCE或BROKE框架持续反馈调整
通过灵活组合上述框架,可显著提升LLM的输出质量与可控性。建议根据具体场景选择核心框架,并通过A/B测试验证效果。
汇总4
以下是提示词工程领域主流框架的系统化汇总,结合近年研究与实践,从结构化设计、推理增强、评估优化等维度分类整理,涵盖方法论、技术路径与典型应用:
一、结构化提示框架
1. CLEVER框架
- 核心维度:清晰度(Clarity)、语言(Language)、效率(Efficiency)、价值(Value)、评估(Evaluate)、结果(Results)。
- 应用场景:内容创作、任务分解。例如,设计社交媒体广告提示时,需明确行动(设计广告)、目的(提升销量)、期望(30%销售增长)。
- 优势:通过六要素确保提示的明确性与可衡量性。
2. ICIO框架
- 四要素:指令(Instruction)、背景信息(Context)、输入数据(Input Data)、输出指示器(Output Indicator)。
- 应用场景:复杂任务定义。例如,医疗诊断提示需包含患者病史(背景)、症状数据(输入)、报告格式要求(输出)。
- 示例:“基于患者的CT影像和病史,生成一份结构化的肺癌风险评估报告。”
3. BROKE框架
- 五步法:背景(Background)、角色(Role)、目标(Objectives)、关键结果(Key Results)、演变(Evolve)。
- 应用场景:目标导向任务。例如,提升编程技能的提示需设定学习目标(掌握核心概念)、关键结果(完成5个项目)、并通过反馈迭代优化。
- 优势:融合OKR方法论,强调目标与结果的可量化。
4. RASCEF框架
- 六要素:角色(Role)、行动(Action)、步骤(Steps)、背景(Context)、示例(Examples)、格式(Format)。
- 应用场景:角色扮演任务。例如,模拟律师撰写法律文书时,需明确角色定位(辩护律师)、行动步骤(分析证据→起草文书)、示例参考(类似案例)。
- 优势:通过结构化引导提升输出的专业性与一致性。
二、推理增强框架
1. 思维链(Chain-of-Thought, CoT)
- 核心机制:分步推导,显性化中间推理过程。例如,数学题“5-2+3”的思维链为“5-2=3→3+3=6”。
- 变体:
- 零样本CoT:仅用提示词触发推理(如“请逐步分析”)。
- 少样本CoT:提供示例引导(如“问题→步骤→答案”模板)。
- 应用场景:数学推理、逻辑分析。
2. 自洽性提示(Self-Consistency)
- 技术路径:生成多条思维链,通过投票选择最优答案。例如,生成3种解题路径,选择覆盖率最高的结论。
- 优势:降低单一路径错误风险,提升复杂任务准确率。
3. 工具增强提示(Tool-Augmented Prompting)
- 技术融合:结合外部工具(计算器、搜索引擎、数据库)补充推理能力。例如,查询实时数据时提示“请调用API获取最新股价数据”。
- 典型框架:检索增强生成(RAG),通过向量数据库检索上下文信息注入提示,提升事实准确性。
三、优化与控制框架
1. 提示调优(Prompt Tuning)
- 技术路径:通过微调连续提示向量适配特定任务,如前缀调优(Prefix Tuning)。
- 框架示例:
- RAPT:隐私保护型提示调优框架,采用本地差分隐私保护用户数据,同时引入词元重构任务提升性能。
- MAPS:自适应提示优化系统,通过多样性引导、错误反思、领域知识整合自动生成高质量提示,测试用例覆盖率提升超30%。
2. 动态提示(Dynamic Prompting)
- 核心思想:根据模型输出动态调整提示策略。例如,若模型生成偏离预期,自动追加约束条件(如“请重新回答,确保不超过100字”)。
- 应用场景:多轮对话、实时反馈场景。
3. 约束导向提示
- 设计原则:明确输出限制(如格式、长度、情感倾向)。例如,“用正式语气撰写邮件,分点列出建议”。
- 技术实现:结合正则表达式或XML标签(如)分隔内容。
四、评估与监控框架
1. 自动化评估工具
- Helicone:开源平台,支持提示版本管理、实验对比、性能分析,提供自定义评估器与生产数据随机采样。
- OpenAI Eval:标准化评估框架,支持数据集驱动测试与模型基准对比,适合严谨的学术研究。
2. 多维度评估指标
- 准确性:答案与真实结果的匹配度(如数学题正确率)。
- 多样性:生成内容的语义差异(如使用编辑距离与余弦相似度混合评分)。
- 效率:生成速度与资源消耗(如token数、推理时间)。
五、领域专用框架
1. 多模态提示
- 技术路径:结合文本与图像、语音等模态。例如,“根据以下图片描述一场婚礼场景”。
- 应用场景:创意写作、视觉-语言任务。
2. 医疗/法律领域框架
- CRISPE框架:强调角色设定(如医生)、背景信息(病史)、任务描述(诊断建议)、格式要求(结构化报告)。
- 优势:提升专业领域输出的可信度与合规性。
六、新兴趋势与挑战
1. 自动化提示生成
- 代表框架:MAPS系统通过迭代优化自动生成提示,减少人工设计成本。
- 发展方向:结合强化学习与元学习,实现自适应提示优化。
2. 隐私与安全
- 解决方案:RAPT框架通过本地差分隐私保护用户数据,同时保证模型性能。
- 挑战:平衡隐私保护与模型泛化能力。
3. 提示工程的工程化
- 工具链整合:LangChain、LlamaIndex等框架支持提示与外部工具的链式调用,提升复杂任务处理效率。
- 最佳实践:
- 清晰性:避免歧义,明确任务目标。
- 示例引导:提供高质量样例减少模型误解。
- 迭代优化:通过A/B测试对比提示效果。
总结
提示词工程框架从早期的结构化设计(如BROKE、ICIO)逐步发展到推理增强(CoT、RAG)、自动化优化(MAPS)和领域专用(医疗CRISPE),反映了从手工调优到系统工程的演进。未来,随着LLM应用的深化,框架将更注重多模态融合、隐私保护与自动化评估,推动提示工程从艺术走向科学。开发者需根据任务特性选择适配框架,并结合工具链实现高效落地。
汇总5
以下是当前主流的提示词工程框架及其核心要素、适用场景和案例的汇总,结合了多个权威来源的实践总结:
1. ICIO 框架
核心要素:
- Instruction(任务):明确AI需要完成的具体任务(如翻译、写作)。
- Context(背景):提供任务相关的上下文信息(如使用场景、目标受众)。
- Input Data(输入数据):指定需要处理的具体数据(如待翻译的文本)。
- Output Indicator(输出格式):定义输出的风格、格式或类型(如正式商务英语)。
适用场景:
- 数据转换(文本翻译、清洗)、内容创作(报告、文案)、技术任务(代码生成)。
案例:
任务:将法文段落翻译为商务英文
背景:用于公司年度报告,面向股东和投资者
输入:“La croissance économique…”
输出要求:正式、无语法错误,保留原意。
2. CRISPE 框架
核心要素:
- Capacity and Role(角色):设定AI的角色(如数学老师)。
- Insight(背景):提供角色扮演的上下文(如学生年龄、学习环境)。
- Statement(任务):具体任务描述(如解答数学问题)。
- Personality(格式):回答的风格(如友好、鼓励性语言)。
- Experiment(实验):请求多个示例或变体。
适用场景:
- 角色模拟(教师、顾问)、个性化互动(幽默/正式语气)、多样化输出(多方案生成)。
案例:
角色:小学数学老师
背景:辅导10岁儿童
任务:解释分数加减法,提供两种解题方法。
3. BROKE 框架
核心要素:
- Background(背景):项目或任务的背景信息。
- Role(角色):AI需扮演的角色(如项目经理)。
- Objectives(目标):明确任务目标(如制定项目计划)。
- Key Result(关键结果):输出的格式要求(如甘特图)。
- Evolve(改进):根据反馈迭代优化。
适用场景:
- 项目管理(资源分配)、创意设计(多轮优化)、数据分析(动态调整)。
案例:
背景:开发中小企业财务软件
目标:制定含风险管理计划的项目甘特图
改进机制:每两周更新计划。
4. RASCEF 框架
核心要素:
- Role(角色):定义AI身份(如营销专家)。
- Action(行动):具体任务(如制定邮件策略)。
- Script(步骤):分步骤流程(如分析受众→设计内容)。
- Content(上下文):背景信息(如公司定位)。
- Example(示例):输出示例(如健康饮食推文)。
- Format(格式):指定结构(如列表、段落)。
适用场景:
- 专业咨询(营销策略)、流程管理(项目管理)、标准化输出(模板化内容)。
案例:
角色:邮件营销专家
行动:设计健康食品品牌推广策略
步骤:分析受众→策划内容→跟踪反馈。
5. CO-STAR 框架
核心要素:
- Context(上下文):任务背景。
- Objective(目标):明确核心任务。
- Style(风格):模仿特定写作风格。
- Tone(语气):情感基调(正式/幽默)。
- Audience(受众):目标用户群体。
- Response(回复格式):输出结构(如列表、报告)。
适用场景:
- 广告文案、社交媒体内容、个性化报告。
案例:
目标:撰写吹风机Facebook广告
受众:年轻女性
风格:模仿苹果文案的简洁科技感。
6. RODES 框架
核心要素:
- Role(角色):详细定义AI身份(如病毒推文作家)。
- Objective(目标):具体任务(如撰写280字推文)。
- Details(细节):约束条件(如禁用表情符号)。
- Examples(示例):输入-输出范例。
- Sense Check(感知检查):确认AI理解需求。
适用场景:
- 社交媒体运营、创意内容生成、新手友好型提示设计。
案例:
角色:世界级推文写手
细节:使用“令人兴奋”等形容词
示例:输入“环保产品”→输出强调可持续性的文案。
总结与对比
框架 | 核心特点 | 适用领域 |
---|---|---|
ICIO | 任务明确、格式标准化 | 技术任务、翻译、报告 |
CRISPE | 角色扮演、多方案生成 | 教育、咨询、个性化互动 |
BROKE | 动态优化、项目管理导向 | 长期项目、数据分析 |
RASCEF | 流程化步骤、全面结构化 | 专业咨询、复杂流程管理 |
CO-STAR | 多维度定制(风格/受众) | 广告、社交媒体 |
RODES | 新手友好、强调示例与反馈 | 创意内容、标准化输出 |
选择建议
- 技术任务:优先使用ICIO或BROKE,确保逻辑清晰。
- 创意内容:CRISPE或RODES更适合角色化、风格化需求。
- 复杂流程:RASCEF和CO-STAR提供结构化支持。
如需进一步探索框架细节或应用案例,可参考具体来源(如网页1、3、7、8)。