当前位置: 首页 > news >正文

【Prompt Engineering】摸索出的一些小套路


prompt 优化方法


🔹 1. 通用结构模板

模块化的Prompt:Prompt 划分成边界清晰的模块,不同模块间都应有明确的分隔符

以下是通用 Prompt 的推荐结构:

[角色设定] + [任务描述] + [输出格式要求] + [补充上下文]
  • 角色设定:你是谁,你具有什么能力
  • 任务描述:你要做什么
  • 输出格式:输出应具备哪些结构或样式
  • 补充上下文:提供背景信息、数据或参考材料

例如:

你是一个资深 Python 程序员。请根据以下描述编写一个函数,用于统计文本中的单词频率,输出格式为 JSON。

🔹 2. 提示词增强技巧(Prompt Engineering)

Few-shot 学习

Few-shot Learning 就是通过给模型提供一组输入输出示例,让它模仿这种任务格式和风格。

大模型具有强大的上下文学习能力,这种特性意味着,如果能提供一些例子,模型就能捕捉到:输入与输出之间的关系、输出风格、语言习惯、甚至某些隐藏规则。

示例越典型,模型理解越精准

编写模板

【任务说明】
输入:示例输入1
输出:示例输出1输入:示例输入2
输出:示例输出2

示例

新闻分类任务

你是一个新闻分类器,请根据新闻内容判断类别(财经、体育、娱乐、科技)。输入:苹果公司发布了新款iPhone,并表示将加大在AI方面的投入。
输出:科技输入:中国男篮在昨晚的比赛中击败对手,晋级决赛。
输出:体育输入:《流浪地球2》票房突破30亿,导演表示将推出新作。
输出:娱乐

🛠️适用场景

需要特定输出格式的情景

应用方向Few-shot 用法
文本分类情感、话题、意图识别等
格式转换JSON ↔ Markdown、摘要生成
内容创作模仿特定写作风格
数据提取从文档中提取结构化信息

🔬与其他方式对比

方法特点举例数量优点缺点
Zero-shot无示例,仅靠任务描述0最简单容易理解错任务
One-shot提供1个示例1增强上下文理解效果不稳定
Few-shot提供2-5个示例2-5效果好,灵活性强Prompt可能变长
Fine-tune用训练数据真正训练模型最精准成本高、慢、需部署
Chain of Thought(思维链提示)

是一种引导逐步思考逐步推理的提示方法,不直接要求模型给出答案,而是要求说出过程,再给出结论。

大模型擅长“语言生成”,但不一定能一步到位给出正确的结论,通过提示“一步一步来” 可以增强逻辑性、降低错误率、提高复杂任务的推理能力。

✅ 别直接说答案!
✅ 先说出为什么怎么做,一步步来。

编写模板

【任务说明】
问题:{你的问题}
请一步一步地思考:

示例

数学应用题

问题:如果一个苹果2元,一个橘子3元,我买了2个苹果和3个橘子,一共花了多少钱?
请一步一步思考:1. 每个苹果2元,买了2个苹果,所以花了 2 × 2 = 4 元;
2. 每个橘子3元,买了3个橘子,所以花了 3 × 3 = 9 元;
3. 总共花了 4 + 9 = 13 元。答案:13元

🛠️ 适用场景

场景CoT用途
数学题引导步骤推导
阅读理解逐句分析推断
内容生成分段创作流程
自我反思提示(Let’s Verify Prompting)

让模型对自己刚刚生成的答案进行检查验证、修改或反思。让语言模型从“生产者”变成“审查者”。

模型本身不具备“信心机制”和“错误感知”,回答完后就认为自己做完了。所以通过“回头看一眼”的方法,可以得到更合理的回答。

✅ 本质上就是告诉模型:
“你别急着结束,自己再检查一下你刚才说的有没有问题。”

编写模板

问题:{问题内容}第一步:请先尝试解答:
...第二步:现在请检查你的推理步骤,看看是否有错误或可以优化的地方:
...最终确认答案是:
...

简单直接一些,可以直接加上下面一段话

请先回答问题,然后重新检查你的回答,指出是否有错误,并给出最终确认的答案。你刚才的答案是否完全正确?请仔细复查你的每一步推理过程,并指出可能的错误或模糊之处。

示例

结合思维链版本

问题:一个班有30个学生,其中12人是女生。男生人数是多少?第一步,尝试解答:
总人数是30人,其中女生是12人,所以男生人数是 30 - 12 = 18 人。
初步答案:18人。第二步,检查这个推理是否有问题:
步骤合理,30减去12确实等于18,逻辑也符合题意。最终确认答案是:18人。

Multi-Constraint Prompting (多任务约束)

在prompt中同时引入多个明确的目标、要求、或限制条件,促使模型在多个“任务”之间权衡、协调并满足所有约束。

在实际应用中,需求往往是复杂的、叠加的,而不是单一任务。比如:希望模型不仅“答题”,还要符合输出风格、控制长度、避免某些词。

可以理解为:
“不是只问一个问题,而是让它同时考虑多个要求,像一个带着多重 KPI 的任务指令。”

编写模板

请你完成以下任务,满足所有的约束条件:任务目标:{主任务说明}
约束条件:
1. {约束1,例如“输出不得超过150字”}
2. {约束2,例如“必须使用比喻或类比”}
3. {约束3,例如“风格需保持幽默与轻松”}
...请确保你输出的内容严格满足以上所有要求。

直接简单的写法

请写一个不超过150字的励志小故事,使用比喻手法,并保持语气轻松幽默。

示例

请写一个关于时间管理的小建议,要求:
1. 不超过50字
2. 使用类比或比喻
3. 风格要轻松幽默,适合年轻人阅读

Tree of Thought (ToT) Prompting(思维树提示)

“Tree of Thought (ToT) Prompting”(思维树提示)是一种高级的提示词设计方法,它模仿人类“多路径思考”过程,而非简单的一步一步思考, 让大语言模型(如 GPT-4)以树状结构展开推理过程,在每一步探索多个可能选项,并在后续进行评估和选择,从而得到更优结果。

✨ 在每一步产生多个候选思路
➕ 每条思路继续展开多个可能的后续步骤
🧠 最终选择或组合最优路径。

编写结构

你将尝试解决一个复杂问题。请遵循以下步骤:
1. 在每一步,列出多个可能的思路/选项(例如3个)。
2. 对每个思路进行简要分析。
3. 选择最优思路继续展开下一步(或保留多个分支并继续)。
4. 重复该过程,直到达到最终结论。
5. 最后总结整体推理路径和结论。

示例

你是一个资深商业顾问,现在要为一家 AI 教育平台设计盈利模式。请使用思维树法进行推理:1. 第一步:列出3种可能的商业模式(如订阅、按次计费、企业授权等),并简要说明优劣。
2. 第二步:对每种模式展开3个实施方式(例如定价层级、用户类型、平台结构)。
3. 对比不同分支的可行性、市场潜力、风险,选择1-2个最优路径继续深入。
4. 最后总结推荐的盈利方案,并说明你是如何一步步筛选和推理得到的。请以逻辑树的方式展示每一步推理过程。

🔬适用场景

场景用法
🧩复杂决策问题多路径推理、策略评估
✍️内容创作(多构思)多主题发展、情节探索
💼产品/商业策略分析多方案评估与选择
🔎科学研究与假设推演提出多个假设并进行逐步验证
总结
技巧名称核心作用是否适合组合使用关键词提示
Few-shot 示例提高任务理解与风格模仿“输入/输出示例”、“模仿格式”
Chain of Thought引导逻辑推理、减少错误率“一步一步思考”、“推导过程”
Let’s Verify自我校验与增强鲁棒性“请检查是否正确”、“是否存在错误”
Multi-Constraint处理多重要求或风格限制“请满足以下所有条件”
Tree of Thought多路径探索与评估最优解⚠️(适合单独用)“请列出多个方案”、“分析优劣”
http://www.xdnf.cn/news/686017.html

相关文章:

  • 弱光环境下如何手持相机拍摄静物:摄影曝光之等效曝光认知
  • 【Android笔记】记一次 CMake 构建 Filament Android 库的完整排错过程(安卓交叉编译、CMake、Ninja)
  • GC1267F:单相全波风扇电机预驱动芯片解析
  • 如何发布npm包?
  • 国标GB28181视频平台EasyGBS视频实时监控:打造城市环境监控全场景解决方案
  • LeetCode 1871. 跳跃游戏 VII(中等)
  • EasyRTC嵌入式音视频实时通话SDK助力AI与IoT智能硬件打造音视频交互多场景应用
  • 力扣热题100之二叉树的中序遍历
  • 【掌握文件操作】(下):文件的顺序读写、文件的随机读写、文件读取结束的判定、文件缓冲区
  • 【开源工具】跳过网页APP禁止粘贴限制:自动输入键盘模拟工具
  • day12 leetcode-hot100-21(矩阵4)
  • MySQL XtraBackup---笔记
  • 初识Docker:容器化技术的入门指南
  • 关于JavaScript、TypeScript Module的配置和用法
  • Vue 3.0 状态管理Pinia详解
  • JWT安全:接收无签名令牌.【签名算法设置为none绕过验证】
  • 生成式AI与AI代理:技术、应用与未来
  • 《仿盒马》app开发技术分享-- 订单地址修改(端云一体)
  • 全局代理从局域到全域的网络升级
  • 华为AP6050DN无线接入点瘦模式转胖模式
  • 常见的C语言段错误实例及原因分析
  • Java开发——三层架构,分层耦合
  • 【C++指南】C++ list容器完全解读(二):list模拟实现,底层架构揭秘
  • vue2指令方式防抖功能
  • 征程 6X VDSP 调试方法
  • ​​全球购订单查询接口开放:ERP自动同步实战手册​
  • 程序员出海之英语-基础-小猪佩奇 第 1 季第 1 集 泥坑
  • LMEval ,谷歌开源的统一评估多模态AI模型框架
  • MySQL省市区数据表
  • 基于BERT和GPT2的实现来理解Transformer的结构和原理