当前位置：首页 > news >正文

提示工程实战指南：Google白皮书关键内容一文讲清

news 2025/8/30 13:05:23

You don’t need to be a data scientist or a machine learning engineer – everyone can writea prompt.

一、概述

Google于2025年2月发布的《Prompt Engineering》白皮书系统阐述了提示工程的核心技术、实践方法及挑战应对策略。该文档由Lee Boonstra主编，多位Google工程师与研究人员参与编写，旨在为开发者提供可操作的提示设计框架。文档内容涵盖提示工程基础理论、主流提示技术（如零样本/少样本提示、思维链、自洽性、思维树等）、输出参数配置（温度、Top-K、Top-P等）、最佳实践及生成式AI的局限性分析。文档强调通过结构化迭代、自动化工具与跨团队协作提升提示工程效率，并提供了多场景应用案例。

二、提示工程基础

1. LLM输出配置参数

输出长度：控制生成文本的token数量，需根据任务需求平衡信息完整性和效率。例如，摘要任务可能需要较短输出，而复杂推理需更长文本。
采样控制：
- 温度（Temperature）：值越低（如0.1），输出越确定性；值越高（如1.0），输出更随机。推荐对需要稳定结果的任务（如代码生成）设为0。
- Top-K与Top-P：Top-K从概率最高的K个token中采样，Top-P（核采样）则累积概率超过P时停止。两者结合可平衡多样性与相关性。
注意事项：过高自由度可能导致冗余或“重复循环”问题（如生成重复短语）。需通过实验调整参数。

2. 提示设计原则

简洁性：避免复杂语言与冗余信息。例如，将“我带两个3岁孩子去纽约度假，想找适合的地方”简化为“为带3岁儿童的游客推荐纽约曼哈顿景点”。
明确指令：使用动词引导（如“分类”“生成”“总结”），指定输出格式（如JSON、列表）。
避免约束：优先使用正向指令（如“仅讨论以下内容”）而非负面限制（如“不要涉及X”）。

三、核心提示技术

1. 零样本与少样本提示（Zero-Shot/Few-Shot Prompting）

零样本：直接请求任务，无需示例。例如：“将电影评论分类为正面、中性或负面。”

少样本：通过少量示例引导模型。例如：

输入：评论1: “这部电影太棒了！” → 正面  输入：评论2: “剧情拖沓，演员表现平庸。” → 负面  输入：新评论: “导演手法独特，但节奏过慢。” → ?

优化策略：分类任务中混合不同类别示例，避免模型偏好单一标签。

2. 系统提示与角色提示（System/Role Prompting）

系统提示：定义模型行为边界（如伦理准则、专业领域限制）。
角色提示：赋予模型特定身份（如医生、历史学家），影响其输出风格。例如：“作为营养师，请分析该食谱的健康价值。”

3. 上下文提示（Contextual Prompting）

步骤回退（Step-Back Prompting）：先抽象问题再深入细节。例如，解决数学题时先要求总结解题思路。
思维链（Chain of Thought, CoT）：强制模型分步推理后给出答案。例如：
```
问题：小明有5个苹果，吃掉2个后又买了3个，现在有多少？  推理：初始5个→吃掉2→剩3→买3→共6个。  答案：6。
```
- CoT最佳实践：设置温度为0以确保推理路径稳定；需能从输出中提取独立答案。
自洽性（Self-Consistency）：生成多组推理路径，取最一致的答案。例如，多次询问同一问题，汇总结果以提高准确性。
思维树（Tree of Thoughts, ToT）：允许模型探索多条推理路径并评估最优解，适用于复杂决策（如创意写作或战略规划）。

4. ReAct提示（Reasoning + Acting）

结合推理（Reasoning）与行动（Acting），用于交互式任务（如网页导航或游戏策略）。例如：

推理：需要购买咖啡豆→行动：搜索“有机咖啡豆”→推理：选择评分最高产品→行动：加入购物车。

四、提示工程实践方法

1. 文档化与迭代管理

模板化记录：使用表格追踪提示版本、参数、输出结果及反馈（表1）。例如：

版本提示内容输出反馈
v1.0 分类电影评论 POSITIVE 准确
v1.1 同上+要求JSON输出 {"sentiment": "POSITIVE"} 格式正确
工具支持：在Vertex AI Studio中保存提示并记录链接，便于复用与复现。