当前位置: 首页 > news >正文

【大模型实战】提示工程(Prompt Engineering)

文章目录

        • 前言
        • 一、五大核心原则
        • 二、基础技巧
          • 1. 明确指令与输出
          • 2. 赋予角色
        • 三、进阶技巧
          • 1. 少样本提示
          • 2. 思维链提示
          • 3. 控制输出长度与格式
        • 四、迭代与优化:提升提示效果的关键
        • 五、提示⼯程最佳实践总结
        • 附言

前言

提示工程是通过优化输入指令(提示词),让 AI 模型更精准、高效地输出符合需求结果的技术方法。

一、五大核心原则
  1. 清晰明确:避免模糊表述,用具体信息(如“新上市”)替代抽象词汇,精准传递意图。
  2. 提供上下文:补充背景信息(如任务的市场定位),帮助模型理解场景。
  3. 指定角色:赋予模型具体身份(如“资深文案”“程序员”),引导输出风格与内容侧重。
  4. 明确任务:清晰说明操作类型(总结/翻译/生成代码等),避免任务模糊。
  5. 规范格式:指定输出形式(列表/JSON/Markdown等),确保结果符合预期。
二、基础技巧
1. 明确指令与输出
  • 反例:宽泛提问(如“讲一下人工智能”)导致输出分散。
  • 正例:用“四要素”组合指令:
    动作动词(解释)+ 范围限定(生成式AI)+ 数量(3个案例)+ 细节(含简要描述)。
2. 赋予角色
  • 原理:通过角色设定(如“网络故障专家”“星际探险家”),约束输出的风格与领域。
  • 技巧:角色描述越细致(含背景、场景),输出越贴合预期,可与其他技巧叠加使用。
三、进阶技巧
1. 少样本提示
  • 定义:提供1-5个输入输出示例,引导模型学习格式或模式。
  • 适用场景:新颖任务或特定格式要求(如小众领域、定制化输出)。
  • 示例
    文本:“食物很美味”→ 情感:正面
    文本:“服务差”→ 情感:负面
2. 思维链提示
  • 定义:引导模型分步推理后再给答案,适用于数学题、逻辑推理等复杂任务。
  • 激活方式:加入指令(如“逐步思考”)或示例展示推理过程。
  • 效果:显著提升难题正确率(如小学六年级以上数学应用题)。
3. 控制输出长度与格式
  • 长度:指定字数(如“100字摘要”)或段落数(如“不超过3段”)。
  • 格式
    • 结构类:列表、表格(Markdown);
    • 数据类:JSON(指定字段);
    • 文档类:Markdown 标题/分点。
四、迭代与优化:提升提示效果的关键

提示⼯程是⼀个持续优化的过程,很少⼀次成功。步骤:

  1. 尝试 (Try): 根据初步想法构建提示并运⾏。
  2. 分析 (Analyze): 评估模型输出是否符合预期。哪⾥好?哪⾥不好?
  3. 调整 (Adjust): 根据分析结果修改提示。
    • 是不是太模糊了?——更具体。
    • 是不是缺少上下⽂?——补充信息。
    • 是不是格式不对?——明确指定格式。
    • 是不是可以给个例⼦?——尝试少样本。
  4. 再尝试 (Retry): ⽤调整后的提示再次运⾏。
    • 关键: 保持耐⼼,从⼩处着⼿修改,记录有效的变化。
五、提示⼯程最佳实践总结
  1. 从简单开始: 先构建简单提示,逐步增加复杂性。
  2. 清晰指令: 你的指令越清晰,得到的结果越好。
  3. 提供上下⽂: 模型不是万能的,必要的背景信息很重要。
  4. 善⽤⻆⾊扮演: 能有效引导输出⻛格和内容。
  5. 利⽤示例 (Few-Shot): 对于复杂或特定格式的任务,示例是强⼤的引导。
  6. 引导思考过程 (CoT): 解决复杂问题时,让模型“思考”出来。
  7. 明确输出要求: 包括⻓度、格式、⻛格等。
  8. 迭代,迭代,再迭代: 不断测试和优化你的提示。
  9. 分解复杂任务: 将⼤任务拆解成⼩任务,分别提示。
  10. 检查模型限制: 了解大模型的能⼒边界和可能的偏好。
附言

有时候也需要学习别人的优秀实践,这里给出一个提示词范例网站如下:
https://smith.langchain.com/hub/
除了向人学习,还可以借助 AI,主动让 AI 优化你的提示词,实现“自我驱动”。

http://www.xdnf.cn/news/1183519.html

相关文章:

  • Tomcat线程池深度优化指南:高并发场景下的maxConnections计算与监控体系
  • 门店管理智能体,为连锁运营开出健康“处方” 智睿视界
  • DeepSeek FlashMLA 技术拆解,AI 推理迎来颠覆性突破
  • [linux]Haproxy七层代理
  • [实战] 用1 PPS 驯服本地恒温晶振(OCXO/TCXO)
  • Kubernetes深度解析:企业级容器编排平台的核心实践
  • Android 10.0 sts CtsSecurityBulletinHostTestCases的相关异常分析
  • 力扣 hot100 Day55
  • JAVA知识点(六):性能调优与线上问题排查
  • 多场景通用车辆计数算法助力暑期交通管理
  • [LeetCode]每日温度
  • Photon v0.3.0 基于Aria2免费开源轻量级多线程不限速下载器
  • Linux 桌面市场份额突破 5%:开源生态的里程碑与未来启示
  • 云原生介绍
  • Qt 状态机框架:复杂交互逻辑的处理
  • 滚动提示组件
  • JavaScript 数组的 every() 和 some() 方法使用
  • Microsoft-DNN NTLM暴露漏洞复现(CVE-2025-52488)
  • JAVA知识点(三):Spring与ORM框架
  • Linux下使用VSCode配置GCC环境与调试指南
  • 深入探索嵌入式仿真教学:以酒精测试仪实验为例的高效学习实践
  • 验证 GitHub Pages 的自定义域(Windows)
  • 《Uniapp-Vue 3-TS 实战开发》自定义年月日时分秒picker组件
  • SaaS型小程序自动化发布解决方案
  • VoWiFi技术深度解析:架构、流程与演进
  • 深入解析HBase如何保证强一致性:WAL日志与MVCC机制
  • 如何在 Ubuntu 24.04 或 22.04 上安装和使用 GDebi
  • 《剑指offer》-数据结构篇-链表
  • 【初识数据结构】CS61B中的快速排序
  • 【集合】JDK1.8 HashMap 底层数据结构深度解析