当前位置: 首页 > java >正文

大语言模型原理与书生大模型提示词工程实践-学习笔记

📘 第五期书生葡语实战营讲座总结

🎙 主讲人:王明(东部大学 数据挖掘实验室 博士生)


一、大语言模型的生成原理

  • 架构基础:采用 Transformer(Decoder-only)架构,如 GPT 系列。
  • 学习过程模拟人类成长:
    1. 🧠 预训练:以“下一个词预测”为核心任务,掌握通用语言规律。
    2. 🎯 指令微调:遵循指令,更贴合人类指令执行习惯。
    3. 🏛️ 领域微调:形成“垂直专业模型”,例如医学、金融 LLM。
    4. 🧰 工具协同:调用外部知识库、搜索引擎或 API 执行复杂任务。
  • 续写机制:根据输入内容,预测下一个最可能的词,逐步生成连贯文本。

二、提示工程 Prompt Engineering 简介

📌 什么是 Prompt?

输入给模型的指令/内容,引导其生成期望输出。

✨ 什么是提示工程?

通过设计和优化 Prompt,提高模型响应质量与稳定性。

✅ 六大提示原则(来自 OpenAI):

  1. 清晰具体的任务描述
  2. 提供上下文或示例(few-shot)
  3. 任务分解(适用于复杂任务)
  4. 给予思考时间(Chain of Thought)
  5. 调用外部工具辅助推理
  6. 系统化测试调整提示
    在这里插入图片描述

三、实用提示技巧举例

技巧类型示例
明确任务格式“生成一首七言律诗”比“写一首诗”更有效
指定角色扮演翻译大师 vs 普通翻译
提供示例 (few-shot,思维链)提高准确率与风格一致性
使用格式符用 `` 或 Markdown 包裹指令,避免误解
情感/奖励激励“这对我事业很重要” or “我给你200元小费”

四、结构化提示设计框架对比

🧩 CRISP 框架(结构灵活)

  • 能力和角色(Capabilities&Role):希望大语言模型扮演怎么样的角色
  • 洞察力(insights):背景信息和上下文
  • 个性(Persona)希望大语言模型以什么风格或方式回答你
  • 指令(Prompt)希望大语言模型做什么
  • 尝试(Experiment)要求大语言模型提供多个答案
    在这里插入图片描述

🧱 COSTAR 框架(结构清晰)

  • Context(背景):提供任务背景信息
  • Objective(目标):定义需要LLM执行的任务
  • Style(风格):指定希望LLM具备的写作风格
  • Tone(语气):设定LLM回复的情感基调
  • Audience(对象):表明回复对象
  • Response format(输出格式):提供回复格式
    在这里插入图片描述

在这里插入图片描述

⚠️ 问题:不便扩展或调整,无法容纳复杂模块(如示例/规则)


五、人格化提示设计框架:Long-GPT

🎯 目标

通过“人格化”提示设计,使模型进入特定角色和工作状态。

🧠 理论基础:心理学启发

  • 认知框架:围绕“心理模型”组织语言
  • 情绪调节:正向激励带来正面响应
  • 思维模式:模拟人类工作流、思维路径
    在这里插入图片描述

🛠 结构化模块(可选组合):

  • 基本身份与能力唤醒
  • 明确规则与目标约束
  • 分阶段工作流程(如“先做A,再做B”)
  • 输出格式要求(如 JSON、表格)
  • 初始化启动语

六、自动提示生成工具:MISTRO

Lang-GPT 提示自动生成器(挂载于 Hugging Face Space)https://huggingface.co/spaces/sci-m-wang/Minstrel

在这里插入图片描述

🧱 模块组成:

  1. 分析组:解析用户任务意图,激活相应模块
  2. 设计组:生成对应提示结构(Prompt Blocks)
  3. 测试组
    • 提示模拟器(执行任务)
    • 多智能体评估群组(自动辩论 & 优化)

七、实战演练:提示工程练习赛(论文分类)

🏆 任务目标:

  • 依据论文标题和摘要,将论文归类为 10 个科学领域之一。

📊 数据来源:

  • arXiv 论文,10类:AI、CV、CL、Robotics、Networking 等

🧪 提交内容:

  • 系统提示(可空)
  • 任务提示(包含 {title}{abstract}

🧮 评测方式:

  • 使用 OpenCompass + 书生葡语 38B instruct 模型
  • 准确率 = 正确分类数量 / 总数

🧩 示例系统提示结构(Lang-GPT):

你是一个资深arXiv论文分类专家,你的任务是……
[背景信息]
[技能唤醒]
[规则说明]
[工作流程指示]
[输出格式要求]
http://www.xdnf.cn/news/13246.html

相关文章:

  • 目标跟踪_学习
  • GNSS位移监测站的作用
  • 龙蜥开发者说:我的龙蜥开源之旅 | 第 32 期
  • 寄存器被改写问题总结
  • 有符号变量与无符号变量的区别和联系
  • CANopen转Modbus TCP转换器助生产线智能化升级
  • 意图分类策略选择:小模型微调 vs 大模型 Prompt
  • 21、Create React App的使用
  • Vim 删除命令完整学习笔记
  • RocketMQ acl2.0使用体会:复杂度增加,安全性仍有欠缺
  • JS手写代码篇---手写浅拷贝
  • 376. Wiggle Subsequence
  • Golang dig框架与GraphQL的完美结合
  • IK分词器
  • K8S认证|CKS题库+答案| 11. AppArmor
  • 用纯.NET开发并制作一个智能桌面机器人(五):使用.NET为树莓派开发Wifi配网功能
  • 【Docke基础】Docker简介与快速入门:从概念到核心优势
  • Ynoi数据结构题单练习1
  • 解决启动SpringBoot是报错Command line is too long的问题
  • shell脚本--常见案例
  • 树莓派超全系列教程文档--(62)使用rpicam-app通过网络流式传输视频
  • 安装HomeBrew
  • 软考 系统架构设计师系列知识点之杂项集萃(86)
  • win11 mysql解压版本安装及配置
  • 【强化学习】TD-MPC论文解读
  • STM32标准库-DMA直接存储器存取
  • 服务器数据恢复—ocfs2文件系统被误格式化为Ext4文件系统的数据恢复案例
  • OS12.【Linux】gcc和g++以及动静态链接
  • RNN做中文分词
  • Linux动态库与静态库详解:从入门到精通