大模型——上下文工程如何重塑智能体的“思考方式”
大模型——上下文工程如何重塑智能体的“思考方式”?
技术术语的更迭,不仅是语言表达的更替,更代表着思维范式的转变。上下文工程这一新术语,之所以能引起业内共鸣,折射的是智能体复杂性的演化和应对策略的转变,是对现实中算法和工程挑战的一种集体回应,尤其是在垂直/领域的智能体。
现有的大模型已经非常智能。但即便是最聪明的人,如果不清楚自己要做的事情的上下文,也很难给出令人满意的交付。两款产品可能在做完全相同的事情,一款给人感觉充满魔力,但另一款却像个廉价的演示品。差别在哪里?就在于上下文工程的构建上。
一、从一个场景开始,感受上下文工程的魔力
场景设定:你是某款智能体的产品经理,正在钉钉上收到研发发来的私信:“有个问题想确认一下,新版的导入功能是不是只支持 CSV?我们这边需要开始写接口了。”
一个普通的智能助手可能会直接帮你草拟一句回复:“是的,目前只支持 CSV,后续可能会扩展。”表面上看没错,但没有考虑到项目当前阶段、上下游依赖、语气风格、团队共识等细节,容易引起误解或返工。
而一个具备“上下文感知”的智能体,会先主动检索:
- 项目状态:按照项目规划,导入功能这周进入开发阶段。
- 需求文档:设计稿明确列出 V1 支持 CSV 和 JSON,但后者会延后一周上线。
- 团队氛围:研发那边人手吃紧,担心 scope 变化影响进度。
- 任务历史:曾有一次因需求细