超越提示词:上下文工程如何重塑AI智能体与软件范式

温故智新AIGC实验室

TL;DR:

随着AI智能体成为下一代核心范式,硅谷正经历一场从“提示词工程”到“上下文工程”的深刻转变。这一演进强调为大模型提供全面、动态且结构化的背景信息和工具,从根本上提升AI的决策质量和应用效果,预示着软件工程与智能体构建的新纪元。

硅谷的科技浪潮总是瞬息万变,曾经炙手可热的“提示词工程”(Prompt Engineering)如今正悄然让位于一个更具系统性和前瞻性的概念——上下文工程(Context Engineering)。这一范式转变不仅得到了AI领军人物如Karpathy的亲自站台,并将其誉为一门结合科学与艺术的精深学问1,更被Shopify CEO Tobias Lütke推崇为“精准描述了通过提供完整背景信息,使大模型合理解决问题的核心艺术”2。这并非简单的术语更迭,而是AI应用开发理念与实践的深层重构,尤其在AI智能体(AI Agent)浪潮兴起的大背景下,其战略意义不言而喻。

技术原理与范式演进:从提示到上下文的跨越

“上下文工程”的崛起,首先源于对大型语言模型(LLM)能力边界的深刻理解。传统的“提示词工程”侧重于在单一文本字符串中,通过巧妙措辞来引导模型生成期望响应。然而,当AI的任务从简单的问答、文本生成,转向需要复杂推理、多步规划和与外部环境交互的智能体应用时,单一提示词的局限性便暴露无遗。

“上下文工程”则将“上下文”的定义扩展到前所未有的广度,它不再是静态的文本指令,而是模型在生成响应之前“看到的所有内容”:

  • 指令/系统提示: 规定模型行为的初始规则集,包含示例和通用准则。
  • 用户提示: 即时任务或问题。
  • 状态/历史(短期记忆): 当前对话的完整记录,包括用户和模型的来回交互。
  • 长期记忆: 跨越多次对话积累的持久知识库,如用户偏好、项目摘要等。
  • 检索增强生成(RAG):3 实时从外部知识库(文档、数据库、API)中检索相关信息,提供给模型进行“开卷考试”式学习,有效缓解“幻觉”问题。
  • 可用工具: 模型可以调用的外部函数或内置能力(如check_inventory, send_email)。
  • 结构化输出: 对模型响应格式的明确规定,例如JSON对象。

“上下文工程”是一门学科,它致力于设计和构建动态系统。这些系统能够在恰当的时机、以恰当的格式,提供恰当的信息和工具,从而让LLM拥有完成任务所需的一切。[参考资料1]

这一核心特征表明,上下文工程是一个系统性的输出,而非孤立的字符串;它是动态生成的,根据当前任务量身定制;它强调在恰当时机提供恰当信息和工具,避免“垃圾进,垃圾出”;并且它高度注重信息的格式,因为简洁、清晰的呈现方式能显著提升模型性能。

AI智能体的基石:上下文的决定性作用

OpenAI总裁Greg Brockman曾多次预言“2025年,是AI智能体的元年”1。智能体是具备自主规划、执行任务、与环境交互能力的AI实体,它们不再是被动响应,而是能主动思考、行动。然而,智能体成功的关键瓶颈,并非模型本身的智能水平,而是它们所能获取和利用的“上下文质量”。

大多数AI智能体失败的案例,不是模型的失败,而是上下文的失败!2

想象一个AI助理需要根据邮件安排会议的场景: 一个“粗糙的演示”智能体,上下文贫乏,只能看到简单请求,其回复机械且无用。 而一个“惊艳的智能体”,在调用LLM之前会动态扩展上下文,包含日历信息、历史邮件语调、联系人列表,甚至调用发送邀请的工具。最终生成的回复不仅自然流畅,而且直接解决了问题,无需用户多次交互。

这种本质区别在于,代码的核心任务不再是思考如何回复,而是收集LLM达成目标所需的一切信息。 因此,“上下文工程”成为构建强大可靠AI智能体的核心支柱。它预示着AI应用开发将告别对“万能提示词”的盲目追求,转向对信息流、记忆管理和工具调用的系统化构建。正如网友所言,“记忆”才是AGI拼图的最后一块,而上下文工程正是赋予AI“记忆”并有效利用这些“记忆”的关键手段1

商业格局与人才演变:软件工程的新前沿

从商业角度看,上下文工程的兴起对AI产业生态具有深远影响。它标志着AI应用开发从“魔术般的黑箱调优”走向“工程化的系统构建”。

  • 产品质量的飞跃: 过去许多AI产品因上下文不足而表现不佳,导致用户体验受损。上下文工程能够显著提升AI应用的可靠性、准确性和用户满意度,降低“幻觉”发生率,从而催生更高质量、更具商业价值的AI产品
  • 商业模式的深化: 企业将从简单的API调用者,转变为需要投入资源进行知识库构建、工具链集成、数据流优化的AI解决方案提供商。这将推动形成围绕“上下文管理平台”、“RAGaaS(RAG即服务)”等新商业模式。
  • 人才结构转型: 对AI开发者而言,核心能力将从“提示词编写”转向“系统架构设计”和“数据流管理”。这要求开发者不仅理解LLM的能力,更要精通数据工程、信息检索、自动化流程编排等综合技能,成为能够**“构建复杂智能系统”的“全栈AI工程师”**。Karpathy的评论也指出,这绝非简单的“ChatGPT套壳”,而是“一个正在兴起的、厚重且复杂的软件层”1

哲学思辨与未来展望:构建智能文明的深层逻辑

Karpathy将“上下文工程”形容为一门“科学,也是一门艺术”1

  • 科学性体现在其对RAG、少样本学习、信息压缩等技术的综合运用,以及对信息量和关联性的精准平衡,以优化LLM性能和成本。
  • 艺术性则源于开发者对大模型“脾性”的直觉把握,以及将问题拆解、上下文填充、模型分派、生成验证等复杂流程巧妙整合的能力。这不仅仅是编程,更是对智能系统“意图”的塑造。

这一转变不仅是技术层面的进步,更是我们对“智能”本质理解的深化。它揭示了:真正的智能并非孤立的模型能力,而是建立在丰富、动态、高质量信息流之上的“具身智能”——即智能需要在一个具备感知、记忆、工具的完整环境中才能得以充分体现。

展望未来3-5年,随着上下文工程的成熟和标准化,我们将看到:

  • 更强大的AI智能体: 具备更强的自适应性、多模态理解能力和长期记忆,能够胜任更复杂、更具创造性的任务,深度融入个人生活与企业运营。
  • 工具生态的繁荣: 用于管理和生成上下文的工具链(如记忆库、RAG框架、代理编排工具)将迅速发展,降低开发门槛。
  • 人机协作模式的重塑: 人类将更多地承担“定义问题、提供背景、评估结果”的角色,而将复杂的“信息整合与执行”交给AI智能体。
  • 潜在的伦理挑战: 长期记忆和个性化上下文的运用,也可能带来隐私、偏见积累和信息茧房等伦理问题,需要社会各界共同制定治理框架。

从“提示词”到“上下文”,这一转变并非简单的技术迭代,而是对AI应用核心逻辑的一次深刻革新。它不仅定义了未来AI智能体的发展路径,更深刻影响着我们理解智能、构建智能系统以及与智能共存的方式,开启了人机交互与软件工程的全新篇章。

引用


  1. 「上下文工程」硅谷爆火,Karpathy亲自站台!提示工程瞬间失宠 · 新智元 · 新智元(2025/7/6)· 检索日期2025/7/6 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎

  2. Prompt格局小了,上下文工程称王!Shopify CEO提上下文工程 ... · 搜狐 · 未知(未知)· 检索日期2025/7/6 ↩︎ ↩︎

  3. 登上热搜!Prompt不再是AI重点,新热点是Context Engineering · 搜狐 · 未知(未知)· 检索日期2025/7/6 ↩︎