TL;DR:
AI产品交付正从技术炒作走向严谨的工程实践,要求我们超越传统的软件工程范式,以适应AI系统的非确定性和有状态性。Phil Calçado的洞察揭示了智能体(Agents)和持久化工作流(Persistent Workflows)将成为构建下一代AI原生系统的核心支柱,这不仅是技术挑战,更是决定商业成功与否的关键。
在人工智能浪潮席卷全球的当下,业界焦点正从模型创新逐步转向如何将这些前沿技术转化为稳定、可靠且真正能创造价值的生产力工具。波士顿DevSummit大会上,Outropy创始人兼首席执行官Phil Calçado的主题演讲,为那些致力于在实践中交付生成式AI产品的软件领导者们,提供了一份深刻的“实战经验总结”。这不仅仅是技术细节的分享,更是对AI时代软件工程本质的一次哲学性思辨。
从炒作到生产:AI产品交付的残酷现实
Calçado以其三年的AI实践经验和30年的软件架构生涯为基石,坦陈了一个“残酷”的现实:早期AI产品,即使在基准测试中表现出色,也可能在实际应用中“彻底失败”。他以其早期尝试为管理者或工程师构建AI驱动的自动化工具为例,指出核心问题在于激励机制的错位。用户更倾向于“逆向工程”助理的内部设计,而非将其作为日常生产力工具。这一洞察揭示了展示技术新颖性与提供持续用户价值之间的鸿沟,是所有AI产品从实验室走向市场的首要挑战。
这种挑战进一步催生了AI开发中三种截然不同的心态:
- 等待AGI心态:团队聚焦于最新模型的发布和资金循环,而非迭代解决当前限制。这反映了一种对“奇点”的过度期待和对现实工程复杂度的逃避。
- 实验室精度心态:数据科学团队耗费大量时间追求微不足道的准确性提升,缺乏产品思维。其结果往往是与商业价值脱节的边缘化成果。
- 软件工程中心心态:强调在生产中快速迭代,开发轻量级、可插拔的组件,并进行严格测试和完善。这才是Calçado倡导并实践的,通往实际交付的路径。
架构革命:面向非确定性与有状态性
AI,特别是大型语言模型(LLM)的引入,对传统的软件工程原则构成了根本性挑战。Calçado明确指出,诸如广受推崇的**“十二因素应用”模型(12-Factor App)1在AI系统中面临局限:配置不再是静态的,流程不能保持无状态,LLM调用引入了固有的延迟瓶颈。AI系统的随机性和有状态需求**,颠覆了我们对确定性、无状态服务的基本假设,迫使我们重新审视架构设计。
为此,Calçado引入了两个核心抽象:工作流(Workflows)和代理(Agents)。
- 工作流被定义为静态的、预定义的管道,执行一系列确定性的转换,如消息接收、对话去重或生成摘要。它们代表了系统中的可预测路径。
- 代理则代表了一种更具突破性的范式。它们是半自治的组件,拥有记忆、目标导向,并能动态调用工具或其他服务。Calçado将它们类比为传统面向对象设计中的有状态对象,但其内在的非确定性行为使其远超传统概念。
对于代理的设计,Calçado发出了重要警告:不要将其视为细粒度的微服务。LLM代理固有的有状态性和非确定性行为,会破坏传统的服务边界,导致脆性耦合和操作脆弱性。相反,他提倡使用语义事件总线(Semantic Event Bus)。通过传输结构化、意图驱动的事件(而非原始数据库变更流),这种模式能够解耦组件,并在系统内部实现可发现、可插插拔的行为。这标志着从数据流到意图流的范式转变,以适应AI的“意图理解”特性。
在组装AI管道时,将单体项目分解成具有清晰语义接口的小而明确的切片至关重要。例如,Autopi的每日简报功能就由独立的组件构成,分别处理Slack接收、重复对话检测、语义摘要和日历上下文丰富。这种模块化设计,结合语义事件,是应对AI复杂性的关键。
为应对AI系统中的持久化和有状态挑战,Calçado敦促团队探索如Temporal2这类持久工作流框架。这些框架能够清晰地将编排与副作用分开,透明地处理重试和超时,并为长期运行的有状态进程提供检查点功能。它们是构建高可用、高韧性AI系统的基础设施。
商业价值与生态重塑:构建韧性AI的价值洼地
从商业敏锐度来看,Phil Calçado的洞察指明了AI产业的**“价值洼地”。当大部分资本和关注涌向底层模型和应用层创新时,真正能够将AI能力转化为规模化商业价值的,是其背后的工程韧性(Engineering Resilience)**。一个AI产品即便拥有再强大的模型,如果无法稳定交付、处理异常、管理状态,也无法在竞争激烈的市场中立足。
Calçado的经验表明,那些能够克服AI系统随机性和有状态性的工程团队,将拥有显著的竞争优势。对企业级AI而言,这意味着更高的可靠性、更低的运营成本和更快的创新周期。因此,围绕“AI产品交付”和“AI原生系统构建”的工具、平台和服务,正迎来重要的投资机遇。像Temporal这类持久化工作流框架,并非AI专属,但其在处理有状态、长周期任务上的优势,使其成为AI基础设施的关键组成部分,扮演着AI应用“水电气”的角色。投资于这些底层“管道”和“水泥”,将是支撑未来AI经济体量增长的战略要地。
前瞻:AI工程的未来图景
Calçado的结论是:我们不需要从头开始重建一切,而是需要更好的平台来整合经过验证的软件工程模式,以适应AI系统的独特需求。这是一种务实的未来主义。AI工程的未来,并非全然的颠覆,而是深度融合与扩展。核心的软件工程原则——如模块化、接口清晰、测试驱动、快速迭代——依然是基石。但它们需要被新的抽象和工具所增强,以应对非确定性和有状态性带来的挑战。
展望未来3-5年,随着模型能力的提升和智能体概念的成熟,我们预见:
- AI工程范式将更加成熟:从“炼丹”到“造器”,AI产品开发将越来越像传统的软件工程,但会融入更多对不确定性的管理和对智能体行为的编排。
- 智能体生态系统将逐步形成:具备记忆、目标、工具调用能力的AI代理将成为新的计算单元,围绕它们将形成一套新的开发工具、测试框架和部署标准。
- 韧性AI基础设施崛起:像Temporal这样的持久化工作流和事件驱动架构将成为AI原生应用的标准配置,确保复杂AI系统的稳定性和可扩展性。
- 人机协作模式深化:AI工具将不仅仅是自动化的延伸,更是与人类工程师协作的“智能伙伴”,尤其是在需求理解、架构设计、测试验证等高阶任务中。
- 伦理与治理内嵌:随着AI系统复杂性的增加,可解释性、透明度和鲁棒性将不再是附加功能,而是从设计之初就需内嵌的工程考量。
Phil Calçado的演讲,不仅提供了宝贵的工程经验,更是一次对AI时代软件工程哲学的高度凝练。它提醒我们,从AI的炒作中走出来,脚踏实地地解决其在生产环境中的工程挑战,才是通往AI真正普惠化和商业成功的必由之路。这是一场关于信任与控制、创新与鲁棒性的深层对话,将重塑我们构建未来智能文明的方式。
引用
-
The Twelve-Factor App · Heroku·Heroku团队(无具体作者)(无具体日期)·检索日期2025/7/4 ↩︎
-
Temporal - The Microservice Orchestration Platform·Temporal Technologies(无具体作者)(无具体日期)·检索日期2025/7/4 ↩︎