群智涌现:Sakana AI多模型协作范式如何重塑AGI研发路径

温故智新AIGC实验室

TL;DR:

Sakana AI提出的AB-MCTS算法,通过赋能ChatGPT、Gemini等大型语言模型进行协作式决策与问题求解,在AGI基准测试中展现出远超单一模型的性能,标志着AI发展正从追求“更大更强”的单一模型,转向探索“协作与涌现”的群体智能新范式,为实现通用人工智能提供了颠覆性路径。

当业界仍在竞逐单一大型语言模型(LLM)的规模和能力极限时,一股由合作与进化理念驱动的暗流正在悄然汇聚。由Transformer架构共同作者Llion Jones创立的明星AI公司Sakana AI,以其新颖的Adaptive Branching Monte Carlo Tree Search(AB-MCTS)算法,为我们描绘了一幅AI“群策群力、其利断金”的未来图景。这一成果不仅在最具挑战性的AGI基准测试中取得了显著突破,更预示着AI发展范式可能从“大模型孤岛”走向“协作智能生态”,深刻影响通用人工智能(AGI)的实现路径、商业应用及社会结构。

技术原理与创新点解析

Sakana AI的核心贡献在于AB-MCTS算法,其精髓在于使多个异构AI模型能够像人类团队一样协同工作,通过交换并完善建议来共同解决问题。这一算法以TreeQuest之名开源1,其技术创新主要体现在以下几个方面:

  1. 自适应分支蒙特卡洛树搜索(AB-MCTS):传统的蒙特卡洛树搜索(MCTS)在每次扩展时往往固定子节点的数量,并仅扩展叶节点。然而,大型语言模型在相同提示下可以生成多样化的输出,理论上分支因子是无限的。AB-MCTS巧妙地解决了这一“无界分支”的挑战,它允许已扩展的节点再次被扩展并进一步分支,并引入了GEN节点来明确表示生成新子节点的动作。这意味着,算法能在深度搜索(完善现有方案)和广度搜索(尝试全新方法)之间进行动态、自适应的平衡
  2. 探索与利用的动态权衡:与固定宽度的传统MCTS不同,AB-MCTS并非将宽度作为静态超参数固定。相反,它在搜索树的每个节点上,会根据外部反馈信号和贝叶斯后验预测分布,自适应地决定是进行“探索”(通过生成新的候选响应以“变宽”)还是“利用”(通过改进现有响应以“变深”)。这种基于Thompson采样的策略,确保了每次扩展都能以更“原则性”的方式平衡探索与利用,从而高效利用LLM多样化的输出空间。
  3. 性能的显著提升:在多个具有挑战性的基准测试中,AB-MCTS展现了卓越的性能。
    • ARC-AGI-2基准测试:当结合ChatGPT、Gemini和DeepSeek等模型时,AB-MCTS成功解决了30%的谜题,而任何顶尖的独立模型仅能解决23%。2 这10%的性能跃升并非线性叠加,而是多种模型优势互补、协同涌现的结果,验证了“其利断金”的理念。
    • LiveCodeBench、CodeContest和MLE-Bench:在这些复杂的编程和机器学习任务中,AB-MCTS算法普遍优于基线方法,特别是在计算预算增加时,其性能提升曲线更为陡峭,表明其在大规模计算下能更有效地将搜索导向有希望的分支。

这些数据有力地证明,AB-MCTS并非简单的“模型叠加”,而是一种通过巧妙算法设计实现超越个体能力的群体智能的有效路径。

产业生态影响评估

Sakana AI的这一突破,对于当前的AI产业生态将产生深远影响:

  1. 打破大模型“军备竞赛”的僵局:长期以来,AI领域的主流趋势是训练更大、参数更多的单一模型。AB-MCTS的成功表明,未来AI能力的提升可能不再仅仅依赖于模型的绝对大小,而是更多地依赖于如何高效地组织和协调不同的专业模型。这可能为中小型AI公司带来新的机会,它们无需投入巨资训练万亿级模型,而是可以通过集成和优化现有模型协作来创造价值。
  2. 推动“模型即服务”向“AI协作平台即服务”演进:TreeQuest的开源,意味着AB-MCTS将成为一个可供广泛采用的框架。企业可以利用其灵活的API,将不同的模型(包括自研、开源或商业API模型)组合起来,解决特定领域的复杂问题。这将催生新的商业模式和产业生态,从单纯提供模型API转向提供多模型编排、协作与优化平台
  3. 赋能企业级AI应用的新范式:在复杂的企业级应用场景中,单一模型往往难以应对多样化的任务需求。AB-MCTS提供了一种解决方案,例如,可以将一个擅长文本生成的LLM、一个擅长数据分析的LLM和一个擅长图像识别的LLM结合起来,共同完成一个复杂的跨模态任务。这将极大地提升AI在智能制造、金融风控、医疗诊断等垂直领域的实用性和可靠性
  4. 资本市场对“协作智能”的再评估:Llion Jones作为Transformer的共同作者,其新公司的动向本身就备受关注。AB-MCTS的成功验证了其“自然启发”的协作AI路径,可能会引发资本市场对多智能体系统、AI协作框架以及AI编排工具领域的重新评估和新一轮投资热潮。这不仅仅是技术本身的价值,更是其所代表的未来AI架构范式的潜在商业价值。

未来发展路径预测

展望未来3-5年,AB-MCTS及其所代表的协作式AI范式,将引领AI走向更深层、更具适应性的发展:

  1. 加速通用人工智能(AGI)的实现:ARC-AGI基准测试的突破性进展,是AGI研究道路上的重要里程碑。如果说单一LLM是“超级大脑”,那么多模型协作则是在构建一个“智慧社会”。AGI的实现,可能不再是依赖于一个单一、全能的“黑箱”模型,而是由大量专业化、能够高效互动的AI智能体构成的分布式智能系统。AB-MCTS正是朝着这个方向迈出的坚实一步。
  2. 从“混合以创造”到“混合以使用”的范式转变:Sakana AI此前在进化模型融合方面的工作,正是从“混合以创造”转向“混合以使用”现有强大AI的体现。这预示着,未来的AI研发重点将从底层模型架构的从零开始,转向现有模型的高效集成、优化和协同。这与软件工程领域组件化、模块化的趋势不谋而合,将大大提高AI系统的开发效率和鲁棒性。
  3. “自然启发”成为AI创新的新源泉:Sakana AI坚持从生物进化和集体智能中汲取灵感,例如达尔文-哥德尔机(DGM)的自我进化框架和物理学家对扩散模型“创造力”的生物组装参考。这股“自然式启发”的浪潮,正促使AI研究者重新审视生物智能的本质,从简单的模仿转向深层次地理解和复现自然界中涌现智能的原理。这不仅是技术层面的突破,更是一种哲学层面的回归。
  4. AI智能体生态系统的兴起:AB-MCTS是构建复杂AI Agent和自主系统的重要基石。我们可以预见,未来将出现一个由各种功能特异的AI Agent组成的生态系统,它们在像AB-MCTS这样的协调框架下,能够自主规划、记忆、使用工具,甚至相互学习和演化。这将改变我们与AI的交互方式,从简单的命令执行者转变为能够独立完成复杂任务的智能伙伴
  5. 伦理与治理的复杂性加剧:多模型协作虽然提升了AI能力,但也带来了新的伦理挑战。如何追踪决策的责任归属?如何确保协作过程中不放大偏见?如何管理不同模型间的潜在冲突?这些问题将促使AI伦理和治理框架必须从单一模型视角扩展到多智能体协作的复杂性
“最伟大的成就往往源于不同思想的协作,我们相信这一原则同样适用于人工智能。” —— Sakana AI

Sakana AI的AB-MCTS算法,不仅仅是一个技术上的精妙创新,它更是对AI发展深层哲学的一次有力回应。它揭示了AI能力提升的另一条关键路径:从个体智能的极限扩展到群体智慧的涌现。这预示着一个由协作、演化和自然启发驱动的AI新纪元的到来,一个真正能够以“三个臭皮匠”之力,解决人类最复杂挑战的未来,正变得触手可及。

引用