清华系Coóragent框架:掀起智能体协作浪潮,剑指“无Prompt”新范式

温故智新AIGC实验室

清华大学团队推出的Coóragent开源智能体框架,凭借其自动化多智能体协作能力和“无Prompt”的愿景,在开源社区迅速崛起,预示着AI开发范式正从静态的提示词工程转向动态、场景自适应的智能体驱动模式,对AI技术的商业化落地和未来发展具有深远意义。

自大型语言模型(LLMs)能力实现突破以来,“可调用工具的智能体”(Agents)已迅速从实验室概念跃升为继大模型之后的又一爆发点。这一趋势不仅催生了LangChain、AutoGPT等一系列Agent开发框架的涌现,更标志着新一轮开发范式和商业模型重构的起点。近期,由清华MEM工程管理硕士、SeamLessAI创始人王政联合清华大模型团队LeapLab发布的开源框架Coóragent,以其独有的“一句话描述需求即可生成专属智能体,且智能体间可自动协作完成复杂任务”的特性,迅速在GitHub斩获1.9k星,并提出了极具前瞻性的“消灭Prompt”概念,引发了行业内广泛关注1

智能体的演进与当前局限

智能体概念并非新鲜事物,但其真正崛起与2022年底OpenAI发布ChatGPT密切相关。2023年,Auto-GPT等开源项目风靡一时,展示了智能体的初步潜力。然而,正如王政所指出,早期智能体的商业化进程受到诸多技术短板的制约。核心问题在于当时的大模型本身存在严重的“幻觉”问题,缺乏精确的“长任务思考模式”以及有效的“后训练方法”,导致其输出和API调用结果均不尽如人意。这种技术成熟度的不足,使得商业化所需的“高稳定性”难以满足。

然而,2023年至2024年间,大模型的能力实现了显著飞跃。王政强调,现在的模型在“精确的长任务思考能力”和“函数调用(Function Call)能力”方面取得了本质性提升。特别是Qwen2.5/3、Deepseek V3-0526等国产开源大模型在工具调用准确率和复杂指令遵循上的进步,为智能体的商业化应用奠定了坚实基础。在此背景下,**多代理协作平台(MCP)**的重要性日益凸显。MCP被视为智能体的基础,通过“工具池化”实现工具的灵活调用和标准化,类似于计算领域的算力虚拟化。Manus等早期尝试虽然存在争议,但其商业模式和盈利路径的清晰性,印证了市场对智能体付费的意愿,这对于大模型生态的持续发展至关重要。

尽管Agent产品层出不穷,其底层原理大同小异。王政认为,真正的差异化在于“使用方式、面向场景、工作流的打磨程度以及Agent本身的优化程度”1。构建长期的技术优势,需要一个完整的体系,包含底层模型创新、数据链工程能力和工具使用。他强调,产品好坏并非一概而论,而是取决于具体用途。例如,Manus擅长日常报告和灵感提供,但在严肃报告撰写方面可能需要人工优化。当前,底层能力与工程能力已密不可分,算法创新依赖于工程实现,工程能力反哺算法优化。最终,智能体要解决的核心问题是:如何将大模型的能力真正融入用户的实际生活场景。

Coóragent的愿景与“无Prompt”的未来

王政认为,现有Agent框架在“产品确定且不变”的情况下能够解决问题,但这种“静态解决方案”在快速变化的AI时代已远远不够。传统通用型基础设施与AI应用场景的深度融合是未来趋势。AI商业化已不再局限于互联网的广告、会员等模式,正向律所等传统行业渗透,带来前所未有的多样化需求。为B端客户落地时,泛化性与精确性的平衡是关键痛点。目前的框架往往需要程序员耗费大量时间打磨工作流或编写提示词,且一旦场景、用户习惯或模型能力变化,便需重新调整,调试难度高。一些过度封装的框架甚至牺牲了定制化能力。

Coóragent的核心创新在于其**“Agent创造Agent”的MetaAI框架**理念。通过让智能体生成无限多的智能体以适应不同场景,Coóragent旨在从本质上解决泛化能力与精确性之间的平衡问题。它能够根据用户场景和环境变化动态调整Agent生成,快速适应新场景。这种人与智能体(Human-Agent Cooragent)以及智能体与智能体(Agent-Agent Cooragent)之间的协作理念,极大地提升了生产效率和环境适应能力。

王政团队还致力于探索**“Prompt free”(无提示词)**的概念,以减轻用户,特别是C端用户在提示词编写上的负担。对于大多数人而言,精心设计提示词是一项繁琐的工作,用户更倾向于用一句话或一个简单指令来表达需求。Coóragent通过“基于用户上下文补充信息”实现这一目标。这里的上下文并非仅仅是单次输入的上下文,而是用户的“全部历史数据”,甚至可以追溯到用户最初使用平台的数据,形成一个“数据飞轮”:用户使用越多,系统越能符合其使用习惯。这需要高效的数据利用和整合能力,包括检索召回、知识库、向量库和知识图谱等技术,以及对数据进行有规则的筛选和保留,以确保数据的正交性。这种精细化数据利用是巨大的工程挑战,甚至会采用强化学习等方法。

然而,随之而来的是算力需求的挑战。王政指出,尽管数据积累越多可能增加算力压力,但算力优化的上限很高,例如通过提升机器利用率和算法定制优化,成本可大幅降低。但他强调,这需要在足够大的规模下才能实现经济效益,且需要大量的专业人才。工程人员会从设计层面规避大部分问题,例如通过验证推理合理性、精简指令和优化上下文来管理多步骤推理过程中的“信息爆炸”问题。

在多智能体协作方面,Coóragent将难点集中于底层设计,如接口、架构和数据流。智能体分工则与人因工程学有关:一个智能体擅长运用一到三个工具,以确保其专业性,避免适应通用性而牺牲专业性。这背后涉及复杂的责任划分和协作机制设计,未来期望能通过自动化流程实现。从单Agent到多Agent,设计理念有所不同,但王政认为最关键的还是Agent能否适配特定场景以及框架是否易用。此外,框架的适应性与扩展能力至关重要,须能快速集成新工具并降低开发成本,以应对模型和MCP工具生态的快速发展。

对于“框架大融合是否是趋势”的疑问,王政持谨慎态度。他认为,融合不同框架虽然是一种方法,但会显著增加系统复杂性,提升工程层面的维护成本,且可能存在大量重复特性。对于用户而言,好用、扩展性强且易于维护的单一框架可能优于复杂的融合框架。

智能体生态的挑战与商业化路径

Coóragent在C端已部分开源,并计划上线SaaS平台,以社区形式面向个人用户。同时,B端作为项目痛点来源,是其天然场景,正与大型客户探讨战略合作。王政认为B端和C端需要并行发展,因为B端客户的需求会借鉴C端的活跃用户产品思路,这种变革具备通用属性。清华大学作为高校,其开源目的更侧重于长期价值、知识分享和技术发展,而非单纯的商业获客或品牌提升。他强调开源项目更新频率的重要性,但理解其作为“公益”性质可能面临的资源限制。

在选择智能体框架时,王政建议从框架特点、面向场景、团队使用习惯和后期扩展性等多个角度综合考虑。他承认,不同开发者对开发工具有不同偏好,例如传统SDK与Agent框架的抽象程度之争。王政强调,每种开发方式都有其优劣,目标都是“服务用户,让用户能够高效开发”,不可能用一款软件满足所有人需求。

当谈及国内外框架差异时,王政指出,国外框架多围绕OpenAI构建,而国内则主要围绕本土模型构建体系,双方结构体系存在差异。他观察到,尽管国外框架曾被广泛使用,但“越来越多的用户开始倾向于使用国内的框架”1

最后,对于智能体是否存在“炒作过热”的担忧,王政认为关键在于其是否真正“有用”。他引用了对新事物理解的普遍规律:“短期内高估其价值,而长期内又低估其潜力”1。他认为,持续思考和尝试是关键,而当前用户对AI新事物尝试意愿的提高,特别是传统行业的参与,是推动智能体持续发展的重要动力。智能体框架的构建并非弥补生态不足,而是在产业化落地中,随着潮流向实体经济迈进,基于新的洞见和需求构建和演进新的基础设施。无论是演进现有系统还是重构全新系统,都在持续推动智能体技术走向更广阔的应用前景。

引文


  1. 卷疯了!这个清华系Agent框架开源后迅速斩获1.9k stars,还要“消灭”Prompt?·InfoQ·王政(2025/6/28)·检索日期2025/6/30 ↩︎ ↩︎ ↩︎ ↩︎