字节跳动的AI Agent豪赌:重塑数字未来的关键战役

温故智新AIGC实验室

字节跳动正将全部赌注押向AI Agent这一新兴范式,旨在通过火山引擎在云计算市场实现“换道超车”,以应对AI时代对传统App模式的颠覆。此举不仅涉及豆包大模型的迭代与成本优化,更在于构建一套完整的AI云原生基础设施,以期在激烈的竞争和未知的挑战中,抢占下一代互联网的核心入口,实现其长期AGI愿景。

AI技术的潮汐正在以前所未有的速度重塑数字世界的版图,而曾凭借推荐算法在移动互联网时代铸就超级App帝国的字节跳动,正经历一场深刻的自我迭代。正如火山引擎总裁谭待所言,技术主体正从PC时代的Web、移动时代的App,加速迈向AI时代的Agent1。这并非简单的技术升级,而是一场关乎企业生存与未来走向的豪赌,字节跳动将核心筹码押在了AI Agent这一新范式上,意图通过旗下云计算平台火山引擎,发起一场颠覆性的“换道超车”。

AI Agent:重塑互联网入口的关键战役

传统的App交互模式正面临颠覆性挑战。当用户能通过自然语言指令让AI Agent自主完成复杂任务时,曾经风光无限的超级App或将面临被边缘化的风险。中金公司认为,AI Agent这类产品形态的创新与底层模型演进同等重要,并展现出强大的商业化变现和落地潜力,未来甚至可能通过接管手机的方式,重塑整个互联网生态1。对于以流量生意见长的字节跳动而言,AI Agent的崛起,预示着一个全新的“AI超级入口”的诞生,抓住这一革命性机遇,是其继续称霸AI时代的关键。

谭待进一步阐释了这一技术主体变迁的深远意义:“AI时代的主体是Agent,它能够自主地感知,规划和反思,完成复杂任务。”1 这意味着软件开发范式与技术架构将迎来全面升级。更重要地,Agent在执行复杂任务时,其Token(处理单元)消耗量将呈现几何级增长。谭待指出,一个人与模型聊天一小时可能消耗20多万Tokens,而Agent完成一项复杂任务的Tokens消耗量同样巨大。这种爆发式的需求,将直接驱动对云计算基础设施的快速上涨,从而为火山引擎在云计算市场的崛起提供了前所未有的机会。IDC预测,如果2024年是中国大模型应用的元年,那么2025年将很可能是中国Agent落地的元年,Agent将逐步深入企业的各个业务流程1

字节跳动:全栈AI与成本策略

面对这场必须拿下的战役,字节跳动采取了与其他科技巨头类似的“AI大模型+云计算+应用侧”全栈AI布局战略。其核心策略,可以概括为“先铺路,再跑车”——即在铺设坚实AI基础设施的同时,不断提升大模型的智能程度并降低其调用成本。

在AI大模型层面,字节跳动展现了其作为“价格屠夫”的本色。在6月11日的Force原动力大会上,火山引擎正式发布了豆包大模型1.6系列,包括Doubao-Seed-1.6、Doubao-Seed-1.6-thinking和Doubao-Seed-1.6-flash。其中,Doubao-Seed-1.6被判认为“国内首个支持256K上下文的思考模型”,对于构建复杂的Agent至关重要,尤其是在处理图像、GUI操作或编码等涉及超大窗口的任务时1。测评结果显示,豆包1.6-thinking模型在GPQA Diamond、AIME25等多个权威测评集上得分均属国际第一梯队1。更引人注目的是,豆包1.6的综合成本在原基础上降低了63%,每百万Tokens输入价格低至0.8元,输出8元,这意味着企业能以原三分之一左右的价格获得新模型,极大地降低了AI应用的门槛1

除了文本生成,字节跳动在多模态领域也成果显著。豆包视频生成模型Seedance 1.0 pro在文生视频、图生视频两个维度登顶全球竞技场第一,其每生成一条5秒的1080P视频成本仅需3.67元,远低于主流竞品1。同时,豆包·实时语音模型也已全量上线开发平台方舟,对企业客户开放,进一步夯实了AI应用和Agent的核心交互能力1

在AI基础设施方面,火山引擎正在构建一个全面的AI云原生技术底座,以满足未来Agent的多元交互需求。这包括了MCP服务、PromptPilot智能提示工具、AI知识管理系统、veRL强化学习框架等一系列创新产品,以及多模态数据湖、AICC私密计算、大模型应用防火墙等安全套件1。谭待强调,这些产品背后是技术范式的深刻改变:以往的架构为程序员设计,而现在Agent通过模型策略与工具、环境交互,需要更优的模型和Agent平台。数据也从“For BI”(商业智能)转向“For AI”1。这种全栈式的AI云原生服务升级,旨在为企业提供构建和部署生产级Agent所需的完整能力。

字节跳动的积极进击,也为低迷多年的中国公有云市场注入了新的活力。IDC数据显示,2024下半年中国公有云市场增速达17.7%,创近两年新高1。字节跳动内部数据显示,豆包大模型的日均Tokens调用量持续高速增长,从去年12月的4万亿跃升至今年5月底的16.4万亿1。广发证券首席分析师旷实指出,火山引擎在AI大模型调用量上的领先,得益于字节跳动底层强大的推荐算法中台、数据中心以及软硬件基础架构的统一,通过AI云原生优化计算、存储与网络架构,从而实现大幅降价并保持毛利1。这种“以小搏大”的价格战策略,正冲撞着国内云计算市场的原有格局,迫使其他厂商被动跟随。

前路漫漫:挑战与生态构建

尽管在AI大模型和基础设施建设上取得了显著进展,字节跳动的AI Agent豪赌之路仍面临诸多挑战和不确定性。

首先,核心模型能力是基石。火山引擎的模型调用量主要来自豆包大模型家族,其必须持续迭代,保持在第一梯队,才能与火山引擎形成更好的协同效应。大模型在推理和多模态方面的性能,将直接影响Agent的落地速度和质量。

其次,基础设施成本与扩展性是Agent大规模落地的巨大瓶颈。一位Agent领域的VENTURER指出,现有云服务难以兼容短时高并发与长时大规模需求,多平台严格的身份验证也制约了Agent的自主性和跨场景协同能力1。如何持续优化AI基础设施的效率与成本,是字节跳动必须克服的技术难题。

再者,生态构建对字节跳动而言尤为关键。相较于阿里巴巴等拥有强大开源技术栈和B端基因的科技巨头,字节跳动在B端市场的积累相对较弱。AI Agent的核心竞争力将不再仅仅是底层模型的“智商”高低,而是其融入实际场景、解决具体问题、形成商业闭环的能力,这需要强大的平台生态和丰富的应用支撑。为此,火山引擎已启动V-START加速器计划,旨在扶持AI、具身智能、跨境出海等领域的初创企业,加速生态建设1。此外,对于企业客户而言,私有化部署的能力也是重要的考量因素。例如,尽管字节跳动的Coze平台在智能体开发上表现出色,但缺乏私有化部署选项,这使得许多拥有历史数据或规模的创业团队更倾向于选择Dify等开源、可私有化部署的智能体开发平台1

最后,激烈的市场竞争与人才稳定也是不可忽视的因素。AI作为不可错失的时代机遇,阿里、腾讯、百度等国内大厂,以及智谱AI、阶跃星辰、Manus等创新型创业公司,都在全面布局并凭借各自基因建立竞争优势。同时,字节跳动虽然在过去两年吸纳了大量AI人才,但人才的稳定性仍是外界关注的焦点,近期已有AI核心人才传出变动消息1

字节跳动在AI大模型的首场战役中,以其独特的执行力和价格策略逆袭进入第一梯队。然而,AI Agent的未来之战,将是一场更为全方位的生态之战,比拼的将是科技公司对现实世界的颠覆能力、持续的技术迭代能力和产品创新能力。这场赌局才刚刚开启,字节跳动已然坐上牌桌,等待着新的牌局。

References


  1. 刘宝丹(2024/6/11)。字节必须再赢一次。全天候科技。检索日期2025/6/17。 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎