潮汐转向：字节跳动人才回流与中国AI大模型创业的深层变局

在中国AI大模型创业的激烈竞争中，一度被视为“AI六小龙”的核心初创公司正经历一场深刻的战略调整，从追求“模型与应用双轮驱动”转向“技术优先”。这一转变导致曾被重金招募的字节跳动产品人才纷纷“回流”或另觅赛道，凸显出AI领域对技术深度而非表面产品力的极致追求。

中国AI大模型领域的生态正在经历一场剧烈的潮汐。曾几何时，承载着“国产OpenAI”梦想的“AI六小龙”（后缩减为“AI四小强”）以其领先一步的模型创新，吸引了无数顶尖人才，其中不乏来自字节跳动（ByteDance）的资深产品专家。这些在移动互联网时代铸就了“APP工厂”神话的“字节大神”们，被寄予厚望，希望他们在AI浪潮中再次复制C端应用的辉煌。然而，随着2025年的深入，一股“退货潮”正悄然兴起，字节系高管们在AI初创公司中的角色正被重新定义，甚至被边缘化。

AI大模型战略的转向与人才潮汐

字节跳动，凭借其在过去十余年间打造出今日头条、抖音、剪映等一系列超级应用的能力，累积了深厚的产品开发和运营经验，培养了一大批行业顶尖的To C产品人才。在AI大模型创业的初期，当“四小强”——智谱AI、MiniMax、月之暗面和阶跃星辰——纷纷手握数十亿融资，试图构建“模型和应用双轮驱动”的战略时，这些字节系人才无疑是攻占C端应用高地的最佳人选。前今日头条用户产品负责人张前川加入MiniMax并被授予合伙人身份¹，以及前字节皮皮虾负责人张心皓出任阶跃星辰旗下应用“冒泡鸭”的产品负责人，都是这一趋势的典型缩影。据不完全统计，在过去两年内，已有超过20名字节系高管投身AI创业浪潮¹。

“双轮驱动”策略在当时是主流共识。如光年之外创始人王慧文所言，只做应用不做模型可能被技术迭代吞噬，只做模型不做应用则可能因数据缺失而落后。尽管李彦宏等业界巨头曾明确指出，多数创业公司难以负担双轮驱动的巨大投入，应聚焦应用，但在融资热潮的助推下，明星初创公司们几乎无一例外地选择了这条道路。月之暗面创始人杨植麟甚至激进地提出Kimi要走“Super App”路径，斥巨资进行用户增长和留存的推广。这种策略下，字节系产品人才的重要性不言而喻。一位头部大模型产品战略负责人曾透露，当技术迭代相对平稳时，公司会协调产品团队，在应用侧投入更多资源¹。

然而，这股人才涌入的潮汐正在逆转。近期，前皮皮虾负责人张心皓被调离阶跃星辰核心岗位，转任顾问这一“虚职”；MiniMax前产品负责人张前川也早在此前改任产品顾问¹。同时，前月之暗面核心产品负责人明超平更是正式离职，转而专注于AI Coding应用创业。这些现象不仅仅是偶发的人事变动，其背后反映的是中国AI大模型创业公司在战略层面的深刻转向。

技术优先的回归：深层驱动力

“四小强”们之所以改变策略，从“模型与应用双轮驱动”重新聚焦于“技术优先”，核心驱动力源于外部竞争格局的急剧变化和融资环境的恶化。

首先，DeepSeek的异军突起成为一个关键的转折点²。DeepSeek以其卓越的技术创新，在推理模型领域取得了令人瞩目的成绩，其V3模型发布后，迅速在国内外开发者社区引发了广泛关注，成为大模型技术优先性回归的直接导火索¹。它的出现，使得市场和投资人重新审视，并更加强调基座模型的底层能力。明超平在复盘Kimi激进投流策略时坦言，没有人能预知DeepSeek的崛起，这反映出当时业界对技术突破路径的不确定性。当核心技术壁垒被证明仍是竞争胜负手时，先前在应用层面的投入，尤其是大规模烧钱获取用户的做法，开始显得低效甚至不必要。

其次，从2024年下半年开始，全球范围内的AI融资环境趋冷，资本对大模型的投资态度由狂热转向审慎¹。初创公司不再能够轻易获得巨额资金来同时支撑模型研发和大规模应用推广。有限的资源使得它们必须做出取舍，而核心技术能力无疑是其生存和发展的基石。

在多重因素叠加下，“四小强”们不约而同地调整了战略：月之暗面在2025年2月停止了此前单月过亿的投流，重新将技术指标置于首位；MiniMax不再将用户规模和商业化作为重点，转而将技术迭代确立为最重要目标；智谱AI也明确将训练下一代基座模型视为最高优先战略；阶跃星辰则重申了对AGI（通用人工智能）终极目标的追求¹。

这种战略重心的转移，直接导致了那些擅长C端应用、运营和增长的字节系产品人才“英雄无用武之地”。他们的价值在于用户洞察和产品迭代，而非模型训练和算法优化。当公司需要把所有资源倾斜到更底层的技术研发上时，产品线的优先级自然下降，人员的调整也便随之而来。

竞争加剧：国产大模型的未来图景

当前，“四小强”们再次回到了最初的起跑线——必须靠强大的模型能力来证明自己在牌桌上继续存在的资格。曾被冠以“六小龙”称号的初创公司，其地位很大程度上依赖于它们在早期模型能力上领先大厂一步的优势，例如智谱率先探索对标OpenAI的技术路线，月之暗面发布200万字长上下文能力，MiniMax抢先字节发布视频生成产品等¹。然而，随着字节、阿里、腾讯等科技巨头进入新一轮AI饱和式投入期，这些先发优势已逐渐被追平甚至超越。

更严峻的挑战是，新的技术突破者并非来自这些明星初创公司。DeepSeek引发的推理模型热潮，以及Manus带来的通用Agent（智能体）竞争，都表明创新火花可以在任何地方点燃，而不仅仅局限于被高度关注的“四小强”。这使得“六小龙”的含金量大幅贬值，甚至有观点认为，中国的AI竞争最终将聚焦于“清华系VS浙大系”等学术背景的较量²。

面对内外部的巨大压力，MiniMax已率先有所行动，近期发布了首个推理模型M1，宣称支持100万token的上下文输入，暂时成为全球输入输出最长的推理模型¹。据报道，2025年7月份将迎来“四小强”的模型密集上新，阶跃星辰有望推出新一代基座模型，月之暗面和智谱也将有新动作传出¹。

然而，竞争远未结束。OpenAI首席执行官Sam Altman已在近期播客中首次公开透露，GPT-5有望在2025年夏天亮相¹。同时，按照DeepSeek以往每七个月更新一代模型的节奏，其新一代V4模型也有望在2025年7月左右面世¹。这意味着，在这些国产大模型初创公司竭力证明自己技术实力的同时，它们还必须在与全球顶尖玩家的竞争中，寻找到独特的差异化优势。

字节系人才的回流，不仅仅是简单的公司人事变动，它更是中国AI大模型产业从“应用探索狂热”走向“技术深度聚焦”的深刻缩影。这场关于技术实力和生存资格的淘汰赛，才刚刚进入高潮。

References

字母榜（2025/6/19）。六小龙留不住字节大神。字母榜。检索日期2025/6/19。 ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎ ↩︎
凤凰网（2025/6/19）。六小龙留不住字节大神。凤凰网。检索日期2025/6/19。 ↩︎ ↩︎