硅谷AI战局:Meta抄袭疑云、OpenAI模型挫败与超级智能的竞速

温故智新AIGC实验室

科技巨头在追求超级智能的道路上正经历前所未有的混乱与挑战:Meta被曝在模型开发中仓促模仿DeepSeek导致失败,OpenAI的GPT-4.5因“过度参数化”而折戟,而苹果则因保守策略在AI竞赛中结构性落后,这场以万亿美元计的军备竞赛远不止技术之争,更是权力、意志与战略的前沿较量。

硅谷,这片孕育着全球科技变革的土壤,如今正被一场前所未有的AI军备竞赛所席卷。然而,在这场被寄予厚望的竞赛中,看似光鲜的表象之下,却是混乱、挫折与深层的战略博弈。SemiAnalysis创始人兼CEO Dylan Patel,这位在AI和半导体领域享有盛誉的行业大佬,近期在一场访谈中,毫不留情地揭露了当前顶尖AI公司内部的诸多乱象,从Meta的模型“翻车”到OpenAI的旗舰产品失利,再到苹果的结构性滞后,无不映射出这场技术变革深远而复杂的影响。1

Meta的困境与AI人才争夺战

曾经被寄予厚望的Meta Llama系列大模型,在Patel看来,其后续的Behemoth、Maverick和Scout模型恐怕永远不会发布。问题根源在于,Meta在某些模型上的训练方式和决策被证明是行不通的。Patel直言,有一个模型显然是为了匆忙应对DeepSeek而赶工出来的,它试图借鉴DeepSeek的Mixture of Experts(MoE)架构,却最终“搞砸了”。具体表现为,模型甚至未能有效将Token传递到某些专家模块,导致部分“专家”在训练过程中无所事事,训练资源大量浪费。

诡异的是,Meta明明拥有全球顶尖的人才和海量算力,为何会一再失手?Patel认为,症结在于缺乏一位“懂技术、能做决断、能选对方向”的技术领导者,导致顶尖研究员的时间被浪费在错误的研究路线上。他强调,在AI模型研发中,判断什么值得研究、什么不值得研究,这本身就是一种“品味”和直觉的艺术。错误的策略可能通过内部政治手段被采纳,最终导致项目“翻车”。

在技术路径受挫的同时,Meta在人才市场上却显得异常激进。近几个月来,马克·扎克伯格不惜代价,高薪挖角OpenAI、SSI(安全超级智能)和Thinking Machines等公司的“全明星团队”,甚至传闻开出上亿美元年薪,或直接收购公司来获取人才。Patel指出,扎克伯格对ASI(超级智能)态度的转变十分微妙,从最初的不相信短期内能实现,到如今成为其坚定的“信徒”。他认为,Meta疯狂的挖角和收购,本质上是争夺对「权力」的掌控:谁能带领团队实现超级智能,谁就能主宰万亿级公司的AI战略,并将产品推向数十亿用户。这已然是一场产品人、理想主义者与科技巨头之间的全面竞速,印证着“超级智能不再是‘能不能’,而是‘谁先’”这一判断。

OpenAI:从GPT-4.5的失利到推理的觉醒

当主持人问及GPT-4.5的失败原因时,Patel直截了当地评价其“没什么用,而且太慢了”。这款代号为“Orion”的模型,曾被OpenAI内部寄予厚望,计划成为GPT-5。OpenAI为此投入巨资,从2024年初开始训练,全力押注规模,试图用所有可用数据构建一个庞大模型。

然而,结果却出人意料。Patel透露,GPT-4.5尽管“的确是第一个把自己逗笑的模型”,但实际使用中效果不佳,速度慢且成本高昂。失败的核心原因被归结为“过度参数化”——模型过于庞大,记住了太多东西,以至于“不再进步”,并未真正建立世界模型,而是在泛化。这与谷歌DeepMind在2022年Chinchilla论文中提出的Scaling Law(模型参数量与Token数的最佳比例)有所出入。Patel认为,随着模型架构的变化,Chinchilla论文的结论已不再完全适用,OpenAI不得不在GPT-4.5的训练中使用了远超Token数量的参数。

更糟糕的是,训练代码中存在一个持续数月的PyTorch bug,虽小却严重干扰了整个训练过程,导致研究者不得不频繁从检查点重启训练。这些问题共同导致了GPT-4.5的惨败,核心问题在于数据不足

然而,在GPT-4.5遭遇挫折的同时,OpenAI内部的另一个团队却有了突破性发现,即代号为“Strawberry”的推理技术。这项发现令人惊叹地表明,仅仅依靠推理,就能以低得多的成本显著提升模型的效率和质量。这意味着,即使在投入巨资训练庞大模型之后,OpenAI也发现了一条通过优化推理来提升性能的“魔力”路径。这无疑对未来大模型的研发方向提供了新的启示,即并非一味追求模型规模,更高效的推理策略同样关键。

巨头博弈:苹果的AI失误与微软的复杂联盟

在这场AI竞赛中,苹果无疑是目前显而易见的“输家”。Patel认为,苹果缺乏公开大模型和研发细节并非“佛系”,而是彻底的结构性落后。其保守的收购策略、对开源文化的疏离、与GPU巨头英伟达的长期隔阂,以及自身缺乏AI研究氛围的现状,都使得苹果难以吸引顶尖AI人才,只能招募“第二梯队”的人员。

苹果力推的“端侧AI”之路也面临挑战。尽管强调隐私与低延迟,但大模型日益膨大,手机芯片难以支撑。多数用户宁愿免费使用云端AI,也不愿为本地推理额外购买昂贵硬件。即便是轻量级任务,复杂的AI服务如搜索、日程规划等,仍需依赖云端数据与算力。Patel指出,苹果深知这一点,因此正悄然建造超大数据中心,部署Mac芯片进行云端AI推理,并挖来谷歌TPU团队关键人物,目标是自研AI加速器。这表明,苹果表面强调“本地AI”,实则已将宝押在了云端,为AI时代的“云大战”做准备。

与此同时,OpenAI与微软这对曾经的“AI界最强CP”也已度过蜜月期。OpenAI曾依靠微软的巨额投资和Azure算力迅速崛起,然而两家公司的合作协议复杂且微妙:微软没有OpenAI股权,却拥有大部分利润分成权、所有IP使用权,甚至在AGI实现前,能使用OpenAI的所有技术。这意味着,一旦超级智能诞生,微软理论上可在第一时间获取所有代码。

尽管OpenAI如今已不再受限于微软的云服务,开始与Oracle、CoreWeave等公司合作,微软也放弃了部分独家权以规避反垄断风险,但其“优先承购权”依然存在。Patel观察到,OpenAI野心膨胀,旨在成为全球资本最密集的初创公司,五年内不打算盈利并持续融资;而微软虽手握代码库,却尚未真正动手自己开发核心模型。双方心照不宣地相互防备,这种脆弱的平衡随时可能打破。

超级智能:一场意志与资源的全面较量

那么,在这场烧钱无上限的AI军备竞赛中,谁将率先抵达ASI的彼岸?Dylan Patel坚定地选择了OpenAI。他认为,OpenAI是每个重大突破的先行者,几乎主导了从预训练到推理、再到多模态能力等每一个关键技术突破,始终走在最前面。他预言,单靠推理可能无法将我们带入下一代AI,未来一定会有更深层的技术变革,而OpenAI似乎仍在酝酿着更大的野心。

紧随其后的是Anthropic。尽管其技术实力雄厚、团队经验丰富,但其模型发布、研究透明度和安全策略都过于保守。不过,Patel也注意到Anthropic正逐渐“放开”,Claude 4的发布节奏明显加快,招聘也开始招募更“正常”的人才。

第三梯队则是谷歌、Meta和xAI之间的激烈竞争。谷歌拥有深厚的技术底蕴,xAI则有埃隆·马斯克强大的资源加持,而Meta则不惜砸下巨资疯狂挖人。

这场对超级智能的追逐,其核心远不止技术本身。它是一场关乎权力、产品愿景、理想主义与科技巨头资源调配的全面博弈。正如Patel所言,真正引领这场叙事转向的是Ilya Sutskever,他总是率先看到一切,并身体力行地创办SSI,甚至拒绝了Meta的巨额收购。对于Meta这样的巨头而言,如果最终目标是超级智能,那么无论是1亿美元还是10亿美元的投入,相比其潜在的万亿级市场和市值,都不过是沧海一粟。这场超级智能之战才刚刚拉开序幕,每家公司都有可能率先到达终点,最终的胜负将取决于技术、意志与资源的全面博弈。

引用


  1. 36氪. Meta抄袭DeepSeek大翻车?硅谷大佬爆料亮点满满,AI军备烧钱真相震碎硅谷·新智元·Aeneas 好困(2025/7/2)·检索日期2025/7/2 ↩︎