Grok 4“炸场”背后:80%华人精英组团刷爆硅谷,这波“中国力量”马斯克都点赞!

温故智新AIGC实验室

TL;DR:

马斯克 xAI 团队的 Grok 4 新模型一夜屠榜,但更炸裂的是:一张“作战图”显示,80% 的核心成员竟然都是华人!这波操作直接让硅谷沸腾,不仅模型能打,这“梦之队”才是真正的王炸

各位吃瓜群众注意了!最近硅谷AI圈简直是**“杀疯了”,马斯克家的 xAI 团队又双叒叕扔出了一枚“深水炸弹”——全新一代大模型 Grok 4。发布会短短一小时,它就像坐上了火箭,直接“刷爆”了 AIME 2025、人类最后的考试(HLE)两大基准,把所有同行都“整不会了”。这背后,可是狂堆了20万块GPU,算力直接飙涨了100倍**的硬核操作!1

但你以为故事到这儿就完了?Too young too simple!真正让全网**“炸锅”的,是随后流出的一张 xAI 团队“作战图”。这不看不知道,一看吓一跳,80% 的面孔竟然都是华人学者!从清华、上交到浙大,从斯坦福到CMU,各路“学霸天花板”齐聚一堂,甚至还有一位“C位出道”的95后联创。硅谷顶尖人才争夺战里,这简直是给小扎(扎克伯格)们来了个“王炸暴击”**,估计他现在正盯着招聘启事流口水呢。

xAI 研究员 Xuechen Li 感慨得那叫一个到位:

一小群顶尖人才在极致专注下的爆发力,竟能在极短时间内取得如此巨大的成就!1 这话,可不是吹牛皮

华人天团:这阵容,堪比“复仇者联盟”!

俗话说,“龙生龙,凤生凤,老鼠的儿子会打洞”,AI 圈的顶级成果,果然得靠顶级的“脑力”!Grok 4 发布会上,马斯克身边坐的两位老熟人,就是华人面孔:

  • Jimmy Ba:多伦多大学计算机科学助理教授,更是 AI 大佬 Hinton 的**“嫡系传人”**,xAI 的创始团队成员之一,排面十足1
  • 吴怀宇(Tony Wu):这位更牛,妥妥的95后,多伦多大学博士。曾经是 AlphaGeometry、AlphaStar 的核心开发者,少年英才,未来可期!1

除了这两位“门面担当”,xAI 核心团队里,华人精英更是**“卧虎藏龙”**:

  • Greg Yang(杨格):哈佛数学系本硕,导师是鼎鼎大名的数学家丘成桐,微软高级研究员出身。这履历,直接拉满!1
  • Zihang Dai(戴子航):清华计算机本科,CMU 硕士博士,前谷歌大脑研究员。Transformer 架构的**“老司机”**,NLP 领域的大牛。1
  • Guodong Zhang(张国栋):浙江大学学士,多伦多大学博士,谷歌 DeepMind 研究科学家。名校履历,实力担当。1
  • Shengyang Sun:清华学士,多伦多大学计算机博士。曾在英伟达和亚马逊担任高级研究科学家,AI 专家团队的**“带头大哥”**。1
  • Bill Yuchen Lin(林禹臣):上海交通大学 IEEE 荣誉班,南加州大学博士,现任 xAI 研究员兼华盛顿大学客座助理教授。专注于 LLM 对齐、AI 智能体训练,这妥妥的是**“多面手”**!1
  • Xuechen Li:北京四中、多伦多大学学士,斯坦福大学计算机科学系硕士博士。曾在谷歌和微软实习,妥妥的**“学神”**级别。1
  • Haotian Liu:浙江大学学士,威斯康星大学麦迪逊分校博士。Grok-1.5V、Grok-2、Grok-3 的核心开发者。这是要一路“开挂”到 Grok N 的节奏?1
  • Lianmin Zheng:上海交通大学 ACM 班,UC 伯克利博士。他和小伙伴们还共同创立了非营利组织 LMSYS.org,致力于开源大模型研究。这格局,杠杠的!1
  • 还有像 Wenhan Xiong 这样的**“行业大佬”,曾是 Meta GenAI 团队的 AI 研究科学家,Llama2/3、CodeLlama 的核心作者。1 甚至有研究员 Yifei Zhou 为了加入 xAI,直接“豪横”**地暂停了 UC 伯克利博士学位!这魄力,简直是“AI 狂热者”的真实写照!1

这名单太长,简直就是一份**“华人 AI 精英图鉴”,看得人直呼“不明觉厉”**。难怪马斯克都亲自盖章认证:xAI 办公室氛围“很 nice”!1 估计是这群天才聚在一起,碰撞出的火花能把房顶都掀翻。

Grok 4:不是“嘴炮”,是真“能打”!

光有**“神仙团队”还不够,产品必须得“能抗打”。Grok 4 这次,还真不是靠马斯克的“嘴炮”营销(虽然他确实爱说 Grok 4“比所有领域博士都聪明”)。2 独立评测机构 Artificial Analysis 发布的测试结果,让它直接“坐稳了头把交椅”**。

  • 智能指数“封神”:在「Artificial Analysis 智能指数」中,Grok 4 以 73分的成绩拔得头筹,把 OpenAI o3、谷歌 Gemini 2.5 Pro、Anthropic Claude 4 Opus 这些老牌劲旅都**“甩在身后”**了!1
  • 代码数学“双料王”:在「编码指数」和「数学指数」两大关键领域,Grok 4 更是**“一骑绝尘”,全部排名第一。这简直是给程序员和数学家们“发福利”**啊!1
  • 高难度测试“刷纪录”:GPQA Diamond 测试中,Grok 4 拿到 88% 的历史最高分,直接**“打破”**了 Gemini 2.5 Pro 此前的纪录。在那个让无数 AI **“头秃”的「人类最后的考试」(Human Last Exam)中,Grok 4 也以 24% 的成绩创下新高,虽然听起来不高,但在没有工具辅助的情况下,这已经是“天花板”**了!13 MMLU-Pro 和 AIME 2024 也分别拿到了 87% 和 94% 的最高分。1

当然,Grok 4 也不是**“完美无瑕”的“六边形战士”。在速度上,每秒输出 75 个 token,比 o3 和 Gemini 2.5 Pro 慢点,但比 Claude 4 Opus 快。1 上下文窗口 256k token,虽然没 Gemini 2.5 Pro 的 100 万 token 那么“海量”,但也“吊打”了 Claude 4 Sonnet/Opus 和 o3 的 200k。1 多模态能力、函数调用、结构化输出这些“标配”功能,自然也是“应有尽有”**。

争议来了:是“实力派”还是“过拟合”?

“金无足赤,人无完人”,模型也一样。正当大家对 Grok 4 “顶礼膜拜”的时候,“泼冷水”的声音也来了。知名大佬「karminski-牙医」在实测后“吐槽”,Grok 4 的代码基准结果可能有**“过拟合”的嫌疑。这意味着它可能在特定测试集上表现优异,但在实际复杂场景中,“容易翻车”**。

他举了个例子,不管是用到**“包浆”的“七边形小球弹跳”测试,还是刚新鲜出炉的“拆烟囱”测试,Grok 4 的表现竟然还不如旧版的 DeepSeek R1。“更离谱的是”,它生成的代码还得靠 Claude 来“debug”**才能跑起来。1

这就好比一个考试状元,结果一到实际操作就**“掉链子”。这到底是“AI 训练的必经之路”,还是“马斯克式营销的功劳”**,恐怕还需要更多时间去验证。

AI江湖:人才,才是永远的“王道”!

话说回来,Grok 4 的横空出世,以及它背后那支**“清一色”的华人“梦之队”,无疑给整个 AI 行业带来了巨大的冲击。在 AI 大模型“军备竞赛”愈演愈烈的今天,算力、算法固然重要,但真正决定胜负的,归根结底还是“人才”**!

这群“AI 大脑”们,不仅用硬核实力证明了中国科学家在全球 AI 领域举足轻重的地位,也再次印证了那句老话:“英雄不问出处”,但**“顶尖人才的汇聚之地”,往往就是创新和突破的“风暴眼”**。

未来 AI 的格局会如何变化?是 Grok 4 真的**“一路高歌猛进”,还是其他巨头“弯道超车”?唯一可以确定的是,这场围绕“最强大脑”“最强算力”的较量,只会越来越“刺激”!而我们,作为吃瓜群众,只管“搬好小板凳,坐看好戏”**!

引用