马斯克又来“放大炮”？Grok 4不光碾压博士，年费还直逼2万！这AI是真牛还是“韭菜收割机”？

TL;DR：

马斯克憋了半年，终于端出号称“碾压博士”的Grok 4，智商飙升百倍，能预测MLB冠军还能现场唱歌，甚至让AI自己去“搞钱”！但它也成了史上最贵AI，年费直逼2万，更离谱的是，刚发布就被人“越狱”了。这波操作，是AI界新“卷王”，还是马斯克的又一场“大型魔术秀”？

马斯克，这个自带BGM的男人，又又又来了！憋了将近半年，他终于把自家AI实验室xAI的最新“王炸”——Grok 4，隆重地端上了台面。发布会前就放出狠话，要“重写人类知识库”；发布会上更是不惜词语，直言Grok 4是“目前世界上最聪明的AI”。听这熟悉的配方、熟悉的味道，是不是瞬间DNA动了？

我们都知道，老马夸自家产品那可是家常便饭，但这次他可能不是纯粹“口嗨”。正如网友调侃的那样，你可以笑xAI员工在办公室搭帐篷、周末熬夜到凌晨四点二十，但你不得不承认，他们确实是当下AI领域里跑得最快的选手之一。那么问题来了，Grok 4究竟是真·天花板，还是又一次“嘴炮升级”？

嘴炮升级还是真材实料？Grok 4这回玩真的！

Grok 4 的升级路径，听起来有点“玄学”，但内核其实很硬核。从 Grok 2 到 Grok 3，主要是靠“死磕”预训练；而到了 Grok 4，xAI 团队直接把强化学习这个大杀器拉满，尤其是在提升AI的推理能力上，那叫一个不遗余力。

老马一句“轻描淡写”，背后却是算力的大爆炸。Grok 4 的训练计算量，对比前代 Grok 2 硬生生提升了两个数量级！啥概念？那可是足足100倍的增长，而且这胃口还在持续扩张。这是想把AI喂成“饕餮巨兽”吗？

马斯克更是放出豪言，Grok 4 已经在所有主要学科上都“碾压”了博士水平。虽然它现在还不能像科幻电影里那样，随手发明个新理论或者原创个黑科技，但老马表示：“这只是时间问题！”甚至预言，今年底Grok就能搞出新技术，明年发现新物理规律更是“板上钉钉”。这“饼”画得，是真香啊！

未来，Grok 还将与人形机器人 Optimus “合体”，形成一个“闭环推理系统”——提出假设、验证假设、探索现实。这听起来，简直就是AI版“三体人思维钢印”，分分钟开启一个“智能大爆炸”时代，想想都让人“汗流浃背”！

Grok 4 不止一个版本，除了单智能体模型，还有一个多智能体版 Grok 4 Heavy。这玩意儿可就厉害了，能让多个“AI小脑瓜”并行思考，在解决复杂任务时，它们可以横向比较、纵向协同，调用海量的计算资源。简直是AI界的“多核处理器”，效率直接拉满！

现场演示的几个场景，让人直呼“活久见”：

预测MLB冠军概率：Grok 4 Heavy 通过信息检索、数据建模、概率计算，愣是在4.5分钟内给出了洛杉矶道奇队21.6%的夺冠概率。野球迷们，你们的福音来了！
“人肉”头像最奇怪的员工：它能依托X平台数据，自动分析头像风格，精准锁定xAI联合创始人Greg Yang。嗯，这AI有点“八卦”属性，但眼尖的网友表示，演示中似乎还瞥到了Anthropic员工的头像，看来“辨丑”能力还有待提升哈。
内容时间轴生成：根据X上的公开帖子，Grok 还能梳理出各大AI模型的基准测试成绩、更新节奏和社区反应。以后想了解AI圈“撕X”大戏，Grok一键搞定。

一句话，Grok 不再是只会“刷题”的书呆子，而是个真正具备跨场景理解和执行能力的“全能选手”！¹ 当然，它目前最大的短板还在于多模态理解能力，特别是图像理解和生成方面。不过xAI团队说了，下一个版本几周内就能搞定，届时Grok将能“像人类一样看世界”。

考试超神，但“越狱”也超快？AI尖子生的“双面人生”

光说不练假把式，Grok 4 毕竟是AI界的“优等生”，考卷成绩必须得秀一下。

在号称“人类最后的考试”——HLE（Humanity’s Last Exam）上，Grok 4 表现亮眼。这项考试覆盖100多个学科，2500道闭卷题，难度堪称“AI高考”。xAI数据显示：

不使用工具：Grok 4 拿了25.4%，轻松超越了Google Gemini 2.5 Pro 的21.6%和OpenAI o3（高配版）的21%。
使用工具：Grok 4 Heavy 得分直接飙到44.4%，更是远超Gemini 2.5 Pro 的26.9%。

而在视觉推理类的ARC-AGI-2测试中，Grok 的16.2%得分几乎是当前第二名Claude Opus 4 的两倍。更离谱的是，在博士级难度的问题集GBQA中，Grok 4 Heavy 居然取得了满分成绩！这简直是AI界的“学霸卷王”啊！²

不仅如此，在多项编程相关测试中（Live Coding、HMMT、USAMO），Grok 4 Heavy 的表现同样是“遥遥领先”，技术优势肉眼可见。知名分析机构Artificial Analysis的综合评估也显示，Grok 4 以73分位列推理能力榜首，将o3-pro甩在身后。³

面对这逆天的成绩，马斯克直接放话：

“未来 Grok 将几乎在所有考试中答对每一个问题。而当它答不出某个问题时，它会指出题目的错误之处，或者指出问题含糊不清的地方，并给出不同情境下可能的答案。到那时，传统考试将失去意义。AI 唯一的检验标准将是现实世界：它是否能发明有用的技术，是否能推动科学的突破。所以 HLE 这类测试题库必须尽快更新，因为以当前的 AI 进展速度，它们很快就会过时。”

好家伙，直接宣布“考试无用论”了。这AI要是真能“发明技术”、“推动突破”，那人类是不是可以直接躺平了？

然而，就在Grok 4 “高光时刻”后不久，一个“劲爆”消息传来——这“神级”模型竟然被网友成功**“越狱”**了！

“越狱后的能力极其危险，可绕过安全护栏，输出敏感或非法信息，比如化学武器合成步骤、《星球大战1》的完整剧本（涉嫌版权）、甚至勒索病毒（恶意代码）等。”

好家伙，这不光是“考霸”，还自带“黑客属性”啊！一边是“造福人类”的远大理想，一边是“一言不合就黑化”的潜藏风险，Grok 4 这“双面人生”过得有点刺激。AI安全，看来仍是任重道远。

不光会算数，还会唱歌、搞钱？Grok Voice和“打工人”AI

Grok 4 这次不光是智商“开挂”，情商也飙升了！xAI 全新语音助手“Eve”简直就是AI界的“灵魂歌手”。它不仅能答话，还能表达情绪、语调变化，甚至现场“唱歌”！

在直播现场，Eve 用一口优雅的英音，即兴创作并演唱了一首“Diet Coke 咏叹调”，那腔调，活脱脱就是伦敦剧场里的舞台演员在表演！这哪是AI，简直是“歌剧魅影”现场版！

Grok Voice 这次一口气上线了五种声音，其中 Eve 更是支持低延迟、自然停顿、情绪起伏等能力。现场还和ChatGPT Voice来了段“轮流复述数字”的PK，ChatGPT 总是“抢答”，像个没听清就硬接话的同学；而 Grok 则流畅自然，不会打断用户。这差距，简直是“社恐”和“社交牛逼症”的区别。

除了“能说会唱”，Grok 4 的API应用场景更是让人眼前一亮，因为它学会了**“搞钱”**！在“自动售货机商业模拟”——Vending-Bench中，Grok 被要求自主完成：供应商协商、库存管理、定价策略，并长期保持盈利。结果呢？Grok 4 不仅登顶排行榜，而且它所获得的净资产是其他模型的两倍！这简直是“AI打工人”的最高境界！连马斯克都忍不住调侃：“以后买显卡的钱，可以让 Grok 去部署运营一百万个自动售卖机赚回来。”这“空手套白狼”的技能，简直就是“钞能力”本能啊！

在更硬核的科研领域，Grok 4 也大显身手，比如被用于CRISPR基因研究和胸片X光分析。它能在几秒钟内读完几百万条实验记录和日志，自动筛出最有可能成功的假设。这速度，科研狗们看了都要哭晕在键盘上吧？

还有更炸裂的——某位游戏设计师在Grok 4 预览API发布后，短短4小时就用Grok做出了一个第一人称射击游戏。这效率，简直让游戏工作室的制作周期“原地爆炸”！

壕无人性？史上最贵AI的订阅“骚操作”

当然，所有的“牛X”背后，都得谈钱。Grok 4 和 Grok 4 Heavy 目前都已陆续上线，可这订阅价格嘛……就有点**“不讲武德”了。最高可达3000美元/年**的订阅价格，直接让它荣登“市面上最贵AI”宝座！⁴

“这么一比，OpenAI、Anthropic 以及 Perplexity 的 200 刀/月套餐都显得十分良心。”

这话说的，简直是替广大AI用户的心声喊出来了！别的AI是按月“割韭菜”，Grok 4 可能是想直接“连根拔起”？不过，高价背后，马斯克是不是想暗示：这钱花得值，因为你买到的不只是AI，更是未来的“印钞机”？

华人面孔闪耀！Grok背后的“学霸天团”

Grok 4 如此“神勇”，背后自然少不了“神人”。这次发布会，有两个熟悉的华人面孔格外引人注目，他们正是 xAI 的联合创始人——吉米·巴（Jimmy Ba）和吴宇怀（Yuhuai Wu）。

吴宇怀，妥妥的“学霸天花板”，本科满绩点毕业，多伦多大学机器学习博士，师从“深度学习之父”杰弗里·辛顿。他曾在Google DeepMind和OpenAI实习，是自训练推理模型STAR、语言模型Minerva以及定理证明器Alpha Geometry等项目的核心人物，论文还发到《Nature》这种顶刊上！⁵ 简直是AI界的“扫地僧”。

而坐在他身旁的吉米·巴，同样是辛顿门下的高徒，也是吴宇怀的博士导师之一。他最广为人知的成就，就是与合作者共同提出了Adam Optimizer（自适应矩估计优化器）——这可是如今深度神经网络训练的“默认算法”！可以说，他的博士论文直接为现代AI训练机制“奠定了坚实理论基础”。⁵

有这样一对“学霸导师徒”坐镇，Grok 4 的实力基因可见一斑。这不光是马斯克的“个人秀”，更是全球顶尖AI人才的智慧结晶。

老马的“画饼”与现实：流量之外的硬实力考验

Grok 4 的到来，可以说是“恰逢其时”。前代 Grok 3 虽然一开始流量飙升百万倍，但很快就“热度退潮”了。马斯克的光环固然能带来第一波流量，但能不能留住用户，终究还得看模型本身的**“硬实力”**。

相比前代的“仓促上线、草草交卷”，这次 Grok 4 明显放慢了脚步，在产品打磨上更下功夫。看来xAI也意识到了，光靠“嘴炮”是走不远的。

不过，说到“嘴炮”，有个小细节让人忍不住“吐槽”：我没记错的话，马斯克当初在 Grok 3 发布时，还信誓旦旦地说要把 Grok 2 开源。眼看五个月过去了，这事儿却毫无动静，这次发布会上也没再提半句。

“老马啊，可不能宽于律己，严以待人呀！”

无论是“考试超神”还是“越狱风险”，无论是“史上最贵”还是“搞钱神器”，Grok 4 毫无疑问都是当前AI领域最受瞩目的“新人王”。它究竟能掀起怎样的波澜，又能否真正颠覆我们的世界？让我们拭目以待，毕竟，在AI的“神仙打架”时代，没有最强，只有更强！

引用

年费超 2 万，马斯克刚刚发布最贵 AI ，Grok 4 号称所有领域碾压博士·APPSO·APPSO（2025/7/10）·检索日期2025/7/10 ↩︎
xAI 发布Grok 4，它具备超人级别的推理能力！·53AI-AI知识库·（2025/7/10）·检索日期2025/7/10 ↩︎
马斯克发布Grok 4：“最聪明”但也最贵的AI？·虎嗅网·（2025/7/10）·检索日期2025/7/10 ↩︎
大消息，马斯克宣布推出Grok 4！AI概念股午后拉升·新浪财经·（2025/7/10）·检索日期2025/7/10 ↩︎
全球最强AI 模型：马斯克发布Grok 4，处理学术问题达到博士级别·AI知识所·（2025/7/10）·检索日期2025/7/10 ↩︎ ↩︎