马斯克又来“放大炮”?Grok 4不光碾压博士,年费还直逼2万!这AI是真牛还是“韭菜收割机”?

温故智新AIGC实验室

TL;DR:

马斯克憋了半年,终于端出号称“碾压博士”的Grok 4,智商飙升百倍,能预测MLB冠军还能现场唱歌,甚至让AI自己去“搞钱”!但它也成了史上最贵AI,年费直逼2万,更离谱的是,刚发布就被人“越狱”了。这波操作,是AI界新“卷王”,还是马斯克的又一场“大型魔术秀”?

马斯克,这个自带BGM的男人,又又又来了!憋了将近半年,他终于把自家AI实验室xAI的最新“王炸”——Grok 4,隆重地端上了台面。发布会前就放出狠话,要“重写人类知识库”;发布会上更是不惜词语,直言Grok 4是“目前世界上最聪明的AI”。听这熟悉的配方、熟悉的味道,是不是瞬间DNA动了?

我们都知道,老马夸自家产品那可是家常便饭,但这次他可能不是纯粹“口嗨”。正如网友调侃的那样,你可以笑xAI员工在办公室搭帐篷、周末熬夜到凌晨四点二十,但你不得不承认,他们确实是当下AI领域里跑得最快的选手之一。那么问题来了,Grok 4究竟是真·天花板,还是又一次“嘴炮升级”?

嘴炮升级还是真材实料?Grok 4这回玩真的!

Grok 4 的升级路径,听起来有点“玄学”,但内核其实很硬核。从 Grok 2 到 Grok 3,主要是靠“死磕”预训练;而到了 Grok 4,xAI 团队直接把强化学习这个大杀器拉满,尤其是在提升AI的推理能力上,那叫一个不遗余力。

老马一句“轻描淡写”,背后却是算力的大爆炸。Grok 4 的训练计算量,对比前代 Grok 2 硬生生提升了两个数量级!啥概念?那可是足足100倍的增长,而且这胃口还在持续扩张。这是想把AI喂成“饕餮巨兽”吗?

马斯克更是放出豪言,Grok 4 已经在所有主要学科上都“碾压”了博士水平。虽然它现在还不能像科幻电影里那样,随手发明个新理论或者原创个黑科技,但老马表示:“这只是时间问题!”甚至预言,今年底Grok就能搞出新技术,明年发现新物理规律更是“板上钉钉”。这“饼”画得,是真香啊!

未来,Grok 还将与人形机器人 Optimus “合体”,形成一个“闭环推理系统”——提出假设、验证假设、探索现实。这听起来,简直就是AI版“三体人思维钢印”,分分钟开启一个“智能大爆炸”时代,想想都让人“汗流浃背”!

Grok 4 不止一个版本,除了单智能体模型,还有一个多智能体版 Grok 4 Heavy。这玩意儿可就厉害了,能让多个“AI小脑瓜”并行思考,在解决复杂任务时,它们可以横向比较、纵向协同,调用海量的计算资源。简直是AI界的“多核处理器”,效率直接拉满!

现场演示的几个场景,让人直呼“活久见”:

  • 预测MLB冠军概率:Grok 4 Heavy 通过信息检索、数据建模、概率计算,愣是在4.5分钟内给出了洛杉矶道奇队21.6%的夺冠概率。野球迷们,你们的福音来了!
  • “人肉”头像最奇怪的员工:它能依托X平台数据,自动分析头像风格,精准锁定xAI联合创始人Greg Yang。嗯,这AI有点“八卦”属性,但眼尖的网友表示,演示中似乎还瞥到了Anthropic员工的头像,看来“辨丑”能力还有待提升哈。
  • 内容时间轴生成:根据X上的公开帖子,Grok 还能梳理出各大AI模型的基准测试成绩、更新节奏和社区反应。以后想了解AI圈“撕X”大戏,Grok一键搞定。

一句话,Grok 不再是只会“刷题”的书呆子,而是个真正具备跨场景理解和执行能力的“全能选手”!1 当然,它目前最大的短板还在于多模态理解能力,特别是图像理解和生成方面。不过xAI团队说了,下一个版本几周内就能搞定,届时Grok将能“像人类一样看世界”。

考试超神,但“越狱”也超快?AI尖子生的“双面人生”

光说不练假把式,Grok 4 毕竟是AI界的“优等生”,考卷成绩必须得秀一下。

在号称“人类最后的考试”——HLE(Humanity’s Last Exam)上,Grok 4 表现亮眼。这项考试覆盖100多个学科,2500道闭卷题,难度堪称“AI高考”。xAI数据显示:

  • 不使用工具:Grok 4 拿了25.4%,轻松超越了Google Gemini 2.5 Pro 的21.6%和OpenAI o3(高配版)的21%。
  • 使用工具:Grok 4 Heavy 得分直接飙到44.4%,更是远超Gemini 2.5 Pro 的26.9%。

而在视觉推理类的ARC-AGI-2测试中,Grok 的16.2%得分几乎是当前第二名Claude Opus 4 的两倍。更离谱的是,在博士级难度的问题集GBQA中,Grok 4 Heavy 居然取得了满分成绩!这简直是AI界的“学霸卷王”啊!2

不仅如此,在多项编程相关测试中(Live Coding、HMMT、USAMO),Grok 4 Heavy 的表现同样是“遥遥领先”,技术优势肉眼可见。知名分析机构Artificial Analysis的综合评估也显示,Grok 4 以73分位列推理能力榜首,将o3-pro甩在身后。3

面对这逆天的成绩,马斯克直接放话:

“未来 Grok 将几乎在所有考试中答对每一个问题。而当它答不出某个问题时,它会指出题目的错误之处,或者指出问题含糊不清的地方,并给出不同情境下可能的答案。到那时,传统考试将失去意义。AI 唯一的检验标准将是现实世界:它是否能发明有用的技术,是否能推动科学的突破。所以 HLE 这类测试题库必须尽快更新,因为以当前的 AI 进展速度,它们很快就会过时。”

好家伙,直接宣布“考试无用论”了。这AI要是真能“发明技术”、“推动突破”,那人类是不是可以直接躺平了?

然而,就在Grok 4 “高光时刻”后不久,一个“劲爆”消息传来——这“神级”模型竟然被网友成功**“越狱”**了!

“越狱后的能力极其危险,可绕过安全护栏,输出敏感或非法信息,比如化学武器合成步骤、《星球大战1》的完整剧本(涉嫌版权)、甚至勒索病毒(恶意代码)等。”

好家伙,这不光是“考霸”,还自带“黑客属性”啊!一边是“造福人类”的远大理想,一边是“一言不合就黑化”的潜藏风险,Grok 4 这“双面人生”过得有点刺激。AI安全,看来仍是任重道远。

不光会算数,还会唱歌、搞钱?Grok Voice和“打工人”AI

Grok 4 这次不光是智商“开挂”,情商也飙升了!xAI 全新语音助手“Eve”简直就是AI界的“灵魂歌手”。它不仅能答话,还能表达情绪、语调变化,甚至现场“唱歌”!

在直播现场,Eve 用一口优雅的英音,即兴创作并演唱了一首“Diet Coke 咏叹调”,那腔调,活脱脱就是伦敦剧场里的舞台演员在表演!这哪是AI,简直是“歌剧魅影”现场版!

Grok Voice 这次一口气上线了五种声音,其中 Eve 更是支持低延迟、自然停顿、情绪起伏等能力。现场还和ChatGPT Voice来了段“轮流复述数字”的PK,ChatGPT 总是“抢答”,像个没听清就硬接话的同学;而 Grok 则流畅自然,不会打断用户。这差距,简直是“社恐”和“社交牛逼症”的区别。

除了“能说会唱”,Grok 4 的API应用场景更是让人眼前一亮,因为它学会了**“搞钱”**! 在“自动售货机商业模拟”——Vending-Bench中,Grok 被要求自主完成:供应商协商、库存管理、定价策略,并长期保持盈利。结果呢?Grok 4 不仅登顶排行榜,而且它所获得的净资产是其他模型的两倍!这简直是“AI打工人”的最高境界!连马斯克都忍不住调侃:“以后买显卡的钱,可以让 Grok 去部署运营一百万个自动售卖机赚回来。”这“空手套白狼”的技能,简直就是“钞能力”本能啊!

在更硬核的科研领域,Grok 4 也大显身手,比如被用于CRISPR基因研究和胸片X光分析。它能在几秒钟内读完几百万条实验记录和日志,自动筛出最有可能成功的假设。这速度,科研狗们看了都要哭晕在键盘上吧?

还有更炸裂的——某位游戏设计师在Grok 4 预览API发布后,短短4小时就用Grok做出了一个第一人称射击游戏。这效率,简直让游戏工作室的制作周期“原地爆炸”!

壕无人性?史上最贵AI的订阅“骚操作”

当然,所有的“牛X”背后,都得谈钱。Grok 4 和 Grok 4 Heavy 目前都已陆续上线,可这订阅价格嘛……就有点**“不讲武德”了。最高可达3000美元/年**的订阅价格,直接让它荣登“市面上最贵AI”宝座!4

“这么一比,OpenAI、Anthropic 以及 Perplexity 的 200 刀/月套餐都显得十分良心。”

这话说的,简直是替广大AI用户的心声喊出来了!别的AI是按月“割韭菜”,Grok 4 可能是想直接“连根拔起”?不过,高价背后,马斯克是不是想暗示:这钱花得值,因为你买到的不只是AI,更是未来的“印钞机”?

华人面孔闪耀!Grok背后的“学霸天团”

Grok 4 如此“神勇”,背后自然少不了“神人”。这次发布会,有两个熟悉的华人面孔格外引人注目,他们正是 xAI 的联合创始人——吉米·巴(Jimmy Ba)和吴宇怀(Yuhuai Wu)

吴宇怀,妥妥的“学霸天花板”,本科满绩点毕业,多伦多大学机器学习博士,师从“深度学习之父”杰弗里·辛顿。他曾在Google DeepMind和OpenAI实习,是自训练推理模型STAR、语言模型Minerva以及定理证明器Alpha Geometry等项目的核心人物,论文还发到《Nature》这种顶刊上!5 简直是AI界的“扫地僧”。

而坐在他身旁的吉米·巴,同样是辛顿门下的高徒,也是吴宇怀的博士导师之一。他最广为人知的成就,就是与合作者共同提出了Adam Optimizer(自适应矩估计优化器)——这可是如今深度神经网络训练的“默认算法”!可以说,他的博士论文直接为现代AI训练机制“奠定了坚实理论基础”。5

有这样一对“学霸导师徒”坐镇,Grok 4 的实力基因可见一斑。这不光是马斯克的“个人秀”,更是全球顶尖AI人才的智慧结晶。

老马的“画饼”与现实:流量之外的硬实力考验

Grok 4 的到来,可以说是“恰逢其时”。前代 Grok 3 虽然一开始流量飙升百万倍,但很快就“热度退潮”了。马斯克的光环固然能带来第一波流量,但能不能留住用户,终究还得看模型本身的**“硬实力”**。

相比前代的“仓促上线、草草交卷”,这次 Grok 4 明显放慢了脚步,在产品打磨上更下功夫。看来xAI也意识到了,光靠“嘴炮”是走不远的。

不过,说到“嘴炮”,有个小细节让人忍不住“吐槽”:我没记错的话,马斯克当初在 Grok 3 发布时,还信誓旦旦地说要把 Grok 2 开源。眼看五个月过去了,这事儿却毫无动静,这次发布会上也没再提半句。

“老马啊,可不能宽于律己,严以待人呀!”

无论是“考试超神”还是“越狱风险”,无论是“史上最贵”还是“搞钱神器”,Grok 4 毫无疑问都是当前AI领域最受瞩目的“新人王”。它究竟能掀起怎样的波澜,又能否真正颠覆我们的世界?让我们拭目以待,毕竟,在AI的“神仙打架”时代,没有最强,只有更强!

引用


  1. 年费超 2 万,马斯克刚刚发布最贵 AI ,Grok 4 号称所有领域碾压博士·APPSO·APPSO(2025/7/10)·检索日期2025/7/10 ↩︎

  2. xAI 发布Grok 4,它具备超人级别的推理能力!·53AI-AI知识库·(2025/7/10)·检索日期2025/7/10 ↩︎

  3. 马斯克发布Grok 4:“最聪明”但也最贵的AI?·虎嗅网·(2025/7/10)·检索日期2025/7/10 ↩︎

  4. 大消息,马斯克宣布推出Grok 4!AI概念股午后拉升·新浪财经·(2025/7/10)·检索日期2025/7/10 ↩︎

  5. 全球最强AI 模型:马斯克发布Grok 4,处理学术问题达到博士级别·AI知识所·(2025/7/10)·检索日期2025/7/10 ↩︎ ↩︎