被扫地出门18个月后，马斯克终复仇OpenAI

HelloKitty • 2025-02-19 10:40

扫一扫在手机阅读、分享本文

4724

本文由鲸选AI 撰写/授权提供，转载请注明原出处。

文章来源于：鲸选AI

作者：鲸哥

2 月 18 日，马斯克发布完 Grok 3 大模型后，转发了一条推特：

划重点，Grok3 目前世界第一强模型（竞技场得分 1400），比 OpenAI 的推理模型还厉害，18 个月就超越了山姆·奥特曼领导下的 OpenAI。

要知道马斯克曾是 OpenAI 的天使投资人，甚至 Open 这个关键词就是马斯克帮取名的。变化发生在 2018 年，奥特曼与马斯克在“开源还是闭源”的问题上彻底决裂。马斯克坚信，人工智能必须透明开放以规避风险；而奥特曼则在资本压力下选择与微软结盟，将技术封闭于商业护城河内。

此前大家都相安无事，因为当时 ChatGPT 还没那么厉害。就在 2022 年末，ChatGPT4 横空出世后，马斯克对于被踢出了这么一个跨时代项目，就开始碎碎念了。应了那句话：『不怕分手，就怕前任过得好。』

这段往事在 2024 年再度被点燃。马斯克以“违背公益初衷”为由，对 OpenAI 发起诉讼，指控其将技术垄断权拱手让给微软。这场官司虽未胜诉，却为马斯克埋下了一颗复仇的种子——2023 年 7 月，马斯克成立 xAI 实验室，开始发布 Grok 系列模型，对标 OpenAI 的 GPT 系列模型。

大力出奇迹，

18 个月追上 OpenAI

在 Grok3 发布会上，开场 xAI 介绍了他们的决心：

『122 天，建成了 10 万显卡集群，再过了 92 天后，建成了 20 万张 H100 显卡集群。』这是世界上最大的 H100 算力集群。

很多朋友不懂这个数据的意义，这意味着 Grok3 训练算力超过了 DeepSeek V3 的 263 倍，却只带来超过 DeepSeek 33% 的 Benchmark 能力。

Scaling Law 是否失效暂且不提，就说这大手笔投入算力基础设施，也算是体现了马斯克追赶的决心。

短短 2 年内，xAI 接连推出 Grok 系列模型：从参数量为 3140 亿的 Grok-1，到支持多模态的 Grok-1.5 Vision，追赶 ChatGPT 4o 的 Grok 2，以及今天登顶的 Grok 3，Grok每一步都试图用“暴力开源”策略撕裂 OpenAI 的闭源壁垒。

重要时间节点是在 2024 年底。xAI 在田纳西州孟菲斯建成了一座堪比“算力核电站”的数据中心，10 万块英伟达 H100 GPU 组成的集群，让 Grok 3 的训练速度比前代提升十倍。马斯克在推特上写道：“算力即权力，而我们将拥有最暴力的武器。”

此后马斯克宣布融资 60 亿美元，继续投资 Grok 大模型的训练。这笔钱比国内大模型六小虎的融资总额还多。

在 xAI 成立的 18 个月（不到 2 年时间）后，Grok 3 正式发布，成功登顶最强大模型。

Grok 3 的“量子跃升”，

有何杀手锏？

2025 年 2 月 18 日，全球百万观众涌入直播平台，见证马斯克的最新大模型，此前他在中东的 AI 大会上，宣布将发布全球最聪明的大模型 Grok 3。现在看来 Grok 3 名副其实，具有诸多强悍能力。

技术核爆点一：最聪明的模型

基准测试数据显示，Grok 3 达到了 1400 的 Elo 得分，这是其他任何模型都未曾达到的。

Grok 3 在 AIME 2025 科学推理测试中得分超过 Gemini 2 Pro 和 GPT-4o，其迷你版模型甚至在编程任务中击败了 DeepSeek-R1。

可能大家已经被大模型刷榜测试的传闻，搞得不太相信这些数据的真实性。国外有拿到 Grok 3 测试的大神，测试了超过人类和一些大模型理解的《卡坦岛》问题：。

“创建一个显示六边形网格的棋盘游戏网页，就像游戏中的 Settlers of Catan 一样。每个六边形网格的编号从 1 到 N，其中 N 是六边形瓷砖的总数。使其通用，以便可以使用滑块更改“环”的数量。例如，在 Catan 中半径为 3 个六边形。请使用单个 html 页面。”

他评价很少有模型能够可靠地做到这一点。顶级的 OpenAI 思维模型（例如 o1-pro，每月 200 美元）也能做到这一点，但 DeepSeek-R1、Gemini 2.0 Flash Thinking 和 Claude 都没有做到这一点。

甚至数学历史上著名的未接知名『黎曼猜想』，Grok 3 也会尝试去算，不像 O1-Pro、Claude 等模型直接回答做不了，放弃了。

技术核爆点二：动态反思机制

Grok 3 引入“思维链”推理技术，能像人类一样拆解复杂任务并实时修正逻辑断层。现场演示中，Grok 3 仅用 30 秒便生成了一份从地球到火星的航天器轨迹图，并标注出引力弹弓效应的最佳利用节点。

『你能看到 Grok 真的在做一些模糊思考，这样模型就不会被立即完全复制。』

图中可以看到，在数学测试中，Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 的 91 分和 96 分，超越了 o3mini 的 87 分、o1 的 83 分和 DeepSeek-R1 的 80 分。

同样在科学和编程两项中，Grok3 两款模型也存在一定程度上的领先。

技术核爆点三：更多呈现模式

Grok 3 不仅能解锁测试时间计算，还能启用强大的代理。这些能力促成了一款名为 DeepSearch 的新产品。“下一代搜索代理，用于理解宇宙”。DeepSearch 还会展示它进行搜索时所采取的步骤。

不仅如此，Elon 强调了 Grok 3 的创意涌现能力。在这个和 DeepSeek 十分相似的页面上，Grok 新增了第三个标签按钮『Big Brain』。使用“大脑模式”，通过更多计算资源和推理来使用 Grok 3，也许会呈现意想不到的效果。

未来 Grok 3 应该不太限制大模型的创作风格，以及思考创意的边界。相比之下，OpenAI 则是解除了 ChatGPT 的成人内容限制，这就。。。。。

口水战打不完，奥特曼的反击

面对 Grok 3 的突袭，OpenAI 并非毫无动作。

发布会前天，山姆·奥特曼在 X 平台宣称：“GPT-4.5 将带来 AGI 的初体验。”预计 GPT-4.5 也会在一两周内发布，届时拿出满血的 O3，应该能夺回全球最佳模型的宝座。

此前，一个由马斯克牵头的财团拟出价 974 亿美元收购 OpenAI，后者的首席执行官萨姆・阿尔特曼对此回应称，" 不用了，谢谢，但如果你愿意，我们可以以 97.4 亿美元的价格收购推特（即如今的 X）" 后。

商业竞争互相都不手软，口水战也打个不停。

未来两家公司还存在路线竞争。与 OpenAI 的闭源策略针锋相对，Grok 3 承诺未来“开源”，Grok 2 将在一个月内开源，并计划接入特斯拉车载系统和 Optimus 人形机器人。

同时，xAI 同步推出了“Super Grok”订阅服务，以每月 49 美元的价格向开发者开放深度搜索（DeepSearch）功能——这种能交叉验证信息来源、公开推理路径的引擎，直指 ChatGPT 的“黑箱”痛点。

更深层的冲击来自生态层面。Grok 3 的开源策略吸引了大量开发者涌入，而特斯拉的硬件布局（如 Model Q 车载系统）则为 AI 落地提供了现实场景。

2025 年，AI 领域的权力天平正在倾斜。Grok 3 的颠覆性不仅在于技术，更在于它重新点燃了“开源理想主义”的火种。正如一位硅谷投资人所言：“马斯克用 Grok 3 完成了一场迟到的复仇，但这场战争的真正赢家，或许是那些终于看见技术透明曙光的人们。”

山姆·奥特曼会拿出怎样的竞争手段回击呢？

微信图片_20250103163534.jpg

微信图片_20230104175528.jpg

扫码关注公众号

获取更多技术资讯

上一篇：腾讯的搜索梦，被DeepSeek再次点燃

下一篇：微信接入DeepSeek：全民AI时代的重要转折点

精选活动更多 >

{{ val.province ? (val.province + ' ' + val.city) : val.location }}

被扫地出门18个月后，马斯克终复仇OpenAI

{{ val.activity_name }}

腾讯AI秘密“换船”：元宝失宠，WorkBuddy接棒

腾讯高管：今年腾讯大部分代码都由AI生成

Claude深夜炸场！放出史上最强“危险级”模型Fable 5，价格太逆天

vivo、荣耀接连入场，戳破了具身智能的AI叙事

苹果把Siri交给了Gemini

豆包必须要收费了

视频模型巨大的「隐形成本」，没人告诉你

微信“抢婚”豆包？

腾讯AI秘密“换船”：元宝失宠，WorkBuddy接棒

腾讯高管：今年腾讯大部分代码都由AI生成

Claude深夜炸场！放出史上最强“危险级”模型Fable 5，价格太逆天

vivo、荣耀接连入场，戳破了具身智能的AI叙事

豆包必须要收费了

苹果把Siri交给了Gemini

视频模型巨大的「隐形成本」，没人告诉你

微信“抢婚”豆包？

智谱首破5000亿！六小虎与DeepSeek千亿估值竞赛，谁的拳头最硬？

突发！OpenAI高层巨震，ChatGPT与CodeX或合并，超级AI来了！

估值逼近快手，可灵分拆是一步好棋吗？

腾讯音乐，在AI噪音里贩卖真实

即梦和可灵，能不能接住AI短剧风口？

快手拆了可灵，字节拆豆包还会远么

排名第九、国内第二，DeepSeek V4 凭什么让人又爱又恨？

“出走”阿里两个月，林俊旸一出手就是20亿美金