你的浏览器禁用了JavaScript, 请开启后刷新浏览器获得更好的体验!

o1突发内幕曝光？谷歌8月论文已揭示原理，大模型光有软件不存在护城河

HelloKitty • 2024-09-18 17:48

扫一扫在手机阅读、分享本文

6935

本文由量子位撰写/授权提供，转载请注明原出处。

本文来源：量子位（QbitAI）

作者：明敏

发布不到 1 周，OpenAI 最强模型 o1 的护城河已经没有了。

有人发现，谷歌 DeepMind 一篇发表在 8 月的论文，揭示原理和 o1 的工作方式几乎一致。

这项研究表明，增加测试时（test-time）计算比扩展模型参数更有效。

基于论文提出的计算最优（compute-optimal）测试时计算扩展策略，规模较小的基础模型在一些任务上可以超越一个 14 倍大的模型。

网友表示：

这几乎就是 o1 的原理啊。

众所周知，奥特曼喜欢领先于谷歌，所以这才是 o1 抢先发 preview 版的原因？

有人由此感慨：

确实正如谷歌自己所说的，没有人护城河，也永远不会有人有护城河。

就在刚刚，OpenAI 将 o1-mini 的速度提高 7 倍，每天都能使用 50 条；o1-preview 则提到每周 50 条。

计算量节省 4 倍

谷歌 DeepMind 这篇论文的题目是：优化 LLM 测试时计算比扩大模型参数规模更高效。

研究团队从人类的思考模式延伸，既然人面对复杂问题时会用更长时间思考改善决策，那么 LLM 是不是也能如此？

换言之，面对一个复杂任务时，是否能让 LLM 更有效利用测试时的额外计算以提高准确性。

此前一些研究已经论证，这个方向确实可行，不过效果比较有限。

因此该研究想要探明，在使用比较少的额外推理计算时，就能能让模型性能提升多少？

他们设计了一组实验，使用 PaLM2-S*在MATH 数据集上测试。

主要分析了两种方法：

（1）迭代自我修订：让模型多次尝试回答一个问题，在每次尝试后进行修订以得到更好的回答。

（2）搜索：在这种方法中，模型生成多个候选答案，

可以看到，使用自我修订方法时，随着测试时计算量增加，标准最佳N策略（Best-of-N）与计算最优扩展策略之间的差距逐渐扩大。

使用搜索方法，计算最优扩展策略在初期表现出比较明显优势。并在一定情况下，达到与最佳 N 策略相同效果，计算量仅为其 1/4。

在与预训练计算相当的 FLOPs 匹配评估中，对比 PaLM 2-S*（使用计算最优策略）一个 14 倍大的预训练模型（不进行额外推理）。

结果发现，使用自我修订方法时，当推理 tokns 远小于预训练 tokens 时，使用测试时计算策略的效果比预训练效果更好。但是当比率增加，或者在更难的问题上，还是预训练的效果更好。

也就是说，在两种情况下，根据不同测试时计算扩展方法是否有效，关键在于提示的难度。

研究还进一步比较不同的 PRM 搜索方法，结果显示前向搜索（最右）需要更多的计算量。

在计算量较少的情况下，使用计算最优策略最多可节省 4 倍资源。

对比 OpenAI 的 o1模型，这篇研究几乎是给出了相同的结论。

o1 模型学会完善自己的思维过程，尝试不同的策略，并认识到自己的错误。并且随着更多的强化学习（训练时计算）和更多的思考时间（测试时计算），o1 的性能持续提高。

不过 OpenAI 更快一步发布了模型，而谷歌这边使用了 PaLM2，在 Gemini2 上还没有更新的发布。

网友：护城河只剩下硬件了？

这样的新发现不免让人想到去年谷歌内部文件里提出的观点：

我们没有护城河，OpenAI 也没有。开源模型可以打败 ChatGPT。

如今来看，各家研究速度都很快，谁也不能确保自己始终领先。

唯一的护城河，或许是硬件。

（所以马斯克哐哐建算力中心？）

有人表示，现在英伟达直接掌控谁能拥有更多算力。那么如果谷歌/微软开发出了效果更好的定制芯片，情况又会如何呢？

值得一提的是，前段时间 OpenAI 首颗芯片曝光，将采用台积电最先进的 A16 埃米级工艺，专为 Sora 视频应用打造。

显然，大模型战场，只是卷模型本身已经不够了。

参考链接：

https://www.reddit.com/r/singularity/comments/1fhx8ny/deepmind_understands_strawberry_there_is_no_moat/

微信图片_20240802161354.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫码关注公众号

获取更多技术资讯

上一篇：疯狂对标OpenAI，智谱AI要背水一战

下一篇：吴泳铭治下的阿里：淘天不打价格战，阿里云打

精选活动更多 >

{{ val.activity_name }}

{{ val.province ? (val.province + ' ' + val.city) : val.location }}

热门文章

快手拆了可灵，字节拆豆包还会远么

快手拆了可灵，字节拆豆包还会远么

2026-06-01

AI支付体系正在改变什么

AI支付体系正在改变什么

2026-06-01

A16Z合伙人最新判断：模型不会终结一切，AI应用还有机会

A16Z合伙人最新判断：模型不会终结一切，AI应用还有机会

2026-06-01

疯狂烧了数十亿美元 Token 之后，硅谷大厂开始限制员工 Token 用量了

疯狂烧了数十亿美元 Token 之后，硅谷大厂开始限制员工 Token 用量了

2026-06-02

撕掉“体育”单一标签，咪咕卷入AI短剧巨头之战

撕掉“体育”单一标签，咪咕卷入AI短剧巨头之战

2026-06-02

73天过会，宇树科技今年最快IPO！

73天过会，宇树科技今年最快IPO！

2026-06-02

Agent集体进化！腾讯谷歌们加码，AI打工人要普及了？

Agent集体进化！腾讯谷歌们加码，AI打工人要普及了？

2026-06-03

运营商卖Token，AI行业进入全面收割期？

运营商卖Token，AI行业进入全面收割期？

2026-06-03