OpenAI Codex进入手机,国产“龙虾”们该醒醒了

HelloKitty 2026-05-15 14:29

扫一扫 在手机阅读、分享本文

472

本文由 世界模型工场 撰写/授权提供,转载请注明原出处。

以下文章来源于:世界模型工场

作者:世界模型工场

今天,OpenAI 推送了一个更新,却在科技圈引发了大量讨论。

Codex 正式进入 ChatGPT 手机 App。

现在,你可以在等地铁的时候,掏出手机看看 AI 昨晚帮你完成了哪些任务,或者批准一个它等待已久的决定。

然后,把手机揣回口袋,它继续工作,你该干嘛干嘛。

这不只是程序员的新玩具。

任何人都可以用它来完成工作,比如:写报告、整理数据、处理文件、自动化流程。AI 真正做到了随时待命、持续工作。

但这个更新,对普通人意味着什么?

对已经喊了好几个月"养龙虾"的国内大厂来说,是不是一场真正的噩梦?

一场早已开打的 Agent 战争

要理解 Codex 为什么让人兴奋,得先搞清楚它在做一件什么事。

过去我们用 AI,是一种问答关系。

你打开 ChatGPT,输入问题,它回答,你复制粘贴,然后你自己去执行。

Codex 不一样。

它是一个 Agent,你交代任务,它去做,直到把事情做完。

更关键的是,手机端上线之后,它不需要你守在电脑旁边,AI 可以在你睡觉、通勤、开会的时候持续工作。

但 Codex 不是第一个想到这件事的。

同样能做的,还有 Anthropic 的 Claude Code,以及 OpenClaw,也就是中文互联网上火遍全国的"龙虾"。

OpenClaw 是最早跑出来的。

它开源、免费、可以接入任何大模型,它有持久记忆,越用越懂你;

它可以嵌进微信、飞书、钉钉,通过消息软件接收指令;

它甚至可以设定定时任务,在你没开口的时候主动去做事情。

从功能设计上看,它比 Codex 和 Claude Code 都要超前。

但 OpenClaw 有一个根本性的问题:它是极客玩具。

你得自己部署、配 API、修 bug,普通人看完教程就直接放弃了。

而且安全事故真实发生过,有人的邮件被批量删除,有人的信用卡被盗刷,有人多年积累的工作文件被一键清空。

它的一个核心维护者甚至在社区里警告:"如果你不懂命令行,这个项目对你来说太危险了。这句话,基本上已经替它划定了用户边界。

Claude Code 和 Codex,就是在这个边界之外覆盖了更大的市场。

相较之下,Claude Code 更早进入开发者视野。

今年 2 月,Anthropic 就给 Claude Code 装上了远程控制。开发者扫个二维码,手机上就能接管电脑里的会话。

算下来,比 OpenAI 早了将近三个月,但热闹程度远比不上今天。

原因很简单,Claude Code 太贵了,而且它在终端里敲命令的操作方式,天然就把普通人挡在了门外。

于是,Codex 在这里打出了差异:更低的定价,更流畅的产品体验,加上今天上线的手机端,把 AI 干活这件事做成了真正触手可及的功能。

三者之间的关系,其实可以用一句话概括:

OpenClaw 验证了需求,Claude Code 教育了市场,Codex 在收割。

Codex 今天的动作,明确传递了一个信号,Agent 的战场,正在从开发者圈子向所有人扩张。

价格越低、门槛越低、随时可用,这就是方向。

但真正应该感到压力的,不是 Claude Code。

国内“龙虾”们,该醒醒了

过去几个月,国内科技圈掀起了一场"养龙虾"热潮。

阿里、腾讯、字节、百度......几乎所有叫得上名字的大厂,都推出了自己的 OpenClaw 集成产品。

地方政府跟着入场,补贴政策一个接一个,单项支持最高达 500 万元。

媒体铺天盖地,"AI 数字员工""一人公司""生产力革命",概念一个比一个响。

但热闹背后,有一个问题没人愿意正面回答:

这些产品,真的能干活吗?

说穿了,国内大厂做的"龙虾"产品,大多数走的是同一条路:

在 OpenClaw 的开源框架上套一层壳,接入自家的大模型,再打通飞书、微信、钉钉这些已有的流量入口。

这条路最快,成本最低,也最容易讲故事。

但 OpenClaw 只是个框架,真正决定 Agent 能不能干活的,是背后的模型。

Agent 任务,对模型的推理能力、指令理解、容错处理要求极高。

Codex 背后是 OpenAI 最新的模型,Claude Code 背后是 Anthropic 的 Claude。

国内大模型这两年进步显著,但在这类复杂任务的完成质量上,差距依然存在,短期内靠工程层面的包装很难补上。

结果就是,用户满怀期待地养了一只“龙虾”,交代了任务,等来的是一个做到一半的结果,或者一个需要反复纠错的流程。

新鲜感过去之后,留存率才是真相。

这些产品的商业逻辑,本来是靠 Agent 带动 token 消耗和云服务收入。

但如果 Agent 干不好活,用户根本不会持续用。

没有持续使用,token 消耗无从谈起,云服务的想象空间也就此打住。

更麻烦的是,Codex 今天的动作,把比较基准拉高了。

以前用户可能不知道 Agent 工具能做到什么程度,将就着用也就过去了。

但当 Codex 这样的产品触手可及、价格透明、体验流畅,用户的预期就变了。

一旦预期被拉高,那些能用但不好用的产品,用户会加速失去耐心。

国产“龙虾梦”,还能做多久?

那么,这场仗最终会怎么打?

有一个细节值得注意。

Codex 手机端上线的同一天,OpenAI 顺手披露了一个数字:

每周超过 400 万人在用 Codex。

这表明 Agent 工具的普及速度,比大多数人预期的要快,窗口期正在收窄。

对国内厂商来说,最危险的不是今天。

今天 Codex 还没有完全打通中文语境,还没有深度接入国内办公生态,本地化运营也几乎空白。

但问题是,这些护城河能撑多久?

当身边的人开始用 Codex 真正把活干完,本土产品的比较劣势就会从数据变成口碑,从口碑变成用户流失。

更关键的是,这场竞争的本质不是产品之争,而是模型之争。

模型能力的积累,是时间和资源堆出来的,没有捷径。

所以摆在国内厂商面前,其实只有两条路。

一条是继续追赶通用 Agent 能力,正面竞争。

这条路最难,需要的是真正的模型投入,而不是生态套壳。但如果跑出来,回报最大。

另一条是放弃通用,深挖垂直。

医疗、法律、制造、政务,这些场景对数据安全、本地部署、行业知识有极高要求,是国外产品短期内很难渗透的地方,也是本土厂商的优势所在。

但无论走哪条路,有一件事已经无法回避:

靠"龙虾"概念圈用户的时代,结束了。

微信图片_20260429135151_20_202.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

精选活动 更多 >

{{ val.activity_name }}

{{ val.province ? (val.province + ' ' + val.city) : val.location }}
客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章