HelloKitty • 2026-06-11 15:42
36
本文由 新莓 撰写/授权提供,转载请注明原出处。
以下文章来源于:新莓
作者:翟文婷、王沐沐
技术在发展,衡量这个世界的单位也在扩展。
互联网时代,电脑只认 Byte(字节),这是打开新世界的新单位。所以张一鸣在为自己创办的商业组织筹划名字时,选了 ByteDance,即字节跳动。
AI 时代,Byte 依然存在,但是这个新世界的基础单位被另一个名词所代表,Token。过去一个月,因为「养龙虾」的热潮,不管你熟不熟悉,了不了解这个单词的含义,都在各种场合以各种形式被 Token 环绕甚至轰炸。
于是 3 月末,官方用「词元」赋予了 Token 在中文世界的含义。
不论监管、企业还是大众,AI 盛行之后,Token 无处不在,甚至开始跟我们的日常生活、工作密切相关。
这种压迫感的部分原因来自于黄仁勋的预言:Token 是新的大宗商品,成熟之后将像电力、自来水一样,成为分层定价的基础商品。而输入电力和数据,输出 Token,也就是新时代的「数字石油」。
没有人敢深究或怀疑这种类比是否准确,大家都或主动或被动地积极投身其中。Token 经济学的热度,以火箭的速度快速升温。
不论是普通人还是那些企业家,大家都怀抱两种不同程度但相近的心态:唯恐被 AI 抛弃的恐惧;抢占先机获利的贪婪。
Token 在变成一种货币单位
程序员是最先感受到这波 Token 经济学冲击的群体。
因为可以高效、快速地处理非常长的 context(上下文),AI Coding 是 Agent 最先落地的场景。
互联网公司开始向 AI 要生产效率,其中一个关键衡量指标就是 Token 消耗量。
昆仑万维在今年 2 月 25 日当天发布一封内部信,明确阐述了两个意思:
统一为所有技术研发序列的员工开通 OpenAI Codex 或 Claude Code 账号,公司将为每个账户提供每月 100 美金的额度支持。即日起,研发线员工强制使用上述 AI 工具,将开发效率提高至少 50%。
假如有人在今年 6 月底公司半年度绩效考核中,有人达不到 AI Coding 模式的要求,进行末尾淘汰,淘汰比例在 5-20%。
这些严厉的措辞,好像给每位程序员耳边拧上了闹钟倒计时。段子手们已经开始发挥:「被毕业的同事并没有消失,不过是被蒸馏成了 Token 继续陪伴你。」
也许对一些快速适应时代变化的打工人来说,可能这是他们与公司博弈的新筹码。
黄仁勋在今年 GTC 大会预测,未来每个工程师入职时都会拿到一份年度 Token 预算,基本工资之外再加一半用于购买 Token,让个人生产力放大 10 倍。
「从现在起,全世界的每一位 CEO 都会将业务视作 Token 工厂并将其直接与收入挂钩。」他甚至断言,「你的 offer 带多少 Token」会成为硅谷新的谈判筹码。
所以这会直接影响公司对人才结构和能力的判断标准:
58 同城董事长姚劲波在接受《中国企业家》采访时说,虽然公司还保留了过去的考核体系,但在提拔干部、调整组织结构时,最看重的就是 AI 能力:「如果我判断一个人不了解 AI、没有未来视野,绝对不会把他放到管理岗位。而 Token 消耗量、客户流程优化效果都是 AI 考核体系中重要的量化指标。」
3 月 25 日,月之暗面创始人杨植麟在公开演讲时也提到:今年、明年乃至未来几年内,人工智能的研究与研发方式将发生重大变化,越来越多的研究工作将由 AI 主导。未来每个研究员将配备海量的 Token,由 AI 自动合成新任务、构建新环境、定义最优奖励函数,甚至自主探索全新网络架构。
对 Token 的重视,让公司最高管理者对企业组织结构形态,产生新的思考:
3 月 16 日,阿里巴巴成立 Alibaba Token Hub(ATH)事业群,这是以「创造 Token、输送 Token、应用 Token」为核心目标的新组织,由阿里集团 CEO 吴泳铭直接负责。
AI 语境下,互联网公司内部小范围的组织架构调整、人员变动是常态。阿里 ATH 可能是在集团层面第一次大动干戈。以 Token Hub 为核心主线,强化 AI 业务战略协同,这不会是阿里的专属,而是互联网公司集体所向。
以及不久的将来,企业会重新定义研发和运营成本的含义:
阿里集团 2025 自然年年度财报电话会议上,CEO 吴泳铭就说过:现在许多企业在消耗 Token 时,不再将 Token 消耗视为其IT预算的一部分。相反,他们将 Token 视为其整体运营或研发成本的一部分。Token 是企业生产投入的关键组成部分。
姚劲波给内部传达的意思间接佐证了吴泳铭的判断:Token 用得越多越好,哪怕压力大,58 同城也会不计成本。
Token 消费的需求决定价格
3 月 23 日,国家数据局局长刘烈宏第一次在公开场合将 Token 称为「词元」时,他就曾解释,这不仅是智能时代的价值锚点,更是连接技术供给与商业需求的「结算单位」。
一锤定音。
如果从经济学的角度讲,需求是一切的根本。需求决定价格,需求决定供给。放在 Token 经济学范畴,这个定律依然适合。
有人在朋友圈分享,他们一家人一周 Token 消耗量已经达到 5 亿。
昆仑万维每月消耗 Token 数大概在 10000 亿到 12000 亿之间。58 同城全公司每天消耗接近 2000 亿 Token。
字节旗下的火山引擎是最早强调 Token 消耗量的。今天他们刚刚公布了最新数字:截至今年三月,豆包大模型日均 Token 使用量突破 120 万亿,过去三个月内增长了一倍。而去年 12 月,使用火山引擎 Token 消耗量突破万亿的企业数量就已经超100家。
从个人到企业,再到产业,Token 消耗量肉眼可见的大爆炸。
3 月 24 日,官方给出一个更全面的数据。到今年 3 月,我国日均 Token 调用量超过 140 万亿,相比 2024 年初的 1000 亿增长了 1000 多倍。
全球 AI 模型 API 聚合平台 OpenRouter 数据则显示,过去一年,平台内前十大模型的周 Token 调用量从 1.24 万亿暴增至近 14 万亿,增幅超 10 倍。而最近一周的 Token 使用总量超过 22 万亿,是 OpenClaw 发布前(2026 年 1 月)的三倍。
Token 被调用消耗数量呈几何数增长,背后很重要的一个原因是:AI Agent 的大跃进。
2025 年 Q1 财报公布,腾讯总裁刘炽平就说过,若向智能体 AI 演进,Token 需求将呈指数级增长。
此前,AI 应用以 Chatbot 形态为主,有人粗略统计过,单轮对话消耗约 1000 到 3000 个 Token。Agent 来临后,算力消耗增长从线性变为指数:一个完整任务可能触发几十上百次模型调用:规划、拆解、执行、反思、纠错,中等复杂度任务可能吃掉 10 万 Token,复杂任务则要上升到百万级。
因为 AI Agent 被视为一种更为先进的生产力,这是需求端爆发的重要原因。这也决定了 Token 现在的价格,不那么友好,普通人有些难以承受。
OpenAI 发布 GPT-5.4 的时候,有用户反馈测试一句「你好」就消耗掉了 80 美元的 Token。
而养龙虾兴起之后,有用户在小红书晒出账单。Token 消耗最高的一天达到 93 亿,假如按照最贵的模型 18 元来算,最高一天要花掉 1674 元。
但是 AI 有个特殊之处:谁发出的指令更好,产生的价值就越大。同样,用法不同,也涉及到背后的价格差异。如果无效消耗 Token,价格自然飙升。
猎豹移动 CEO 傅盛前不久在一条名为「老司机教你省 Token」的视频中说,通过一些使用技巧,他已经把 Token 费用从最初的一天 200 美元,降到现在的几十美元,甚至一天 10 美元。
企业目前对 Token 价格的因素可能还不够敏感,他们将其作为投入甚至投资的一种来看待,预期是产生更大的价值和收入,而不仅仅是消费。
甚至在他们看来,这是以当前的大投入换未来的小成本,所以姚劲波才敢说,不计成本。
但是假如未来 AI 生产成为普遍,全社会面对算力峰值的时候,他们是否还能做到「不计成本」?
产业链谁在获益?
阿里一句创造 Token、输送 Token、应用 Token,以 Token Hub 为核心主线,差不多是 Token 经济产业链的一个框架性描述。
Token 经济的上游是生产环节,而每一个 Token 的生成,都需要 AI 算力芯片提供支撑。芯片的算力密度、能效比、稳定性,直接决定了 Token 生产的成本上限与供给规模。
从这个角度讲,英伟达无疑是全球最大的 Token 工厂,关键是它还在决定 Token 的生产规则和定价机制。
今年 GTC 大会现场,黄仁勋就哪种模型,对应哪种 Token 的速度,以及对应哪个定价区间,以此需要什么级别的硬件来支撑,给出了清晰的图示。
关键在于,推理需求引发的算力紧张,使得芯片企业在过去几年收入大爆发。2025 年,英伟达全年营收为 2159.38 亿美元,同比增长 65.5%。全年净利润则为 1169.97 亿美元,同比增长 57.5%。
产业链的中游,就是连接 Token 生产与消费的枢纽,可以理解为是阿里和腾讯提到的 Token Hub。这是目前 Token 经济变数最多,想象空间最大的环节。
以阿里云、腾讯云、火山引擎为核心玩家的云厂商,就是负责将上游的算力资源,转化为标准化、场景化、高性价比的 Token 服务,再跟下游应用进行匹配和分发。他们决定了 Token 的流通效率与商业化边界。
AI 起步早期,云厂商之间价格战愈演愈烈,百万 Token 的价格被打到几毛钱,靠补贴抢市场成了行业常态。
现在,Token 消耗量变成行业重要核心指标。有厂商给销售团队制定了极端的考核政策,把 Token 业绩按 10 倍、20 倍折算进收入。因为谁能最大化「生产一个 Token 的成本」和「卖出一个 Token 的价格」之间的差值,谁就能获得更多利润。
尤其 OpenClaw 的爆发,驱动 Token 消耗激增,催生刚性算力需求。受到上游核心元器件涨价,AI 服务器的成本也被推高。
云厂商终于摆脱「用户用得越多,自己亏得越狠」的低价获客策略,顺势掀起一轮 AI 算力「涨价潮」。腾讯云、阿里云和百度云,几乎在一周时间内相继公布涨价。
3 月 18 日,腾讯 2025 年年度财报公布后,刘炽平在电话会议上解释,算力相关需求并非仅集中于 AI 算力,用户使用 A 工具开发软件后,软件运行将带来 CPU、常规内存、SSD、硬盘等全品类硬件的需求增长,形成硬件全链路的需求提升。而硬件供应链供应周期大幅拉长、且不确定性大幅降低,导致国内云服务行业将成本传导给客户。
而且腾讯似乎对 Token 消耗量为衡量指标的生意,不是那么感兴趣。
腾讯云副总裁、产业生态合作业务负责人杨晨此前对外说,「我们认为 Token 不是一个多么健康的生意,它看着量很大但黏性极差。我们觉得 AI 真正好的生意、健康的生意还是要以应用场景为导向,要去拼场景,看场景在客户端怎么用起来。」
相比之下,阿里云已经开始畅想未来的收入规模了。吴泳铭确信,未来 5 年内,阿里来自 AI 和云相关业务的收入将超过 1000 亿美元。
核心原因就是,市场看待 IT 预算的方式发生了根本性转变,许多企业在消耗 Token 时,不再将 Token 消耗视为其 IT 预算的一部分。这是未来推动 AI 增长最根本的长期因素。
Token 经济产业链的最下游,就是应用。这是 Token 价值的最终出口。
我们所熟知的豆包、元宝、千问,是 AI 通用应用。除此之外,还有自动驾驶、医疗等细分领域的应用形态。这些是将算力,转化为产业的实际生产力,从技术价值到商业价值转换的关键体现。
虽然目前英伟达为代表的芯片上游厂商,掌控着 Token 的生产和定价,但是如果下游的应用转化创造的商业价值更高,也许未来反而会对产业链上游产生更大话语权。
想象一下吧,生产成本已经按 Token 计费,未来一切 AI 服务也会按 Token 收费。
也许有一天,家庭内部,朋友之间聊起消费账单,除了人民币花费之外,你们还要互相询问一下,这个月花了多少 Token?


扫码关注公众号
获取更多技术资讯