HelloKitty • 2025-09-29 15:19
235
本文由 节点财经 撰写/授权提供,转载请注明原出处。
以下文章来源于:节点财经
作者节点财经:四海
云计算可谓妥妥的重资产领域,在大众的认知中,需要时间与资本的长期投入,想要弯道超车并不简单,但这些年来,也有后来者突出重围。
这个例子就是字节跳动。2020 年 6 月,字节跳动推出火山引擎,彼时的中国公有云市场格局基本已定,排名前五厂商几乎占据了超过 80% 的市场份额,其中,阿里云、华为云、腾讯云三分天下,火山引擎还只是边缘玩家。
时来运转,火山引擎现在已经有了不小的份量。
据 IDC 报告显示,2025 年上半年火山引擎在中国公有云大模型调用量独占 49.2% 的市场份额,位列第一,超过百度智能云和阿里云的总和。
《智百道》认为,能有如此成绩,得益于技术范式的改变所带来的市场红利。2023 年初,AI 大模型爆发,GPU 取代了 CPU、MaaS 需求的崛起,所有云计算新老玩家,几乎都处于同一起跑线上。而随着大模型技术的发展,行业内的玩家已经从卷底层技术,进化到应用落地与商业化的阶段,这给了火山引擎突围的机会。
AI 应用时代,token 比算力更重要
大模型竞争来到第四个年头,赛道玩家们收敛到中美两国,不过,LLM 技术的发展已经不再像 2022 年横空出世时那么惊艳,比如,ChatGPT 5 的诞生并没有掀起外界期待的范式变迁。以上现象告诉我们,AI 竞赛已经迎来了新的拐点——底层技术或许短时间内很难有大突破,企业围绕 AI 在应用上深耕已经成为主流选择。
IDC 此前也发布报告认为,AI 算力有望在 2025 年进入“训推”拐点,这种变化将意味着,大模型产业商业模式逐步由单纯的技术竞赛过渡到价值共享与产业落地,强调高效推理技术与垂直应用场景结合以实现商业闭环。
作为 AI 时代的水电煤,行业发展风向的转变对云计算厂商而言至关重要,我们观察云计算厂商的视角也应该有所转化。
过去对于云计算厂商来说,一直以来大众更多关注营收指标,可现实情况是,云计算行业赛跑中,不少厂商为了扩大市场率,低价销售 GPU 云资源冲收入,而 MaaS 作为新兴业务一直是各大厂商瞧不起的收入。
相比较单纯的考察 AI IaaS 与 Gen IaaS 市占率,Tokens 调用量,其实更能衡量目前 AI 产业乃至大模型产业落地的真实情况。以这个视角看,MaaS 是最能证明大模型行业发展情况的晴雨表。
简单来说,Tokens 是大语言模型可以输入输出的最小自然语言文本的基本单位。Tokens 的调用量,反映了模型推理过程的计算量,而计算量的高或低,直接揭示了模型在实际应用中的能力、成本、速度和可行性。毕竟只有模型真正好用了,应用真的落地了,Tokens 调用量才会真正增长。
IDC 数据显示,2024 年以来,中国两次 AI 应用大规模落地,都让 Tokens 消耗量快速增长。这背后的核心因素是,模型能力不断提升、模型价格不断下降,AI 应用不断被普及。
从这个视角来看,火山引擎在云计算市场上其实颇具份量——从大模型 Tokens 调用量的市场份额来看,火山引擎独占 49.2% 的市场份额,位列第一。2024 年营收规模超过 110 亿元,营收增速远超60%,远超行业整体水平。相比较,同期中国公有云市场整体增速约 30%,百度智能云 MaaS 营收增速约 45%。作为后来者,火山引擎也凭借 MaaS 业务需求量的不断上升,与第一梯队的差距在快速缩小。
火山引擎是如何布局 MaaS,抓住 AI 应用浪潮的?
如何让 AI 应用真正高效落地?
AI 应用是众所周知的趋势,可落地并不简单,以 Agent 为例,功能固然强大,可在产业界 Agent 目前 Demo 多、套壳多,真正在生产环境发挥功效的少。普华永道 2025 年 5 月的调查显示,88% 的企业因 Agent 计划增加 AI 预算,但真正跨应用、跨工作流连接的 Agent,目前仅占 19%,最根本的原因就是 Agent 布局的技术门槛高,价格昂贵。
针对目前 Agent 在市场的应用情况,火山引擎试图通过以下四点,为企业提供更高效的 Agent 服务:
第一,利用率更高的数据平台。
数据是 AI 发挥智能的燃料,只有充分利用数据,大模型才能与具体业务场景更匹配。根据 IDC 的预测,多模态数据规模从 2024 年到 2029 年在全球范围内处在一个高速增长阶段,年均复合增长率接近 30%。另外,随着多模态大模型能力快速提升,以及 Agent 应用百花齐放,多模态数据的处理和加工需求会随之快速爆发。在此背景下,火山引擎推出了多模态数据湖、向量数据库等解决方案,充分运用并理解数据,让 AI 更懂业务。
第二,强大的模型服务。大模型是 MaaS 的技术底座,更强大的模型,也意味着大模型更聪明,任务完成度更高、覆盖场景更广泛。
过去大模型只能处理文本,能覆盖的场景十分有限,但现在豆包大模型家族已覆盖文本、图片、音频、视频、多模态等领域。
特别是在 9 月 9 日,火山引擎正式发布图像创作模型 Seedream 4.0。该模型首次支持 4K 多模态生图,灵活支持文本、图像的组合输入,能实现多图融合创作、参考生图、组合生图、图像编辑等核心能力,且主体一致性大幅增强。经多家媒体测评,该图像模型在很多维度上丝毫不输谷歌旗下的 nano banana。火山引擎在多模态上的不断探索,不光体现了技术实力上的优越,也意味着豆包能胜任更多、更复杂的业务场景。
其三,全栈 Agent 开发工具。对不同企业来说,特别是 Agent 相当于垂直场景的专家,需要企业结合自身业务需求精准调配,而这些工具就是企业打磨专有 Agent 的必需品。
比如,火山引擎升级发布了 PromptPilot、MCP Servers、TRAE、扣子开发平台等产品,以及多款开源项目,构建起覆盖大模型开发全链路的工具矩阵,为开发者提供从 Prompt 优化到 Agent 落地的一站式解决方案。开发者可以在火山引擎上快速开发AI应用。
其四,更划算的价格。制约 AI 应用从技术走向业务,最主要的就是价格,以一个垂类 Agent 产品为例,每一次的产品运行,相当于要做一万多次检索,背后的算力成本已达到几十元的水准。
去年 5 月起,火山引擎率先掀起大模型降价潮,企业市场定价为 0.0008 元/千 Tokens,今年 3 月又宣布部分大模型批量推理服务费用减半。其中,豆包大模型 1.6 使用“区间定价”模式:在 0-32K 输入区间(占企业80%需求),价格降至输入 0.8 元/百万 Tokens、输出 8 元/百万 Tokens,综合成本仅为豆包 1.5 深度思考模型或 DeepSeek R1 的三分之一。
这一策略效果显著。截至 2025 年 5 月,豆包大模型的日均 Tokens 调用量是 16.4 万亿次,拉到月均来算,就是 500 万亿次以上。这背后是火山引擎已经在多个行业实现批量化落地,持续推动不同机构、企业实现 AI 转型。
目前,在消费电子行业,全球 Top10 手机厂商中,已有 9 家选择和火山引擎深度合作;在教育行业,火山引擎已与北京大学、浙江大学、南开大学等超五成 985 高校达成合作;金融领域,火山引擎已服务招商银行、浦发银行、北京银行等 70% 统重要性银行。
从 C 端到 B 端,
火山引擎的护城河是什么?
既然 MaaS 是全新的增长点,那么,势必会有越来越多的玩家加入竞争,火山引擎的护城河在哪里?
首先,规模优势。
云计算是科技巨头战略布局的关键落子。火山引擎进军云市场,因为字节跳动本身就拥有庞大的用云需求,布局云计算业务能削峰填谷,降低边际成本,平摊基础设施成本,属于顺势而为的决策。
谷歌、阿里等云计算服务商的规模化摊销逻辑也是如此。
他们投入数百亿建设全球数据中心、采购 GPU 集群、研发模型优化技术,然后通过规模化用户复用资源,以降低算力使用费,既让用户觉得划算,也让厂商通过薄利多销盈利。
其次,全栈布局的闭环优势。
MaaS 的本质是场耐力赛,短期看成本,长期看生态,生态的繁荣度决定了玩家能走多远。
目前来看,字节跳动在形成以“AI 基础设施+大模型+AI 应用”的闭环逻辑,不光为客户提供处于行业领先的模型,还为客户提供高性能、低成本 AI 基础设施。两者相互促进,进而带动火山引擎的 Token 消耗市场份额。它们共同形成了 AI 时代的增长飞轮——吸引更多 To B 客户和 To C 用户,产生丰富的数据,反哺大模型的持续训练,让大模型、应用变得更智能,对 AI 生态形成正向循环。
在 IaaS 领域火山引擎是后来者,但 MaaS 作为创新业务,各巨头都站在同一起跑线上,火山引擎借助高速增长的市场规模,有了弯道超车的机会。
根据 MofCloud 数据,未来几年,云计算市场预计将以 18.3% 的年复合增长率快速增长。AI 是确定性趋势,行业需求空间大,对于火山引擎,同样机遇也很大。未来,随着深度思考模型、视觉推理的进一步成熟和 AI 云基础设施的优化,AI 应用还会带动更大的 Tokens 调用量。
2025 年是 AI 应用的商业化元年,既是火山引擎的机遇窗口,也是整个云计算行业的转型拐点。当火山引擎用“高 MFU+低定价”打破成本壁垒,用“全栈工具+多模态模型”降低开发门槛时,它本质上在做的,是把 AI 时代的云计算能力从少数巨头的特权变成多数企业的标配。随着 AI 技术在不同企业的渗透,火山引擎势必还能开拓更大的市场空间。
*题图由AI生成
扫码关注公众号
获取更多技术资讯