大模型入秋

HelloKitty • 2025-01-10 16:19

扫一扫在手机阅读、分享本文

3152

本文由雪豹财经社撰写/授权提供，转载请注明原出处。

文章来源于：雪豹财经社

作者：王亚骏

到 2024 年的最后一个月，大模型依然是最热闹的赛道，没有之一。

12 月，智谱 AI 与阶跃星辰相继完成新一轮融资，OpenAI 以直播的形式举办了一场长达 12 天的马拉松式新品发布会。

但对从业者肖琳（化名）来说，年底的任何融资事件和新产品发布都已经很难让她眼前一亮，反倒是几个月前的一张网传图片成了她的“年度记忆”。

这张图片显示，腾讯、字节、百度、科大讯飞和月之暗面旗下大模型的新增用户留存率，在 30 天后均会降至 1% 以下。9 月，它一度在社交媒体和从业者交流群中疯传。

假，是肖琳对这张图片的第一印象，“图片里的数据没有任何可靠来源”。她不屑于去认真讨论它的可信度。

不过这并没有阻止它的广泛流传，甚至肖琳自己也是传播者之一。有人感叹大模型任重道远，有人预测未来有多少玩家能活下来，也有人批评图片中的大模型不好用。

“（这张图）之所以能引发这么大的波澜，是契合了大家的情绪。”

寒风

2024 年，寒风几乎吹进过大模型的每一个角落，连象牙塔里的人们也感受到了气温的降低。

张楠楠（化名）是一名人工智能方向的在读硕士。过去两年间，他时刻关注大模型的动态，这个行业的起伏一定程度上影响着他毕业后的工作前景。

6 月，他在与学长学姐的交流中，得知在大模型“六小龙”中已经有公司放弃了预训练。

“六小龙”是指月之暗面、MiniMax、零一万物、百川智能、智谱 AI 和阶跃星辰这六家公司，它们是国内大模型的头部初创公司。此前有媒体报道称，六小龙中有两家停止了预训练。

投资机构分析师陈琳（化名）告诉雪豹财经社，“绝对不止两家。”

预训练减少，让张楠楠开始担心，未来几年大模型公司的数量会变少、相关岗位的薪资会降低，这可能会波及他未来的就业和薪资。

张楠楠的部分担忧已经变为现实。

凯文（化名）是一位服务于大厂和“六小龙”的大模型猎头。他发现，从 4 月起，不管是大厂还是六小龙，招聘需求都在显著减少。今年，他手中大模型岗位比去年同期减少了 30%～40%。

求职者的涨薪诉求也越来越难谈。去年，凯文推荐的候选人，薪资翻倍的多到他记不清。今年，涨薪一倍的候选人只有一位，准确地说，还只是接近翻倍。

一家招聘方为频繁跳槽的求职者画了一条红线：五年跳三次。如果候选人的跳槽频率高于这条线，“连面试机会都没有”。

与岗位一起收缩的，还有投资人的决心。

陈琳在与投资人沟通中发现，原本怀着 FOMO（Fear of Missing Out）情绪的投资人，开始担心头部大模型创企估值过高。智谱 AI、月之暗面和百川智能等几家公司的估值已经快速上升至约 200 亿元人民币的门槛。

陈琳的感知与知名投资人朱啸虎一致。6月，朱啸虎表示，“去年大模型非常火，今年机构都不敢投大模型。”

大洋彼岸，同此凉热。

“我们感觉到，华尔街对 AI 越来越持怀疑态度。”巴克莱银行在 9 月的一份研报中表达了自己的担忧。该行测算，2026 年大型科技公司在开发模型上的花费约为 600 亿美元，但从 AI 中获得的收入仅约为 200 亿美元。这 400 亿美元的差额，几乎是特斯拉去年净利润的 2.7 倍。

技术和产品体验的进步也在放缓。

11 月，有外媒报道称，OpenAI 的下一代旗舰模型（测试代号为 Orion）虽然在性能上已经超越了现有模型，但可能不会像前面几代产品那样带来巨大飞跃。

消息一出，著名的 AI 悲观主义者、纽约大学名誉教授 Gary Marcus 在社交媒体上“庆祝”起了自己的胜利：“伙计们，游戏结束，我赢了。GPT 大模型正在进入收益递减期。”

暗淡的白月光

2023 年 2 月，美团联合创始人王慧文与出门问问 CEO 李志飞、真格基金合伙人戴雨森和刘元在一家日式餐厅中，探讨了中国大模型的未来。

此前 4 个月，OpenAI 在没有任何预热，也未举办发布会的情况下，上线了基于大语言模型研发的 AI 应用程序 ChatGPT-3.5，两个月便吸引来一亿月活用户。与之对比，苹果 iTunes 达到一亿用户用了六年半，微信用了一年零两个月。

饭局结束后不久，王慧文发布了自己的人工智能宣言：“5000 万美元，带资入组，不在意岗位、薪资和 title，求组队。”李开复、前京东高级副总裁周伯文、快手前 MMU 负责人李岩和李志飞等，均投身大模型创业。

大厂们也跑步入场。2023 年 3 月，百度率先发布了文心一言大模型。此后，AI 公司、互联网公司和智能硬件公司们相继跟进，腾讯、阿里、商汤、快手、美团、京东、阿里、OPPO、理想汽车均发布了自己的大模型。

一时间，“做中国的 OpenAI”成为行业热词，这点燃了一级市场久违的投资热情。

据创业邦旗下科创数据平台“睿兽”数据，去年，机构在大模型层的投资事件为 66 起，是上一年的投资事件数量的近 2.3 倍。大厂们自然没有缺席这场资本盛宴。“六小龙”中，阿里与腾讯均投资了 5 家。

“当时在深圳的酒吧，人们要么在讨论美股，要么在讨论大模型。”肖琳回忆去年的情景，她并非一个怀有 AGI 信仰的人，但身处此种环境，她甚至开始幻想自己会不会成为改变世界的一员。

2023 年中旬，国内大模型已成“百模大战”之势。可就在此时，先行者的故事戛然而止。

投身大模型创业 4 个月之后，王慧文确诊抑郁症并入院治疗，短期内无法继续领导团队。最终，美团以约 20.65 亿元的价格，完成了对光年之外的股权收购。

光年之外前员工贾晨（化名）还记得，王慧文在创业之初精神状态良好，对公司也很上心，但“公司经营的成本很大，而且技术难题很多”。

一个能拿出 5000 万美元的人，因大模型创业得了抑郁症，这让贾晨萌生了“大模型究竟是不是一门好生意”的疑问。带着这个疑问，他选择更稳妥的探索方式：去大厂。

王慧文病退后，行业中开始出现大模型是否终将沦为巨头游戏的讨论。不久后，机构也发出了预警。

2023 年 10 月，科技研究和咨询公司 CCS Insight 在一份报告中表示，备受关注的生成式人工智能领域将在 2024 年接受考验，这些考验的具体表现为：技术炒作逐渐消退，运行成本不断上升，监管呼声越来越多，投资人不再像之前那样兴奋和乐观。

机构的预测，成了肖琳经历的现实。

2024 年初，肖琳看到公司里来了几位身穿白色长袍的外籍人士，她猜测这便是传言中的“来自中东的投资人”。她希望这笔融资能顺利到账，这样她的工作也会更加稳定。但事与愿违，投资人试用大模型后，因功能不及预期而减少了投资金额。

察觉到投资人收紧钱包的不只一家公司。按朱啸虎上述说法，“机构都不敢投大模型。”

投资机构分析师陈琳认为，投资人们态度的变化，与大模型应用难以落地不无关系。

出门问问 CEO 李志飞感叹，在国内大模型创业浪潮爆发之初，人们曾非常激进。“但是今天再回过来看，可能有些事情是过于乐观了。”

谁能活下来

李志飞认为，自己“可能是中国最早一批关注到 GPT-3 的人”。他将其视为大模型发展的转折点，让他看到实现通用人工智能的希望。

GPT-3 是 OpenAI 在 2020 年发布的一款语言模型（Language Models），该模型的参数量达到 1750 亿，是 GPT-2 的 117 倍，GPT-1 的 1496 倍。

在李志飞看来，这是一次“暴力美学”的胜利。在此之前，他非常反感这个概念，因为“没有什么深度，研究也没有美感”。

“暴力美学”的概念并不难理解，它由先进的算法、海量的训练数据和庞大的参数构成。

而这一切，需要以资金为后盾。

国盛证券曾测算，GPT-3 训练一次的成本约为 140 万美元。两年后上线的 ChatGPT-3.5 单次训练成本上升到了 460 万美元，可以购买一辆博兰基尼 Veneno（全球仅有 14 辆）。

在金钱的助推下，2023 年 4 月上线的 GPT-4 参数继续增加至 1.8 万亿左右。马斯克曾估算，参数量超百万亿的 GPT-5 仅芯片成本超过 7 亿美元，高于小鹏汽车在 AI 领域全年的投入（35 亿元）。

李志飞认为，国内公司无法效仿 OpenAI 这种并不追求 ROI 的“暴力美学”。傅盛也认同这个看法。他在接受采访时举了一个例子：“如果一个谷歌研究员跟老板说训练一次 2000 万美元，老板问能不能做成，你说不知道，肯定就很难申请到资源。”

但生意还得继续做。

目前，国内大模型行业的共识是卷应用，将大规模数据集训练出来的深度神经网络模型应用于实际问题中，通过大模型赚到钱。

在 7 月举办的 2024 年世界人工智能大会上，百度董事长兼 CEO 李彦宏称，没有应用，光有一个基础模型，不管是开源还是闭源，都一文不值。李开复在 11 月初的一次分享中表示，当下国内 AI 行业的发展，已经进入应用“落地为王”的阶段。

另一个共识是，目前大模型行业已进入淘汰赛阶段。

多位从业者告诉雪豹财经社，他们认为字节将成为赢家之一。创业公司方面，他们普遍认为目前的“六小龙”将活下来一到两家。

百川智能 CEO 王小川预测，未来国内大模型市场第一梯队或仅有五家，大厂占据主导地位，小型创业公司能存活的寥寥无几。

朱啸虎一度认为，5 年后将没有独立的大模型公司存在。2024 年 8 月，他又在一次采访中，将这一期限缩短至 3 年之内，称大模型创企“最好的结果就是卖给大厂”。

李志飞早早嗅到了淘汰赛的气息。2023 年 4 月，他便预测大模型行业将“卷出天际”，投身其中的公司大概率与上一代 AI 公司一样，商业化异常艰难。

“一切都是熟悉的配方和味道。”他说。

封面来源丨电影《Margin Call》剧照

微信图片_20250103163534.jpg

微信图片_20230104175528.jpg

扫码关注公众号

获取更多技术资讯

上一篇：大模型落地战，挺进大消费

下一篇：不只 5090，英伟达还发布了最小的「AI 超算」...

精选活动更多 >

{{ val.province ? (val.province + ' ' + val.city) : val.location }}

大模型入秋

{{ val.activity_name }}

首测DeepSeek识图，结果炸了

DeepSeek-V4发布，黄仁勋的担忧成真了

苹果“库克时代”谢幕，那些没说出口的话

4月AI混战大盘点：DeepSeek压轴登场，AI小龙加速商业化

Anthropic 的“刀法”越来越像苹果和微软了

相比龙虾，AI浏览器更适合普通人

2.7%的裂缝：全球AI竞赛进入非对称博弈时代

AI冲击招聘市场，打工人更卷了？

首测DeepSeek识图，结果炸了

消失4年的小米“铁大”又回来了

腾讯混元「推倒重来」！实测Hy3-Preview：姚顺雨首次交卷喜忧参半

GPT-5.5 来了，但这次 OpenAI 想证明的不只是「更聪明」

日更7.5万首，播放不足3%：AI音乐沦为“虚假繁荣”？

豆包之后，千问也想要“脸”

刚刚，DeepSeek搞了个V4预览版，震撼行业

DeepSeek-V4发布，黄仁勋的担忧成真了

AI也玩儿18禁？OpenAI成人模式凉了！

做龙虾的大厂，没有梦想

智谱，大力出AI

仗打得差不多了，美团要做未来本地生活的“AI入口”

一脑多体，场景为纲，万亿级具身赛道如何定义越疆

豆神教育换帅，AI教育豪赌与转型困局

扎堆做龙虾，一场跟风盛宴？

1.75 万亿美元，SpaceX 要做人类史上最贵的 IPO