HelloKitty • 2024-11-11 16:47
846
本文由 硅星人Pro 撰写/授权提供,转载请注明原出处。
文章来源于:硅星人Pro
作者:lijingya
李开复很忙。
在过去的一个月左右时间里,他在国内办了两场重要的发布会,在硅谷参加了多场公开演讲,又去了趟沙特等中东国家参加投资会议,在这些公开活动之外,他密集见人,并接受了多个专访,还参与了一场长达 2 个多小时的直播。
李开复显然成了今天“模型六小虎”里,难得的充分把自己暴露在镁光灯下的创始人。成了外界观察这些明星公司现状的难得切入口。
这几乎是个魔鬼行程。“今年李开复平均每天休息 5 个小时左右,其他时间都在工作。”零一万物内部人士告诉硅星人。这与十年前媒体观察他的工作状态并无二致,当时他一天的工作从 5 点多起床就开始了,给各项目负责人写各种关于产品、推广建议的长邮件。
这些行程都在围绕他零一万物创始人的身份展开,这家他六十岁之后创立的的公司正经历挑战,而承诺“十年都不会变现”的他显然要负责寻找答案。
OpenAI 显然是答案的重要来源。
在硅谷,李开复见了很多人,与 OpenAI 内部一些年轻人进行深度交流,发现他们对AGI(通用人工智能)过度乐观;一些 OpenAI 的前员工笑着告诉李开复,OpenAI 从来不相信生态系统,只想花钱烧出 AGI,“到时候所谓 APP 就是一层薄皮,挂在 AGI 上面,用户要付钱给你们么,还不如付钱给我们。”在和一位斯坦福经济学教授攀谈时,对方提到用 OpenAI o1 等于能少招一个博士生。
这些都令李开复对 OpenAI 的未来垄断感到忧心忡忡。
怎么应对?预训练成了其中的决策关键。在他与硅谷的各路人马交流的同时,国内传出的“放弃预训练“传闻,让李开复很生气。今年起,零一万物、Minimax、月之暗面、智谱 AI、百川智能、阶跃星辰,从融资上开始处在最前列,被称为 GenAI 行业的六小虎,但他们也在同一时间开始受到质疑。不再做预训练是其中最微妙的指责——这些公司如此高估值的根基、以及外界如此高关注的缘由,都是他们在预训练模型上的能力,如果不再做了,就意味着有人掉队了。
这不只是中国公司的困境。Grand View Capital 北美合伙人 Richard Xu 日前发文指出,海外还在做预训练的基础模型公司也只剩 5 家,OAI,XAI,Meta,Google,Anthropic。与 OpenAI 技术能力上有明显区别的 Cohere 和 Mixtral 都属于半掉队的状态。
这背后是能掌握的资源的差异在变大,有媒体曝光了马斯克旗下人工智能企业 xAI 的 Colossus AI 超级计算机集群,其花费仅十余日集成了 100000 个英伟达(NVIDIA)H100 GPU,号称是目前全球最强大的 AI 超级计算机集群。同时 OpenAI 也在不停传出在芯片等领域布局的动作,Sam Altman 的超级计算中心也在建设中。
“零一万物一直在做预训练。”李开复在朋友圈直接辟谣。“建议自媒体可以先删稿。”
然后零一就连续举办了两场发布会,李开复想用模型说话直接否定传言。按照全球惯常节奏,基础模型公司每三个月需要完成一次重大升级,每 9-10 个月需要放个大招,推出新模型。而零一万物比其他家节奏明显更勤奋,他们保持了 5 到 6 个月出一款新模型的节奏,去年 11 月提出开源的首款预训练大模型 Yi-34B,今年 5 月提出闭源的 Yi-Large,再到 10 月 16 日推出当家预训练大模型 Yi-Lightning。李开复拿UC伯克利大模型竞技场(Chatbot Arena)作为评判标准,他形容“零一万物是世界第三的模型公司,做出了世界第六的模型,打败了所有开源模型。”
从效果来看,这些新模型基本都能够达到 5-6 个月之前世界领先的水平。
“这 6 家公司融资额度都是够的,我们做预训练 production run,一次花费三四百万美金,这个钱头部公司都付得起,我觉得中国的 6 家大模型公司只要有够好的人才和想做预训练的决心,融资额跟芯片都不会是问题。”李开复在发布会上被问到预训练的问题时这样回答。
这句话里没说的是,能决定这些付得起的钱是否要付的可能不只是这些创业公司自己。
也就是,预训练如果是要做的,那更关键的是认清现实后要怎么做。
不仅在硅谷直接感受到 OpenAI 们训练模型的情况,在中东,李开复也感慨于当地土豪一掷千金的投入,他关心正在聚集于此的庞大数据资源和计算资源将带来什么变化。这些都是他近期不停主动提到的话题。
惯常花费 1 亿美金左右的预训练作为一种深度学习模型训练的策略,能对模型性能提升起到重要作用,而当预训练的 Scaling Law 逐渐被推理侧替代,已有大量 10 亿美金级公司开始认为纯粹的基础模型预训练意义已经不大。
“我们用了大约 2000 张 H800,训练了一个月。”李开复在上周的一场直播里说,之后他也在多个国际活动上强调了这个成绩——他们用马斯克二十分之一的 GPU,训练出了一个可以跟 Grok 打平的预训练大模型 Yi-Lightning。
他形容零一花了 300 万美金“白菜价”训练出了一个当家预训练大模型。
这显然进入了一个新的阶段,上一个阶段,大家都在通过“烧钱”训练模型来得到更多弹药,但估值的抬高,以及模型能力大迭代的放慢,伴随而来的就是融资难度的加剧。有媒体报道,随着这几家大模型公司估值跨上 200 亿元台阶,其最新单轮次融资规模达 50 亿元左右。当上述 AI 独角兽初创估值都超出了 VC 射程,到达了需要说服拥有更成熟财务模版 PE 投委阶段时,他们就开始面临“灵魂拷问”。
李开复在最近的直播中提到,“我告诉要求看 EBIT(息税前利润)的 PE 投资人,我谈不出哪一天打平,就不要想拿你的钱,我看不出单位经济模型(Unit Economics,指平台从单个用户身上获取的价值),也不要想拿你的钱。”
估值已经奇高的大模型初创面临不太友善的融资环境时,他并不想讲一个仅给投资人听的理想故事,而想用现实的生存逻辑说话。毕竟,作为投资人的他,现在站在了自己的对面。十年前,就有创业者评价他的投资风格——是最难被忽悠的一个投资人,要看数据、要做背景调查,要做系统分析。
但显然,依然身着那套藏蓝色西服套装,梳着三七分发型的李开复,作为六小龙里最有经验的创始人,相信自己能解这个左右为难的难题。
与其他几家纷纷开始显示出聚拢的倾向不同,李开复传递出的信号是他要一手抓模型一手抓产品,一手做 toC,一手做 toB。同时,还会很好的赚钱活下去。李开复认为 AI 在效率改进上的价值很可能并不会强烈的区分消费者和企业,这股趋势正在慢慢传导至国内。
在担忧 OpenAI 的垄断的同时,李开复显然也在“学习”Sam Altman。他形容 OpenAI 把关人就是 Sam Altman,他会战略性选择发布哪个产品,“OpenAI 还藏了很多好东西没有放出来,我们千万不要低估它。”而这也是他在零一的做法:细数下来,零一万物今年发布的重要模型已有 4 个:Yi-Large、Yi-Lightning、Yi-1.5 系列、Yi-coder,这个矩阵兼顾了开源的品牌效应,小模型的前瞻部署和预训练模型的旗舰站位。而且,这些模型会在需要它的时候出现,就像 OpenAI 每次狙击 Google 的时机选择那样。
同时,他也是难得的可以游走在多个市场,抓住看似已经不再能抓住的不同机会的企业家。在最近一次发布会上,李开复相比三周之前更明确了零一万物从 C 端向 B 端转向的意图,他高举高打“国内重 to B,海外重 to C”,在 x 上,他不停推广着 AI 搜索产品 Beago,同时在国内,他用了重量篇幅展现零一于传统行业的 To B 业务打法。
他有一个营销侧的细节数据:目前做 to C 产品面临着流量成本走高的难题,“友商用户从十几块人民币加到三十多块人民币,近来还有相当的流失,在这样一个环境里,我们会非常谨慎,先不推出中国本土新的 to C 应用。”把更多精力放在海外做 to C 产品。
根据 5 月公布的数据,零一万物上线 9 个月的海外产品用户已经接近千万,其单一产品今年收入达到 1 亿人民币,产品 ROI(投资回报率,指通过投资而应返回的价值)接近 1。但这未必能复刻到国内。“现在还没有 SaaS 订阅的妄念。”他在极客公园的直播中称。
而在国内,他要做的 toB 生意也不是过往那种利润率极低的工作,而反而要把它变成零一的“印钞机”。李开复为此进行了生动描述,他说B端尽量不做项目制,咬牙把解决方案开发做出来,“一落地就惊艳,一落地就变成一个印钞机”,他称,已经找到了几个领域或者单一的公司能跟零一万物双赢。目前看李开复把这些领域落脚在零售、游戏、能源、智算行业。
数字人是他重点介绍的案例。在最近的发布会上,联合创始人祁瑞峰在他身边扮演了数据分析师的角色。后者给外界算了好几笔账,证明零一用完数字人解决方案,会立刻获得毛利增长的账目。李开复甚至说自己面对B端业务时,会变成公司最大的销售。
在这些密集的行程和分享中,李开复再次让人回想起当年一篇报道对他的描述,“感觉像是跟 Siri 聊天”。
零一万物是李开复把他一生企业家和投资人经验集于一身的公司,这公司有着他明显的烙印。他不太相信其他更年轻或者更单一背景的同行解决不了的问题,他也解决不了。这就是他选择的方式,他应该会继续忙下去。
扫码关注公众号
获取更多技术资讯