AI周期大复盘|七年轮回,2024会是下一个2017吗?

HelloKitty 2024-04-08 17:36

扫一扫 在手机阅读、分享本文

2207

本文由 硅兔赛跑 撰写/授权提供,转载请注明原出处。

文章来源于:硅兔赛跑

作者:硅兔君

刚刚结束的 GTC 在科技圈刷了屏,英伟达已然成为现在科技界的中心。记得当英伟达市值刚突破万亿的时候就有人觉得达到了天花板,但是如果你了解英伟达在上一波 AI 浪潮中的增长,你可能就会猜到它的的行情绝不会止步于此。

英伟达在上一个 AI 热潮中上涨了 5 倍,在这一波 AI 周期中,股价几乎像素级复刻了上一波的走势。

如果能早一点认识到 GPU 作为算力对深度学习的重要性的话,也许就不会错过或者低估英伟达了。

1.png

因此,我们今天的讨论与 AI 周期有关,我们希望通过讨论上一个 AI 周期的演变、成功或失败案例,从中得到一些对当前 AI 周期的启发。而 2024 和 2017 则是这两个 AI 周期非常关键的时间节点。

硅兔赛跑为此请来 UpHonest Capital 行业研究团队的王子和 Eric Gu,和我们一起探讨 AI 周期下的观察和展望。以下对话是线上直播的文字版梳理。

硅兔赛跑 Amanda:第一个问题,2017 对上一个 AI 周期有怎样的意义?

UpHonest 王子:首先我们将 2006 年开启的 AI 周期称为”深度学习“周期,而 2017 是“深度学习”周期的 Hype 顶峰。

为了说明这个问题,我们准备了一张图。

柱状图是全球 AI 的风险投资金额,绿色的线是投资增速,红色的线是 AI 在全球投资中的占比。

2017 AI 投资增速超过 200%,AI 投资占比达到 8%,是 2006 开启的这次 AI 创投周期的最高点。

2.png

数据来源:Statista

作为早期投资机构,我们也关注 AI 早期投资有怎样的变化,所以我们去看了早期投资风向标 YC 的投资变化,同样,2017 年 AI 类项目占比最高,2018~2021 年明显下滑。

3.png

数据来源:YC,UpHonest整理


4.png

数据来源:YC,Rebel Fund整理

不过有一个明显有差异的地方,第一张图显示,2022 年 YC AI 项目占比是超过 2017 年的,第二张图显示 2022 年 AI 项目占比则是低于 2017 年的。

超过的图是我们 2024 年统计的,低于的图是 YC 校友基金 Rebel Fund 2023 年初统计的,说明这一年多时间,YC 22 年大约有 10% 的项目转型做 AI 了。

所以,从创业和投融资的角度,2017 年是“深度学习”AI 周期 hype 的顶点。

2018 年无论是 YC 还是全球 AI 投资热情都下降了,部分原因是人们对 AI 的期望太高,但当时的技术无法达到人们的想象,大家可能还记得人们开始说 AI 是“人工智障”,甚至有些人说 AI 是骗局。而且这种降温在早期投资中的表现更明显。

不过在 2018 年之后,全球的 AI 投资复苏并且投资占比大约维持在 10%,说明存活下来的 AI 公司发展壮大,穿越周期,持续吸引风险投资。

硅兔赛跑 Amanda:我记得 YC 在 2017 年 AI 最热的时候宣布设立 AI vertical 孵化小组,负责人是后来 AI Grant 的创始人 Daniel Gross。但 2018 年,Daniel Gross 离开了 YC。这里 YC 孵化的 AI 项目占比,是否反映出 AI 热度从 2018 年开始一路下滑?

UpHonest 王子:是的。

但如果你足够敏锐,有可能会在 2020 年嗅到空气中新一波 AI 浪潮来临的水汽,因为 GPT-3 的 API 接口是在 2020 年开放的,足够敏锐的 Jasper,就是抓住了这个窗口期,从裁员、增长停滞的边缘起死回生。

硅兔赛跑 Amanda:那么想问一下 Eric,上一个“深度学习周期”,与现在的“生成式 AI 周期”有什么关联?

UpHonest Eric:技术变化。

AI 是一个很大的范畴,自 1956 年 AI 正式作为一门学科成立以来,已经经历了好几个周期,其中有很多技术已经渗透到了日常生活中,比如“搜索引擎”、“推荐算法”等等,犹豫过于普遍,大家甚至已经不再给它们贴上人工智能的标签了。

上一个周期我们把它称为“深度学习”周期。深度学习作为机器学习的学习方式之一,之前在学界是饱受质疑的。大家普遍认为“深度神经网络是永远无法被训练的”,这使得有些学术期刊甚至都不曾接受有关神经网络的论文。

直到 2006 年,被誉为深度学习之父的 Geoffrey Hinton 与他的两个学生成功训练了一个多层神经网络(Deep Belief Networks),在手写数字识别的任务上(标准 MNIST 字符识别数据集)实现了 98.75% 的正确率。随后,又在语言识别任务上打破了记录,成功为深度学习正名。

直到 2012 年的 ImageNet 挑战赛,Hinton 带着得意门生 Alex 和 Ilya 用 AlexNet 碾压里其他参赛者,树立出了当时深度学习(大量数据+可规模化的算法+GPU 计算)的范式,成为了后续多年的研发基石。到 2015 年 ResNet 出现,实现首次 AI 在图像分类任务中对人类平均水平的超越。

5.png

硅兔赛跑 Amanda:可以说 2012 年是深度学习的关注度逐渐从 AI 界向整个科技界蔓延并爆发的起点。

UpHonest Eric:没错。2017 年,随着技术的不断成熟,苹果在最新发布的 iPhone X 中推出了 Face ID,达成技术向更大的消费者群体的破圈。在这个周期中类似的破圈还有像 Amazon Echo与 Alexa 的发布、AlphaGo 战胜李世石等。

当然,在业界将一种范式能力推到极限的同时自然也会遇到瓶颈。当时的 AI 可以在监督学习和迁移学习的模式下解决一些特定的问题。但涉及到需要推理的复杂任务时就捉襟见肘了。当时产业届的一些通用人工智能的助手也被大家戏称为人工智障。

Hinton 在 2017 年末表示,他曾提出的突破性方法应该被放弃,目前神经网络运作的模式不是大脑的工作方式,一切需要重新开始。为了让神经网络能够自行变的智能,即所谓的无监督学习,并不需要将所有的数据都做标注。

回过头来看生成式 AI 的发展历程:

2017 年,Google 在 Attention is all you need 中,将 Transformer 作为特征提取器取代了已经诞生了 40 年的 RNN 序列结构。Transformer 特有的并行结构使得他可以利用大量的算力和数据进行训练。

硅兔赛跑 Amanda:记得上一波的深度学习也提到了大量「数据+算法+算力」的模式,这里有什么区别吗?

UpHonest Eric:上一波深度学习中提及的大量的数据指的是 ImageNet 这种大型的标注数据;而 Transformer 范式下提到的数据,是海量的未标注的互联网数据,这两个数据规模的差距是极大的。而且并行结构下,可以使用的算力规模也不是一个量级的。

2018 - OpenAI 发表了 GPT,即用 Transformer 作为特征提取器,使用大量未标注数据进行预训练的生成式通用模型。

基于这个范式,OpenAI 在 2020 年推出了具有 1750 亿参数的 GPT-3。在证明 Scale Law 的同时,将大型语言模型的从 AI 界推向了整个科技界。

2022.11.30 - ChatGPT 发布,推出仅两个月就月活破亿,成了史上增长最快的消费级应用。

同样的破圈案例:包括 Midjourney 的生成画作获得艺术比赛金奖(2022.10.18)、Sora 生成的视频出圈等等。

参考上一个周期的发展路径,大模型(文字 or 多模态)正在处于将基于 Transformer 的范式推到极限的过程中。我看到了 GPT4 的性能提升,也会看到 GPT5、GPT6、或者其他模态模型的发展,很多上一波 AI 没能完成任务已经是现在 LLM 的能力范畴之内。并且,参数、数据、算力的 Scaling 还在继续。Transformer 的极限在哪?能不能达到大家都在追逐的 AGI 还是未知数。

硅兔赛跑 Amanda:刚才你们都提到了一个词“人工智障”,我想问为什么当时 AI 做不起来?为什么“深度学习”的 Hype 在 2017 戛然而止?为什么这一波 AI 又行了?

UpHonest Eric:因为在那个时间点,大家都想做的 C 端的智能应用,但是由于技术的限制,大众接触到了不成熟的产品,反响很差。这就使得资本和市场的关注度快速下降。

举一个,最具备代表性的案例就是 Conversational AI。2015 年开始,大厂小厂创业公司都想做面向 C 端用户的通用型的智能助理,用 Conversation UI 取代 GUI 成为人机交互的主要入口。有一波热钱涌入了这个赛道,诞生出了不少明星公司。

这是截止 2015 底的 Landscape:

. Magic 是 YCW15 的公司,Sequoia Capital、SVA、Slow Ventures 等投资

. Clara Labs 是 YCS14 的公司,Sequoia Capital、SVA、First Round、Greg Brockman 等投资

. Operator 是由 Uber CoFounder Garrett Camp 联合创立,Greylock、GGV 等投资

包括 Apple、Google、FB、Microsoft、Amazon 在内的大厂都在 2016 年各自的发布会上发布了 Bot 类的产品和开发平台。

但现在看来,当时面向 C 端的商用智能助理产品,无论是巨头还是创业公司,全部达不到用户预期。FB 平台上的 Bot 失败率高达 70%、Microsoft 的 Chatbot Tay 在 Twitter上线一天就被迫下架、Operator 的Co-Founder&CTO 也表示,当时Pre-Transformer的模型处于起步阶段,Operator 过早的进入市场找不到 PMF。总的来说,底层技术受限是产品不 work 的最主要原因。

涉及通用型的智能助理,就不得不提及大脑系统 1 和系统 2 的理论。这个理论曾经多次被 Yoshua Bengio、Andrej Karpathy 等大佬使用类比智能系统(AI Agent)的工作。

. 系统 1 是快思考:无意识、快速、不怎么费脑力、无需推理

. 系统 2 是慢思考:需要调动注意力、过程更慢、费脑力、需要推理

当时的智能系统只能完成部分第系统1任务,类似判断出用户对话中的逻辑的推理工作难以完成。比如:

. 用户让 Siri 推荐一个餐厅:Siri 会推荐餐厅

. 用户问 Siri 除了推荐餐厅还能推荐什么?Siri 还是会推荐餐厅

. 用户让 Siri 别推荐餐厅。Siri 依然会推荐餐厅

当时大部分的产品架构,深度学习相关的语音识别、语义理解只占到整个产品的不到 10%,大部分的开发在于对话管理系统,来替代系统 2 的职能。简单来说就是识别关键词、填表格、再交给后端执行任务。

类似被寄予厚望的还有智能音箱。虽然出货很不错,但是万众期待的 killer app 并没有出现,智能与智能之间基本没有差异性,大部分高频使用的技能都没有商业价值——用户用的最多的就是“查天气”。

硅兔赛跑 Amanda:苹果用户都应该记得,Siri 当时出现有多惊艳,但很快就从惊喜变成了鸡肋,因为没有什么实际的应用场景。你们怎么看这一波类似的智能助手初创呢?

UpHonest Eric:这一波生成式 AI 的出圈就是 ChatGPT,想必大家日常生活中也会或多或少的使用,在 YC 23 年的两个 Batch 中我们也看到非常多 ChatBot 应用,后来相继出现了 Copliot、Agent 的概念,其实他们的产品形态都是挺相似的。

从用户反馈来看,显然 ChatGPT 是有 PMF 的。上一波智能系统不能完成的任务,现在很大一部分都可以实现了。核心原因肯定是底层技术的升级:

. 大模型能力的提升自然不用多说了,呈现出了一定程度的逻辑能力和推理能力。

. 模型拥有使用工具的能力,API 的接入,让应用有了闭环交付任务的能力。

那回答你刚才那个问题,基于现在技术,现在我看到的初创公司主要有几个尝试的方向:

1.第一个方向是和上一波一样,用新技术再次尝试:面向 C 端用户的通用型个人助手。

2.目前看来,现在的技术还是难以去支持一个通用的复杂任务推理框架。正如上一波 C 端助手做不下去被迫转 B 端类似。如果将任务局限在一个独特的 Vertical 里,Agent 的表现就会更稳定可靠。

打造一个让 Agent 拥有理解任务、规划任务、使用工具并拥有记忆的推理框架。

3.第二个方向是通用的对话系统 + 特殊的 Domain:面向垂直细分的 AI 专家。

a.这里的 Domian 可以是行业的细分,比如像 法律、医疗、金融 这些数据丰富、单位价值较高的行业,已经出现像 Harvey、Hippocratic 这样的明星公司。

b.可以是面向 C 端的细分场景,比如 社交、购物、出行、游戏等等。

硅兔赛跑 Amanda:刚才说的是这波 AI 浪潮下成立的新公司,那些在此之前成立的公司,他们在本身的行业中已经积累了用户、数据和特有的知识。这些基础上再加上大模型带来的赋能,一样也能发展的非常好?

UpHonest Eric:是可以的。比如法律行业的 Ironclad、金融行业的 AlphaSense,包括 Expedia 的 AI 出行助手也得到了不错的反响。

硅兔赛跑 Amanda:确实大量的对话式 AI 被证伪,但如果选准方向、保持足够精炼的团队,也许可以穿越周期。

这让我想到了一家公司——Assembly AI,他们完整的经历了一个 AI 周期。AI 热潮时创业,2017 年加入 YC,第二年就遇到了 AI 退潮,面临技术不成熟、以及由此带来的增长瓶颈,直到 2022 年才真正起飞,收入和用户数量一下子增长了 3 倍。并且在去年 12 月完成 C 轮融资,Accel 领投 5000 万美元,并且 Accel 从 2022 年 A 轮开始连续 3 轮投资了这个项目。

类似的例子还有不少,这些公司为什么能成功穿越周期?

UpHonest 王子:我觉得 Assembly 做到了先活下去。

当时很大的问题确实是技术不成熟,比如 Assembly 的初代模型只用了 1 万小时语音数据训练,而现在的模型是用 1000 万小时语音数据训练的。

虽然业务做的比较艰难,但创始人特别确信语音识别有长期的价值,并且长期看市场机会非常大。所以他们的选择是保持非常精简的团队,从 2017 到 2022 年,团队只涨到 15 个人,这样烧钱速度比较慢。

毕竟留在牌桌上,才有机会打出好牌。

另外,我觉得与他们选择的客户群体有一定关系。

巧合的是,Assembly 与另一家 YC 16 年的公司 Deepgram 都是提供语音识别技术,并且都选择了以 API 方式服务开发者。Deepgram 发展也不错,目前估值超过 2.5 亿美元。

我们觉得开发者对早期技术公司来说是很不错的用户群体,他们试用新技术的积极性更高,对于不是非常完善的技术的接受度也更高,甚至有技术信仰。

GitHub Copilot 发展很不错,给微软贡献了 40% 的年收入增长,2023 年 ARR 超过 1 亿美元。

硅兔赛跑 Amanda:对现在的生成式 AI 创业者来说,开发者也还是一个好的目标用户群体么?

UpHonest 王子:我觉得是的。

在 YC 今年的孵化营中,我们看到了好几家 AI 软件开发公司,比 AI 生成代码更进一步,直接生成类似 Airbnb、Twitter 之类的应用,他们的目标用户还是开发者。

不仅如此,还有许多针对开发者的细分 AI 工具,例如用对话交互取代数据分析师的应用很火,或者在产品中加入聊天机器人的需求旺盛,现在有初创企业分别针对这样具体的场景为软件工程师提供背后的 AI infra。

硅兔赛跑 Amanda:了解,所以面对同样的问题,不同的选择会产生不同的结果。我看到一个数据,在 YC 06 年至 21 年孵化的 400 多个 AI 公司中,大约有 10% 的初创企业估值超过了 1.5 亿美元,说明还是有不少初创企业穿越了周期。

我发现在这 10% 跑出来的项目中,计算机视觉类占比最高,其中还有智能零售解决方案。

但是据我了解,Amazon Go 的发展并不如人意,我还记得当时 Amazon Go 的出现非常惊艳,只需要进入店里,从货架上拿下产品,再离开商店,就已经完成购物了。我们之前的购物体验都是收银员或者自助结算机扫描条形码,那么用算法识别物体替代条形码扫描,在提升收银效率的同时,降低了零售商的人员成本。

可是,我看到 Amazon Go 在 2023 年关闭 8 家门店,做类似业务的各家初创公司也多多少少遇到发展瓶颈。可以展开聊聊么?

UpHonest Eric:类似自动驾驶的智能化分级,智能零售系统也存在智能化分级。

以 Amazon Go 为代表的 Check in、grab and go 的模式,类比 l5 级别的自动驾驶,提供全程无摩擦的购物体验。类似的初创公司有:Standard AI(s17)、Grabango、Zipin 等。

这个模式的 vision 就是无人零售的终极形态,难点在于:

. 首先商超需要全局改造,摄像头覆盖、就近服务器部署就需要很大的前期投入

. 其次由于早期技术的局限性,货物的识别往往会出现误差,这导致在自动系统的背后往往需要配备一个人工的复核团队

. 最后,对于商超来说,商品的补货仍然需要人工操作,并不能达到真正的无人零售

因此,无论对于商超还是无人零售解决方案提供商而言,ROI 都很难算的过来。正像你提到的 Amazon Go 在去年关了好几家店;在 2021 年前后无人零售概念火的时候,各家初创公司都融了不少钱,但由于一直是烧钱的模式,到现在多多少少遇到发展瓶颈。

以 Mashgin(YC W15)为代表的 Checkout unit 模式,类比 L3 级别的自动驾驶,是原有自助收银系统的智能化版本。类似的还有 Caper(YC W16),除了智能收银系统以外,它还提供能够自主结账的购物车,在 2021 年被 Instacart(YC S12)以 3.5 亿美金的估值收购。

区别于 AmazonGo 的识别模式,Mashgin 使用的是静态固定角度物体识别,因此他们的解决方案能将当下的计算机视觉算法发挥到最佳程度。也正因为如此,Mashgin 只需要使用最普通的摄像头就能达到 99.9% 的准确率。由于成本优势,Mashgin 可以让用户感受到直观的 ROI,从而吸引更多的客户,包括那些经济较差、基础设施较差的地区的小商户。并且对于终端的消费者来说,购物的流程并没有被改变,不需要下载额外的 App、也不需要担心隐私数据的泄露。

总的来说,「伟大的愿景」和「现实的困难」是需要平衡的,尤其是在环境不好、风口不在的时候。这一点其实也印证很多机构对于当下生成式AI应用的观点。大家认为,2024 年是生成式 AI 应用落地的一年;围绕生成式 AI 的炒作将让位于对结果的关注,投资者将开始关注那些通过 GenAI 创造实际收入的的企业。AI Grant 甚至预测,在未来的 12-18 个月内,会出现收入达到 100 亿美金的 AI 产品。

硅兔赛跑 Amanda:Mashgin 的故事让我想到了另外一家公司——Imbue。对于大部分人来说,它在 2023 年横空出世,估值一下子达到 10 亿美元,英伟达投资,后续又拿到了亚马逊 Alexa Fund 的投资,其实 Imbue 是 YC 在 2017 年夏天孵化的公司,当时他们的创业方向是用 AI 提升招聘效率,公司发展不理想,直到 2022 年才确定转型方向,确定将 AGI 作为公司核心愿景,并拿到 OpenAI 前员工的投资支持,2023 年又确定了开发 AI Agent 产品方向。不知道 Imbue 早期的投资人有没有猜到这家公司的跳跃式发展。王子,还有哪些穿越周期的案例能带给我们一些启发?

UpHonest 王子:我觉得还有一个很好的案例是去年被汤森路透 6.5 亿美元收购的 AI 法律公司 Casetext。

他们帮助律师阅览法律文件、检索资料、修改文书等等。有一个非常有意思的使用场景,也充分体现了他们对于业务需求的了解,律师可以让 AI 助手阅读案件相关的往来邮件,AI 可以标识出其中涉案的风险词汇。

Casetext 是一家老公司,2013 年成立,10 年后被收购,他们做到了其他生成式 AI 公司很难媲美的一点,在被收购时,他们其实使用大语言模型已经有五六年时间了。

从 2018 年的 BERT 模型开始,第一批在 2020 年使用 GPT-3、第一批在 2023 年使用 GPT-4,2023 年业务起飞,收入增长了 3 倍,而且原来花  1 年都不一定能搞定的大律所,现在 1 个月就拿下了。

Casetext 说明了只要目标感足够强,保持敏锐,且行动力强,就有机会穿越周期。

另外我觉得这个案例反应了现在生成式 AI 浪潮中一类公司的机会,就是那些深耕垂直行业,有不错业务基础,现在增加生成式 AI 产品功能的初创企业。

这类公司有一个优势就是他们已经有现成的客户,可以在客户现有的工作流中增加新功能,客户的切换成本低,投资回报 ROI 可能更加清晰。

我们之前也提到过 ROI 的重要性,去年,客户可能在兴头上,只关心自己得有生成式AI战略,今年,客户可能会变得更加实际,关注使用的生成式 AI 产品的 ROI。

我们的一个项目 FieldGuide 就属于这个类型,他们刚官宣拿到 Bessemer Venture Partners 领投的B轮融资,估值倍数超过一般 SaaS 标准,被看重的地方就是积累的数据和业务经验。

硅兔赛跑 Amanda:在上一次北美顶尖 AI 投资机构的投资分享中,我们有提到 2024 年 AI 应用的投资回报率 ROI 可能将在采购决策中变得更加重要。有兴趣的朋友可以回顾。想问个问题,有哪些容易产生 ROI 的应用场景?

UpHonest 王子:法律显然是,我们早期投资的 Ironclad,从合同管理切入,为不同团队例如销售、采购、HR、法律顾问等提供合同协作管理工具,目前估值大约 32 亿美元。

还有一个思考维度是从现在大量使用外包团队的业务场景出发寻找机会。

例如,在法律象限下的人身意外伤害律师,他们一部分的工作是准备索赔文件,包括案件摘要、医疗费用(包括误工费)估算等,这部分一般会请外包团队来做。

EvenUp 这家公司,它的商业模式就是销售 AI 生成的索赔文件资料包,定价对标外包团队的收费。

还有在医疗支付环节,因为涉及到保险赔付,美国的医疗机构需要向保险公司提交账单申请,因此雇佣大量的工作人员,保险机构需要审核,又雇佣大量的行政人员。

只是在医院端,找到治疗服务对应的保险代码,医疗编码这一个环节,就有大约 3.5 万名医疗编码员负责,他们需要阅读医生笔记和化验单等资料来确定诊断和手术的代码,由于编码错误,美国医院每年损失将近 200 亿美金的收入。

生成式 AI 其实可以被用来整理非结构化的医生笔记、化验单等,找到正确的代码,通过自动化的方式减少人力,同时提高准确率。

大家可以想象还有那些外包场景。

硅兔赛跑 Amanda:我们已经讨论了两个 AI 周期的发展以及成功穿越周期的公司对我们现在的启示,回到我们今天想要讨论的话题“2024 年会成为 2017 吗?”之所以会有此疑问,是因为 The Verge 在 2 月提出了 2024 年将是 AI 的清算之年。在 2017 的时候,也曾有很多关于 AI 泡沫即将破灭的观点。考虑到现在市场很热,AI 初创公司的估值水涨船高。你们怎么看呢?

UpHonest Eric:2024 与 2017 确实有相似之处,但是显然 2024 只是 GenAI 的里程碑,并不是由盛转衰的转折点。

首先发展路径类似,都是理论突破 - 技术破圈 - 应用破圈的路径。区别在于,这一波生成式 AI 无论是人才的密集程度、资金的投入数量、技术的实现程度以及大众的认知度都不是一个量级的存在。

大模型的潜力还远远没有穷尽,Sora 的出圈证明了 Scale Law 在其他模态的模型上依然成立。可以预见的是,大型语言模型、多模态模型将持续迭代升级,那么基于这些模型的应用能力也会升级、新的应用场景也会被发掘出来。所以说,如果2017是上一波技术路径发展的天花板的,2024 只是达到了一个阶段性的里程碑,上限在哪里还仍未可知。

其次,现在的市场中确实充斥着很多噪音。Assembly AI 的创始人也曾提及,目前对于生成式 AI 公司来说,marketing 具有很大的挑战,如何清楚的传达自己在做的事情,让别人理解自己产品的differentiation是很困难的。从 23 两个 batch 的 YC 项目就可以看到会有很多公司卷一个类似的idea,包括之前 21、22 年的公司也会 pivot 到类似的方向上。这样的前提下,肯定会有一些公司被淘汰。但同时,那些能给用户带来效率提升的应用会得到验证。GitHub Copilot 付费用户突破 100 万、EvenUp ARR 5倍增长、Microsoft Copilot 预测收入将破百亿美金。种种迹象显示,大浪淘沙后生成式 AI 的应用中跑出了金子。反观上一波 AI,现象级其实成功的案例并不是很多。

最后一点,2024 的不同在于生成式 AI 对于 C 端的渗透。相比 B 端,C 端应用具有更大相信空间。用 ChatUI 代替 GUI,成为新的人机交互入口,是上一波大厂都想做缺没做成的事。从 ChatGPT、Character AI 的表现来看,已经有一些成功的迹象了。同时,GenAI 正在向 Prosumer 渗透,这几天出圈的 SunoAI 就是一点典型的例子。

从价值分配格局来看,这次与上次也会有所不同。我们猜想初创企业将在这一波生成式 AI 浪潮中获取更多价值分配。

在上次的”深度学习”AI 浪潮中,新技术创造的增量价值大部分被大厂拿走,比如 Meta 的广告推荐、抖音的内容推荐等。

我们投资的一位创业者,他在 2012 年创立的计算机视觉公司被亚马逊收购,他的切身观察是“在上一个技术周期,AI 初创的商业模式和退出方式主要是靠卖给大公司,那时大厂没有人才、没有成规模体系的 AI 架构,大厂借此补上了 AI 基础设施和团队短板。“

硅兔赛跑 Amanda:有道理,我们确实也已经看到了很多初创企业赢得更多价值的例子,例如 Midjourney vs Adobe,Harvey 之于法律,Magic 对 Github Copilot 的挑战。你觉得为什么会有这样的变化?

UpHonest 王子:一方面是生成式 AI 将创造的价值规模更大,蛋糕更大了。

另一方面是基石模型的出现,从技术层面降低了创业者打造好产品的门槛。

这是上一波 AI 浪潮中创业者不具备的优势。

由于当时的技术对产品性能的提升有限,没法只靠技术做出 10 倍好的产品,那现有玩家也许只需要做到新玩家一半好,集成到客户正在使用的产品中就赢了。

此外,当时数据护城河的价值可能要远高于现在。基石模型用广泛的互联网数据作为初始训练集,就像一个读完九年义务教育的学生,创业者可以在这个基础上进行专业培训。而此前可能只有大公司有足够庞大的数据集使模型接受九年义务教育。

所以这次初创企业的起点和竞争能力都会远强于此前的 AI 初创企业。

UpHonest Eric:确实,直接调用大模型的 API 开发产品其实非常有利于初创企业,因为可以加速产品开发进程,可以看到现在 AI 初创出 demo 和产品的速度是非常快的。

而且在 AI 这个领域,很多核心的论文都是开源的,越是到技术成熟的阶段,大家能使用到的工具和模型就越趋同的。这个时候比拼的就是行业知识和数据的积累,以及利用这些积累打造出优秀的产品。

硅兔赛跑 Amanda:还有什么补充么?

UpHonest 王子:我们预测 2024 年收并购肯定会更加活跃、规模更大,更多玩家参与。

在这两次技术浪潮中,苹果都是最活跃的收购方,2023 年收购了 32 家 AI 初创企业,是之前的近3倍。

现在人才和技术的价格显然更贵。微软支付给大模型公司 Inflection AI 6.5 亿美元,Inflection 的联创和大部分团队(约 70 人)将加入微软。Databricks 13 亿美元收购 MosaicML(62 人)。

在之前的浪潮中,谷歌收购 DeepMind(75 人团队)大概花了 5 亿美元,苹果收购 Siri 大概花了 2 亿美元。

此外,初创企业之间的收并购在今年第一季度频繁发生。例如 Jasper 收购文生图应用,企业开支管理软件 Ramp 收购 AI 驱动的采购软件,AI 推理芯片 Groq 收购企业级 AI 应用等,AI 医疗管理公司 Syllable 收购接诊 AI 等。

预测 2024 年巨头持续活跃收购AI初创企业,传统公司关注 AI 收并购加速 AI 转型,初创企业之间的收并购更活跃以增强竞争力。整体会更加活跃。

硅兔赛跑 Amanda:我们的结论是「2024 不会是新的 2017」。那么2024 有哪些新东西值得期待?

UpHonest Eric:我觉得 Embodied AI 是值得期待和关注的方向。

. 首先作为链接数字世界和物理世界的大模型,它的想象空间是巨大的。

. 其次可以看到越来越多的大厂可以投资资源:

GTC上Nvidia 宣布了开启人形机器人通用基础模型 GROOT 项目。

再早一些,Figure 与 OpenAI 合作发布的人形机器人演示视频也吸引了一大波关注。

包括 Google 最早从 12-13 年收购 Boston Dynamic 开始就一直在机器人领域投入很多。他们开源的RT模型和相关数据对外界模型的开发起了很大的帮助。

. 最后顶尖的人才也在往这个方向汇聚:

Geoffrey Hinton 在离开 Google 后参与了一家机器人初创公司

Lifefei 对标 ImageNet 做机器人版本的数据集

硅兔赛跑 Amanda:那现在 Embodied AI 处于一个什么阶段呢?

UpHonest Eric:首先,Embodied AI 的研究仍然处于非常早期的阶段。

. 如果把它作为 Transformer 衍生的角度来看的话,目前主流的像 PaLM-E、RT-2 目前仍处于GPT-1的水平。

. 如果把它作为一个全新的领域去攻克的话,那 Embodied AI 仅仅处于 ImageNet 出现的阶段。

但,无论怎么去看,高质量的训练数据依然是限制模型发展的重要障碍之一。值得一提的是,Sora 的出现可能会对 Embodied AI 的进展起到意想不到的效果。如果 Sora 在训练视频生成能力的同时泛化出模型对于真实物理世界的认识和感知的话,这对于机器人的训练是非常有帮助的。

当然了,虽然 Embodied AI 仍然处于非常早期的阶段,但是我觉得 Embodied AI 的发展进程可能会比大模型发展的周期更快。因为资本和人才已经见证过了大模型这个成功案例。所以支持下一波大机会的资金和人才信心和意愿也会更强,基础设施也会更完备。

硅兔赛跑 Amanda:还有其他值得期待的吗?

UpHonest 王子:数字化渗透率低的传统行业,有可能跳过软件阶段,直接进入 AI 阶段,类似新兴市场从使用现金直接转向移动支付。

我们投资的为家政服务行业提供 AI 接线员的公司,数据增长非常快。

这个方向的潜力吸引到一个非常资深的团队进场,它的 CEO 之前创立了为 Siri 提供技术的公司,被 2 亿多美元收购,之后又创立了一家计算机视觉公司,被美国农业机械巨头 John Derre 收购。

医疗行业值得关注。

美国市值前 100 的上市软件公司中,只有一家服务医疗行业。

看了今年 YC 孵化营,我们感觉今年 AI+ 医疗的应用格外多,甚至细化到牙医的 AI 接诊员,放射科医生、家访护士和住院护士的助手等。

在我们与创业者的交流中,他们认为医疗行业有可能成为美国最先拥抱 AI 立法的行业,预计会有更多创业者在信号更明确后开始 AI+ 医疗创业。

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

1711682390_pic_real.jpg

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章