94亿!生成式AI领域最大并购案诞生

HelloKitty 2023-06-29 14:46

扫一扫 在手机阅读、分享本文

1871

本文由 智东西 撰写/授权提供,转载请注明原出处。

文章来源于:智东西

作者:李水青

编辑:心缘

生成式 AI 领域的最大并购案已经诞生!

智东西 6 月 27 日报道,据华尔街日报今日消息,大数据超级独角兽 Databricks 近日已同意以 13 亿美元(约合 94 亿元人民币),收购生成式 AI 初创公司 MosaicML,引起了国内外资本和智能圈的关注。

MosaicML 是一家 2021 年创立于美国旧金山的AI软件公司,截至目前公司总人数 62 人,此前仅获得了 6400 万美元融资。这样一家小 AI 公司为何能卖出百亿元人民币身价?从消息面上看,MosaicML 的创业团队由英特尔负责 AI 的前高管掌舵,刚刚在今年 6 月开源了一个 300 亿参数规模的大语言模型 MPT-30B,这些动向都为其成为“OpenAI 挑战者”埋下伏笔。

同样位于旧金山的 Databricks 是一家知名数据存储和管理公司,本次收购 MosaicML,按照其说法,是要助企业客户利用专有数据,以更低成本构建语言模型,赶超 GPT 等大模型。

1.jpg

当下正值 AI 掀起新浪潮,微软、OpenAI、谷歌等科技大厂的声势浩大,国内的“百模大战”也进入深水区。当下,一些国内投资者对 AI 大模型创业的前景产生了怀疑,比如知名投资人、金沙江创投董事总经理朱啸虎就直言,ChatGPT 对创业公司很不友好,未来两三年内请大家放弃。MosaicML 收购案或许能为当下的产业圈提供新的参考。

2.png

在 OpenAI 及科技大厂当道的大模型时代,AI 创企的发展空间在哪里?MosaicML 这样创立仅两年的公司为何能卖出高价?这对国内市场有什么参考意义?本文对此进行了深入探讨。

MosaicML 是谁?仅 15 名研究员,英特尔 AI 大佬创业,已开源大模型

首先来看看 MosaicML 公司是什么来路。

从规模上看,MosaicML 并不大。根据外媒援引官方披露消息,MosaicML 目前拥有 62 名员工,其中研究人员仅为 15 名,在旧金山、纽约、帕洛阿尔托和圣迭戈设有办事处,迄今为止主要是从 Lux Capital 和 DCVC 等投资者那里筹集了 6400 万美元。

但 MosaicML 的创业团队不简单。MosaicML 联合创始人兼首席执行官 Naveen Rao 曾任英特尔副总裁兼 AI 产品事业部总经理。Rao 之前创办了AI芯片公司 Nervana,于 2016 年以 4.08 亿美元被英特尔收购。MosaicML 的 CTO Hanling Tang 是前英特尔 AI 实验室高级总监,可以说 MosaicML 是妥妥的大佬创业。

3.jpg

▲MosaicML联合创始人兼首席执行官Naveen Rao(左)和CTO Hanling Tang(右)

MosaicML 已经开源了大语言模型,接受市场检阅。今年 5 月,其开源了 70 亿参数规模的大语言模型 MPT-7B,紧接着在 6 月开源了第二个开源大型语言模型 MPT-30B。该公司称,尽管其参数量仅为 300 亿,是 GPT-3 的 1750 亿参数的 1/6,但在推理任务表现超过 GPT-3,且能更容易在本地硬件上运行,部署推理成本更低。

Rao 承认,GPT-4 在大多数方面的功能都更为优越,不过,MosaicML 的模型提供了更长的上下文长度,这允许独特的用例,例如让其生成著名小说《了不起的盖茨比》的尾声,且成本更低。

按照 MosaicML 的说法,300 亿的参数规模是其精心选择的结果,可以更好地针对 GPU 进行优化:

其能够轻松部署在单个 GPU 上,在 16 位精度对应一块 80 GB内存的 A100 GPU,也可以在 8 位精度对应一块 40GB 的 A100GPU。据称该模型在众多任务中实际效果优于更费算力的 LLaMA、Falcon。Rao 在采访中提到,MosaicML 使用了一种名为“FlashAttention”的技术,使用户能更快地进行推理和训练。

4.jpg

同时,MPT-30B 接受了比其他模型更长的序列的训练,最多达 8000 个标记;但包括 GPT-3、LLaMA 和 Falcon 每个模型仅为 2000 个标记。简单说,这意味着用户可以输入更长的提示,可能更适合数据密集型企业应用程序。

医疗保健和银行等行业可以受益于 MosaicML 解释和汇总大量数据的能力。例如,在医学领域,该模型可以解释实验室结果,并通过分析各种输入来深入了解患者的病史。开源模型更有利于保障医疗数据安全,通过 API 将其发送给 OpenAI 则威胁数据安全。

5.jpg

Rao 说,其可以助一个模型的构建成本从数千万美元降至数十万美元。

不过,很难完全独立验证 MosaicML 的说法,因为 Rao 谈到的三个开源大语言模型项目(MosaicML、LLaMA 和 Falcon)尚未使用斯坦福大学的 HELM 措施等权威方式进行测试。

但可以肯定的是,MosaicML 在这帮英特尔系 AI 大牛的带领下,正通过对准 GPT 模型的局限之处,试图越过 OpenAI 实现弯道超车。

超级独角兽出手,加码开源大模型与 OpenAI 掰腕子

不仅 MosaicML 是开源大语言模型的代表,其收购方 Databricks 也是开源模型的重要倡导者。

Databricks 创立于 2013 年,是一家由美国伯克利大学 AMP 实验室著名的 Spark 大数据处理系统多位创始人联合创立的 Spark 商业化公司。相比于微软、谷歌等大厂,Databricks 实际上也只能算一家创企。但其在 2021 年 8 月完成了一轮 16 亿美元融资,当年已成为估值达 380 亿美元的超级独角兽,赶超了 OpenAI 当下的估值。

营收方面,根据 Databricks 公布数据,其在 2022 年年收入超过 10 亿美元,这都为公司收购 MosaicML 提供了经济基础。

6.jpg

在 AI 方面,Databricks 主张开源模型可以与 OpenAI 等公司提供的模型相媲美。

今年 4 月,Databricks 公布了其更新之后的开源 Dolly 大语言模型,它能够响应客户查询,根据 Databricks 智能湖仓内的数据给出答案。随着 ChatGPT 卷起新浪潮,Databricks 也凭借其湖仓一体平台允许数据团队存储和保护数据,支持机器学习工具的开发;Databricks 同时也提供 TensorFlow 等流行 AI 框架集成,降低企业构建和部署 AI 模型的门槛。

并不是每个人、每个应用程序都需要 GPT-4。Databricks 的首席执行官 Ali Ghodsi 说,现成的模型接受过互联网数据的训练,虽然已经可用,但它们充满了可能扭曲结果的无关信息,外部供应商构建的模型中的数据隐私安全问题也值得警惕。

7.png

Databricks 的一大核心技术被称为 Lakehouse(湖仓一体),可以为 AI 应用管理数据,并将数据、分析和 AI 编程工具统一在一个系统中。MosaicML 并入 Databricks 后将成为旗下的一项独立服务,助企业利用专有数据构建低成本语言模型。比如,Replit 这样提供编程工具的公司已在使用 Databricks 作为数据管道,进而将信息传输到 MosaicML 来训练代码生成模型,进而服务其客户。

可以看到,数据智能独角兽 Databricks 正试图通过并入 AI 大模型能力,挑战微软、OpenAI、谷歌等大公司的市场统治力,为产业提供了新的参考。

不过,也有人将 MosaicML 收购案看作借大模型热度炒作,因为 Databricks 主营 Lakehouse,主要是用 Spark 来处理大规模集群数据,因此其整合大语言的价值并不明确。尚不清楚 Databricks 通过何等方式支付收购项目。

因此,这一并购案能否真正证明 MosaicML 的商业价值,仍需要等待时间的验证。

AI 大模型创业的机遇点:垂直行业、数据安全、更低成本

当下正值国内“百模大战”进入深水区,MosaicML 并购案或许对国内产业也能带来一些新参考。

且不论 Databrick 豪掷千金的真实意图,这一案例体现了国外市场对 AI 大模型创业的积极态度。本次被收购的 MosaicML 公司创立仅两年,公司仅 62 人,但收购价格达到了近 100 亿元人民币的高价,给国内 AI 大模型创业增添了一定信心。

近日,国内投资圈出现了对生成式 AI 及大模型投资的怀疑。美团联合创始人王慧文因病离职引起人们对 AI 创业难度的担忧,昨日猎豹移动 CEO 傅盛与金沙江创投董事总经理朱啸虎在朋友圈就 ChatGPT 的争论也引起关注。

朱哮虎认为 ChatGPT 对创业公司很不友好,未来两三年内请大家放弃,傅盛吐槽说“硅谷一半的创业企业都围绕 chatgpt 开始了,我们的投资人还能这么无知者无畏”,朱啸虎在评论区说傅盛是抬杠。

8.jpg

市场分析公司 PitchBook Data 数据显示,全球生成式 AI 市场的支出到今年底预计将达到 426 亿美元,到 2026 年将达到981亿美元。报告称,生成式 AI 初创公司的风险投资从 2022 年全年的 48 亿美元增至 2023 年前 5 个月的 127 亿美元。

值得一提的是,垂直行业大模型市场正成为重要的机会点,密集数据成为 AI 大模型创业成功的关键要素。

生物制药服务公司 Syneos Health 的首席信息兼数字官 Larry Pickett 在近期谈道,目前根据专业健康数据训练模型的成本,大约为 100 万至 200 万美元。通过使用较小的开源预训练模型,而不是在 OpenAI 拥有的整个数据集之上构建,花费会大大减少。企业技术领导者面临着为 AI 模型准备数据的压力,数据和数据智能平台成为痛点也成为创业者的机会点。

可以看到,垂直行业、数据安全、更低成本,这些要素或许都是 AI 创企避开巨兽脚印,谋求商业化成功的重要机会点。

结语:生成式 AI 创业“吸金”创企要避开巨兽的脚印

13 亿美元的大额生成式 AI 并购案为 AI 创业带来了新参考。尽管 MosaicML 公司的创立时间、规模、人才实力看起来都十分有限,且其大模型效果仍未赶超 GPT-4,MosaicML 仍被收购方 Databricks 给予了较高认可,从而阶段性地验证了其价值。

实际上,也有人认为 Databricks 整合大语言模型的价值不够明确,可能是借大模型热度炒作,这一案例参考性还需要时间验证。不过无论如何,MosaicML 案例也确实点明了垂直行业、数据安全、更低成本这些 AI 创业的关键要素,值得产业参考。

最新.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章