大模型让数据库行业撕起来了:Databricks和Snowflake让开发者选边站

HelloKitty 2023-06-13 17:28

扫一扫 在手机阅读、分享本文

2050

本文由 硅星人 撰写/授权提供,转载请注明原出处。

文章来源于:硅星人

作者:李禾子

编辑:VickyXiao

大模型的风已经不可避免地刮到了大数据行业,火药味还不小。

这不快临近了有人注意到,两家大数据行业的“宿敌”Databricks和Snowflake,今年双双把各自一年一度最重要的峰会选在了同一时段——6 月 26 日-29 日举办。

这可是这么多年来都没有过的事。

不仅如此,他们还“不约而同”把今年大会的主题都往 AI 靠拢了。Databricks 直接给大会取名叫“Data+AI Summit”,官网一点进去就是一个硕大的“Generation AI”:

1.png

Snowflake 也给自己的大会加了一个很牛的定语,“全球最大的数据、App 和 AI 主题大会”:

2.png

这说明了什么?说明两家公司在明目张胆逼着参会者们做选择:你要去了他们的会,再来我们这恐怕是来不及了。

要知道这俩公司,一个在旧金山,一个在拉斯维加斯,自驾要 9 个小时,飞机也得飞 1 个半小时。参会者想兼得鱼和熊掌,怕不是要折腾个够呛。

下面重头戏来了,不仅时间重合,两家公司都各自请到了重磅嘉宾来发表主题演讲——Databricks 请到的是微软的 CEO 萨蒂亚·纳德拉(Satya Nadella),Snowflake 则是英伟达 CEO 黄仁勋。

个个都是大佬。

有网友提醒大家,鉴于两家公司的峰会在同一时间举办,“如果你还没选边站,那么现在该你选择的时候到了”。

3.png

当然也有不乏准备两边跑的人。Striim 公司的产品经理 John Kutay 就计划在两个大会上分别发表讲话,不过也“将评估拉斯维加斯和旧金山两地的路程和时间”。

有还没做好决定的网友问他在 Databricks 上的发言内容会是啥,“我想去,但是到时候还得赶去 SF,唉。”

4.png

对此,甚至还有个网友做了个离谱的梦,“刚刚梦到所有人都在 Snowflake 的大会上感染新冠了,因为 Snowflake 不想让我们参加 Databricks 的峰会……”

5.png

Snowflake 和 Databricks 都是目前大数据分析公司中的佼佼者。前者于 2021 年创办,并在 2020 年 9 月上市,上市首日收盘股价飙升 111.6%,报 253.93 美元,成为美国有史以来规模最大的软件 IPO。

此外,Snowflake 的股东名单里还不乏Salesforce和巴菲特这样大名鼎鼎的投资方。

创办于 2013 年的 Databricks 则是目前一级市场中的超级独角兽,曾在 2021 年连续获得两轮 10 亿美元级别的大额融资,估值高达 380 亿美元(2021 年数据)。

一些中国从业者也更习惯叫它“砖厂”。

两家公司不仅经常被外界拿来做比较,彼此之间也总是明着暗着各种较劲。

最著名的一次喊话是在 2021 年。当时眼看着 Snowflake 靠着云数据仓库就做到了千亿市值,Databricks 坐不住了,发了一篇文章称其数据湖技术创下了 TPC-DS 基准测试新记录。

6.png

重点是,Databricks 还强调了第三方研究表明其实际性能可达 Snowflake 的 2.5 倍。

接着过了十天,Snowflake 做出回应,发布了自己的测试结果,同时称 Databricks 公布的性能比较结论缺乏完整性,而且研究本身也存在缺陷。

Snowflake 创始人还强调这种基准测试没什么意义,在这个年代发布数据库基准测试结果是“将正常的技术交流变成了缺乏完整性的营销噱头”。

7.png

不甘心的 Databricks 再次回应,创始人发了一篇博客,这次是更严重的指控:Snowflake 为了测试结果竟然改了 TPC-DS 的输入数据。

8.png

从那之后,两家之间的互呛就没有停过。

在去年和投资人 Matt Turck 的一次对话中,Databricks 的联合创始人兼 CEO Ali Ghodsi 还不避讳地谈到了与 Snowflake 的竞争。

他先是商业性地夸了下 Snowflake 有着“可能是市场上最好的数据仓库”,并且“Databricks 与Snowflake将共存于可能 70% 的客户中”。

这里补充一点,Snowflake 主要用的是数据仓库技术,Databricks 用的则是数据湖技术,这也是两家技术思路最主要的不同。

接着 Ali Ghodsi 就宣传起了自家的数据湖,“公有云计算供应商有动力推动更多人把数据存到他们的数据湖中……我认为数据湖的范式将获胜。”

产品性能上的你追我赶还没完,现在 Databricks 和 Snowflake 又暗戳戳在大模型上较上劲了。

Databricks 在今年 3 月发布了一个名叫 Dolly(据说是为了向第一只克隆羊多莉致敬)的开源大语言模型,称“只需 30 美元、一台服务器和三个小时,我们就能教 Dolly 开始进行人类级别的交互”。

9.png

这明摆着也是在针对 ChatGPT 这样门槛更高的产品,意思就是 AI 不再是只有大型科技公司才能负担得起的东西,不用拿多少融资,任何人都能开发出一个真正像人类的 AI。

Databricks 接着又在 4 月发布了该大语言模型的开源迭代版本 Dolly 2.0。

Snowflake 这边也在不断炒作大模型,在4月发布文章称正在为生成式 AI 和大语言模型搭建一个以数据为中心的平台,并在文中详细解读了这么做的依据和将带来的影响。

随后的 5 月,Snowflake 宣布收购初创公司 Neeva,以在其数据云平台中添加基于 AI 的生成搜索。

10.png

虽然在 AI 大模型方面两家公司还没有互踏进对方的领地,不过这次年度峰会举办时间的重叠已经说明了他们的态度。

有趣的是,有人在谷歌搜索“Snowflake conference”,出来的第一个结果却是 Databricks 家的大会链接,其次才是 Snowflake 的。

11.jpg

就等于说,Databricks 买了竞争对手的关键字,来卖自己的广告。

12.jpg

我们也发现,在谷歌同时输入“Databricks+Snowflake”搜索,前两条都是广告(这个结果是动态展示的)——Databricks 依然在竞价排名的第一位置宣传着自己取得的成绩,但第二则是一家技术服务商,在宣传自己帮客户迁移到 Snowflake 的服务,这个投放甚至比前面有人发现的两家直接竞价的情况更有意思,Databricks 依然可以被解读为(在商业攻势上)进攻性更强、更有战斗力的一方,但在两家的竞争中一些技术服务商也在抓紧寻找商机,而且似乎更认为转移到Snowflake 的需求更大…

不论如何,一场大战又要打响了。现在大模型领域不缺搅局者,到了 Databricks 和 Snowflake 这里,兴许就成了谁先干掉谁的问题。

最新.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章