HelloKitty • 2024-10-28 17:03
904
本文由 硅星人Pro 撰写/授权提供,转载请注明原出处。
文章来源于:硅星人Pro
作者:Yoky
2023 年 8 月 18 日,字节跳动旗下 AI 对话产品 Grace,更名为「豆包」。
在百模大战一波又一波密集的“重磅发布”中,这条当时看着毫不起眼的消息,悄然开启了字节大模型的多重宇宙。
从时间线来看,字节跳动的确晚了。相比于当时反应迅速的百度和阿里,没有发布基础模型的字节,彼时并无法靠「豆包」来说服质疑它的观众们。
据字节内部人士透露,2023 年年初,集团内部才刚刚开始训练基础模型,而后,字节跳动明确了战略方向,之后字节开始高举高打,内部的组织架构以及外部策略都开始进行了大变革。
11 月 27 日,也就是确认字节将放弃游戏业务的同一天,字节跳动传出已成立了一个新 AI 部门 Flow。
紧接着,字节系各类AI 应用如流水线上的产品一般,快速涌向市场。据硅星人统计,2024 年至今,字节在国内外推出包括「豆包」在内的 20 余款 App,从集成式的聊天助手,到图像、视频、音乐等效率工具,加速渗透到教育、办公助手、开发平台、代码生成等行业,而且,这些应用的表现亮眼,一个个在 AI 应用大乱斗里杀出重围。
今年 3 月「豆包」的下载量和月活跃用户开始双双登顶。而据 a16z 发布的全球 Top 100 AI 应用榜单显示,字节系的 Cici、Coze、Gauth、Hypic、CapCut 五款产品名列前茅。与此同时,字节依然不断在海外推出新的产品进行试点。
10 月份,这种势头仍在继续,据 Sensor Tower10 月份最新数据免费榜前 10 中,Gauth 排名第六、TikTok 排名第七、CapCut 排名第九。
这些都是令所有 AI 应用创业者眼馋的成绩。字节 AI 究竟为何能如此凶猛?
重启“APP 工厂”
字节系 AI 产品全线突飞猛进的同时,许多人越来越明显感到一丝熟悉的味道——“APP 工厂”回来了。
在移动互联网时期,“App 工厂”的打法是字节快速开疆扩土的重要策略之一。公开数据显示,2018 年-2020 年,也就是字节增长最为迅速的几年间,它自研和收购了大量的项目,其中在 App Store上线的应用就有约 140 个,占其成立以来的七成。
期间,字节通过批量生产,在今日头条和抖音之后,也成功推出了剪映、懂车帝、皮皮虾、番茄小说、轻颜相机等爆款。
从 2023 年 11 月,APP 工厂在 AI 时代重启了,字节陆续密集上线了众多 APP。经硅星人整理如下表:
值得注意的是,其中海内外产品几乎一比一对应,一部分国内产品如豆包、剪映复制到国外;另一部分则是在海外高排名的产品复制回国内。
在整理的过程中我们发现,不少产品的名字在几个月内频繁变动,比如对标星野的 AnyDoor,早期进入国内时名为「话炉」,在今年 4 月份名称改为「猫箱」,「河马爱学」改名为「豆包爱学」等等。
这背后是字节系产品对于 AI 产品命名和定位的思考。
彼时大模型产品的命名常常引经据典,与文心、通义、混元、星火、天工相比,「豆包」听起来土味十足。“当时准备将 Grace 推向市场的时候,内部一致认为必须要改名,要做中国市场,英文名限制太大。陆陆续续起了 100 多个名字,有一部分有硬伤直接被 Pass 了,剩下的做了一些田野调查,有负面关联又淘汰了一部分,最终是朱骏拍板定了「豆包」这个名字。”
豆包团队的人员告诉我们:“我们私底下讨论过,豆包这个词在中国的渗透率差不多 80%-90%,没有硬伤。字节内部起名字有一整套的流程,再经历田野调查,这个名字有没有什么负面关联。”
相比于创业公司和其他互联网大厂,字节的优势在于成熟的产品方法论,来保证产品的水平在 60 分以上,形成稳定的产出。
而在场景的选择上,目前根据我们整理的结果发现,字节系产品其实并没有真正在开拓新的场景,它其实很少“教育市场”,而是更多“顺应市场”,在已经被部分验证的场景下进行产品的迭代和优化。同时,海外市场更多承担新产品孵化地的角色,产品在国内和国外是隔离的,通常一侧上线,完成市场和用户数据分析后再在另一侧上线类似产品。
简单地说,它的策略就是复制小爆款,成为大爆款。
比如「豆包」虽然推出得晚,但上线便集齐了对话、Agent、语音通话等当时分散在不同产品中的大模型功能,「猫箱」完全对标「星野」、「星绘」对标「妙鸭」、「海绵音乐」对标「Suno」,在此基础上,结合用户体验对产品进行迭代。
哪些产品要放弃,哪些产品又要继续投入资源?答案依然是,数据。
字节跳动有专门负责产品增长的团队。这个团队构建了一个强大的数据监测系统,他们会花大价钱去买市面上的数据,尽可能监控所有产品,用来指导研发。
基于信息差的实验+地毯式孵化+数据增长,形成了一条新的 AI APP 生产线。
争夺“豆包”,模型也赛马
App 工厂的背后,是字节式的赛马机制。
“Grace 是 2022 年我们团队开发的,在字节内部使用的产品,员工可以用它来学习一下内部资料。”豆包初始团队的同学告诉硅星人:“到了 2023 年年初,字节内部有好几个团队还有自发组成的新团队,都在尝试新产品,但我们团队因为做得早,有产品雏形,公司开始计划基于原来的框架推一个移动端的产品。”
「豆包」诞生初期,赛马并没有那么激烈,随着AI产品战略逐渐明确,内部也逐渐开始了新一轮的赛马。
据硅星人了解,目前字节内部形成了多轮赛马制:
第一阶段,创新产品中心负责前期孵化、产品创意、内部审核以及完成产品的前期打造,到产品测试上线。在这个阶段几乎不会有流量支持,靠产品自身的形态吸引自然用户;
进入第二阶段的产品,开始可以拿到一部分初始预算进行外部推广,由专门负责增长的团队负责拉新留存,进行产品排名,数据表现好结合内部分析,从创新产品中心进入到具体的产品组;
而第三阶段,成型的产品开始进行大规模推广,如「猫箱」、「星绘」从去年年底开始在抖音投流以及通过 KOL 推广。
早期产品生产内部架构
“有点内部创业的意思吧,项目做好了团队内部分奖金,大家都希望能获得更好的资源,但产品这边的竞争其实比较良性,毕竟大家并不交叉。”
不过,和移动互联网时期的模式不同的是,当时所有的产品都是基于个性推荐算法团队生长,而如今,在今天的 AI 产品们底下的模型层,字节其实并没有达到统一。
产品层,豆包已经是一个统一的品牌,所有产品向豆包靠拢。但在模型层,“豆包”更像是一个代号,究竟谁能成为“豆包”,更像是一场争夺行动。
举个例子,9 月 24 日,火山引擎一口气发布了两款视频生产模型,但对外并没有展示详细解释两款模型的差异,我们发现 PixelDance 和 Seaweed 在发布前,在 Github 上发布过对应的模型细节,它们分别属于两个团队,但最终均被冠以“豆包”之名对外发布。
从内部结构来看,模型和算法归属于模型算法团队 Seed,由朱文佳(曾任 TikTok 产品技术负责人)负责;2023 年 11 月成立的 Flow 团队主要负责打造 C 端产品,在最新的人事调动中显示,朱文佳为整体业务负责人、朱骏(原 Music.ly 创始人、原 TikTok 负责人)为产品负责人、洪定坤为技术负责人,向下包括豆包、AI 教育、社区、国际化四个部门,同时 PC 端和移动端也分为两条业务线;而豆包大模型 to B 的商业化业务主要由火山引擎对外提供,并通过 API 的方式接入飞书。
Seed 团队由原来的搜索团队、AILab 团队、AML 团队联合而成,但实际上,这几个团队都在暗自较劲。
“现在的豆包更像是一个统一的出口,连接用户。豆包产品后端连接了多个模型测试,是一个训练场,通过 API 的结果反馈来评测模型效果,但一时间很难有取舍。”上述内部人士讲道。
在 GitHub 和 HuggingFace 上面,字节的各类视频和图像模型,都分属于各个小团队,包含有 4 款不同功能的视频模型。
根据公开资料和介绍,我们整理了各个模型的功能,发现目前主流视频模型的能力散落在了各个模型里,比如视频编辑、运动笔刷、端到端视频生成等等,也有在 Github 上评分较高的开源模型,显示测试效果比已在国内发布的 PixelsDance 要更好。
比如 MagicVideo 的 V2 版本是目前开发者评价字节旗下最可用的一款文生视频模型,V2 版本采用了模块化式生产流程,第一模块从文本到图像、第二模块从图像到视频生产关键帧、第三模块从视频到视频扩展、第四模块视频帧插值,平滑过渡。目前整体的生成效果、色彩和审美高于 Pika1.0 和 Gen2.0。
有算法工程师就分析道:“如果几个模型的能力加起来,其实会比现在公开发布的版本更好,至少能达到可灵的效果,但是现在发布版本比较一般,可能也是内部赛马资源没有谈妥的结果。”
字节 AI 产品今天的突飞猛进,是其赛马机制下,一套屡试不爽的产品开发方法论加持的结果。但与移动互联网时代字节的“生产体系”很不同的是,今天在底层的模型侧,字节也在进行着赛马。
字节可能寄希望于它也像应用一样,百花齐放后筛选出最强的那一个,但同时它也客观上带来着资源无法集中的问题。尤其是在一个最需要大力出奇迹的时刻,这可能也会带来新的挑战。
扫码关注公众号
获取更多技术资讯