字节大模型内部赛马，下一个爆款 or 烧钱深坑？

HelloKitty • 2024-10-29 17:32

扫一扫在手机阅读、分享本文

8974

本文由 Tech星球撰写/授权提供，转载请注明原出处。

文章来源于：Tech星球

作者：陈桥辉

今年最火的两款全球 AI 产品，当属视频生成大模型产品 Sora 和音乐生成大模型产品 Suno。

今年 4 月，经 Suno 爆改的周杰伦金曲《以父之名》和《夜曲》直接封神，在音乐界掀起了一股不小的波澜。不少人认为，这两条赛道会催生出新的爆款产品，谁能够拿下其中一条赛道，谁就能成为 AI 行业的王者。

两款 AI 产品的火爆，迅速点燃了国内大厂对这两条赛道的争夺战。阿里发布了通义万相 AI 视频服务，字节跳动发布了“PixelDance”，快手发布了视频大模型产品“可灵”，QQ 音乐、网易云音乐也发布了 AI 创作功能，而 AI 头部公司的 Minimax、生数科技、智谱AI也纷纷跟进。

在这两条热门赛道中最不遗余力的当属字节。9 月 24 日，火山引擎在深圳举办 AI 创新巡展上，发布了豆包视频生成 -PixelDance、豆包视频生成 -Seaweed 两款大模型，意味着字节正式宣告进军 AI 视频生成赛道。

不仅如此，字节还在音乐生成赛道上，推出了 Seed-Music 音乐生成模型，并于今年 7 月推出了发布了全新版本的海绵音乐 APP，主打“一键创作你的 AI 音乐”，这款产品也是字节 AI 音乐产品的代表作。

至此，字节完成了在 AI 视频和 AI 音乐这两条热门赛道上的全布局。火力全开之下的字节，能够得偿所愿吗？

字节 AI 赛道创业：

试错、内部赛马并举

豆包视频生成大模型的发布，是字节在 AI 领域的一次重磅亮相。

据火山引擎介绍，豆包视频生成模型基于 DiT 架构，通过高效的 DiT 融合计算单元，让视频在大动态与运镜中自由切换，拥有变焦、环绕、平摇、缩放、目标跟随等多镜头语言能力。

而在此前视频生成模型大多只能完成简单指令，豆包视频生成模型则能实现自然连贯的多拍动作与多主体复杂交互。例如，后者可以让不同人物完成多个动作指令的互动，使人物样貌、服装细节甚至头饰，在不同运镜下也保持一致，接近实拍效果。

基于豆包视频生成大模型，字节内部也推出了相关的具有 AI 视频生产能力的产品，主要由两个业务团队在推进，一个是豆包，一个是剪映，可以看做是内部的一场赛马。

豆包对外的产品是豆包 APP，剪映则是即梦 AI APP，两者的底层技术都是使用的豆包视频生成大模型，即梦使用的是豆包视频生成大模型“PixelDance”。

两款产品虽然都有着视频生成能力，但即梦更具有代表性。

即梦的前身是 Dreamina，是原字节跳动中国 CEO、转岗至剪映的业务负责人张楠的创业项目。刚上线之时，这仅仅是一个文生图的创作产品。随后，Dreamina 瞄上了 Sora 的潜力，内部基于 PixelDance 模型开始研发视频生成能力，今年 2 月，Dreamina 的视频生成服务开启对外测试。

今年 5 月，Dreamina 改名即梦，宣布其 AI 作图和 AI 视频生成功能全量上线，并在抖音内进行大量投放。张楠更是在朋友圈转发，称即梦刚刚上线，还有很多待优化的地方。

音乐生成方面，海绵音乐 APP 则是字节的代表，这款产品是字节在 AI 赛道上试错的一个典型案例。海绵音乐的前身是 2022 年 2 月的海绵乐队 APP。Tech 星球了解到，这是字节内部的一款创业项目，但这款产品诞生之初并不是奔着 AI 而去，而是服务于汽水音乐和抖音上对音乐编辑有所需求的用户。

到了2022年底，随着国内AI浪潮出现后，海绵乐队才开始转向 AI 领域，并加入 AI 作曲能力，但此时的创作能力很一般，“因为此时的字节，并没有成体系的音乐生成大模型，海绵乐队只能靠自己去摸索”，一位曾在海绵乐队工作的员工向 Tech 星球表示。

2023 年 6 月推出了新版本，主打哼唱成曲和伴奏制作，虽然在 AI 能力上仍不出众，但对接下来的试错和更新提供了经验。随着豆包音乐生成模型的出现，才让海绵乐队有了一战之力，最终在今年 7 月，更名为海绵音乐，主攻 AI 音乐创作赛道。目前，已经开始在各渠道进行投放推广。

需要注意的是，字节的 AI 产品在这两条赛道上的发展并不是独立，而是相互竞争。豆包、即梦在近期也开始推出音乐生成服务，逐步渗透到 AI 音乐赛道，“竞争是无可避免的，谁都想成为爆款 AI 产品，谁都想成为或继续保持在内部的核心位置，这无疑需要 AI 产品更加具有综合体验”，即梦的一位运营告诉 Tech 星球。

左手视频，右手音乐

据七麦数据显示，字节视频生成 APP即梦自今年 8 月上线以来，在 iOS 端的摄影与录像（免费）榜单的排名逐渐上升，两个月时间，已经稳定在前 40 的名次，安卓端，近 30 天日均下载量，为 22978 次。