缓解字节 AI 焦虑的超级应用:剪映 or 豆包?

HelloKitty 2024-06-03 16:13

扫一扫 在手机阅读、分享本文

1085

本文由 新莓daybreak 撰写/授权提供,转载请注明原出处。

文章来源于:新莓daybreak

作者:李欢

编辑:翟文婷

张一鸣把抖音最重要的两个人物,都放在 AI 相关的核心位置。

今年 2 月,OpenAI 发布视频生成模型 Sora 过去 9 天后,张楠放下抖音 CEO 的位置,聚焦剪映。看上去这是一个舍大取小的举动,甚至有被流放之嫌。事实是,和陈林当初负责教育业务一样,张楠在为字节攻克新高地。

一位剪映内部人士告诉新莓 daybreak,其实张楠一直在负责剪映,只是现在全人力投入,在组织架构层面做出了不小的调整,包括精简组织,高管调动。

差不多三个月后,朱骏现身豆包大模型发布会。他跟张楠的轨迹类似,都是创立的公司被字节收购,本人加入,而且俩人都是抖音和 TikTok 崛起的关键人物,现在又都投身大模型。朱骏现在是字节 AI 主力部门Flow的产品线负责人。

其实今年 4 月份,字节还晋升了一位重要人物朱文佳,他曾担任过今日头条 CEO,现在直接向 CEO 梁汝波汇报,常年 base 在新加坡。朱文佳领导的 AI 团队在内部被称为「Seed」,社交平台曝出来的组织架构中,他还是 Flow 的业务负责人。

一目了然。字节正在把曾经「打赢过硬仗」的核心高管,以重火力的形式布局在 AI。

张一鸣应该很早就预感到这场生产力变革的冲击波。

AI 生成视频的探测早已开始,作为全球短视频最大平台,字节最具危机意识。梁汝波在内部信中警觉所有人,「AI 技术对于内容创作会有很大的颠覆,甚至会产生新的创作平台」。

字节可能不是反应最早的,但现在看来是押注最多的。

字节需要自己的 Sora。也许这是从 0 起步的新产品,比如新推出的「即梦」;也可能是快速响应趋势,给出理想解决方案的剪映。

但是,假如 AI 生成视频新的创作平台不是出自字节……这会是个麻烦,而且是大麻烦。

「Sora 杀死剪映」是流量时代的吸睛说法,却可能讲出了一些人的期望。那些摩拳擦掌的大模型公司,觊觎这样的视频发布入口,静静等待形势剧变的机会,一击而中。

抖音与剪映深度绑定

理解字节 AI 变革的承载是在剪映,需要先厘清剪映与抖音之间的关系。

国内中短视频平台都有自己的视频编辑工具。抖音对应的是剪映,快手推出快影,微信有秒剪,B 站则是必剪。

这些剪辑工具基本功能大同小异,如果是出于运营一个账号的动机和想法,这些低门槛、傻瓜式工具足矣。专业级选手在编辑大制作的时候,也许会需要 PR 或是 Final cut。

为什么各家平台都要推出自己的剪辑工具?这有降低视频创作门槛的动机,贡献灵感,增加普通用户的「投稿率」,最重要的是跟各个平台运营机制有强关联性。

比如必剪的内容素材,各方面会更贴近适配 B 站社区用户的喜好。最近大火的猫 meme 就是典型例证。

对剪映而言,它存在的意义和价值,也是更多服务抖音的内容生态。

晚点 LatePost 援引一位字节跳动人士曾说,没有剪映,抖音里的作品更多地会偏向 PGC (专业机构生产的内容),剪映提升了用户创作的视频的整体质量,让 UGC (用户生产的内容) 更统一、美观。

剪映天生具备 AIGC 的场景优势,尤其特效功能,跟抖音内容生态运营深度绑定。

前不久抖音遍地「掉入莫奈花园」的特效视频,本质上就是 AI 创作的一种。剪映底部 tab「剪同款」一键操作产生类似效果,大大降低普通用户创作视频的门槛,全民效仿,海量同款视频充斥抖音,形成爆款效应。

抖音特效团队前研发负责人王国晖在作客潘乱播客时解释,字节内部,很长一段时把特效叫做道具。这种创作工具是抖音、TikTok 的重要抓手,帮助普通人克服心理障碍,放松表达自己,此外特效也具备更强的跟拍和示范效应,而抖音是很强调跟拍心智的。

与此同时,字节有强大的团队支撑,做精细化运营。在一些重大节日关键节点,涉及到用户增长需求的时候,产品和运营团队会前置参与到特效功能的设计,吸引用户参与创作,增加投稿率,更多人被看见,被激发,参与跟拍,以此形成正循环。

但是假如,这个 AI 特效不是出自剪映,而是其他创作平台呢?并且这样的事情一而再再而三的发生呢?

后果是,抖音就会失去视频创作入口。久而久之,更是可能失去发布入口。

这个路径字节太熟悉了。TikTok 在海外起步的时候,在众多创作者眼中,就是一款好用的编辑视频软件。活跃在 Instagram 的网红,一开始被 TikTok 眼花缭乱又傻瓜式的特效吸引,先是剪辑编辑完成,上传到 Ins 或 Youtube,后来慢慢就留存在 TikTok。

字节能做到,理论上其他人也能做到。大模型狂飙,Sora 横空出世,这个变数就大大增加了。

一位剪映内部人士告诉新莓 daybreak,「公司从战略层面肯定重视,而且不仅限于 AI 一键成片,包括 AI 处理素材、AI 提效编辑这类功能也在发力。」他的观点是,毕竟距离 AI 一键生成的实际落地还有很长路要走,就像 GPT 也没从根本层面改变文字工作者的从业现状。

火山引擎 CEO 谭待在接受媒体采访时,针对字节在文生视频领域是否有布局实现弯道超车的问题时回答,「没有弯道超车,模型训练要一步步技术扎实,如果基础都做不好,那文生图就是一个『人工智障』——因为它连文字都不能理解,视频能好到哪儿去?」

张楠的新使命

张巧是一家媒体视频业务的负责人,有一天他们准备发布一个新闻热点的分析视频,但是负责配音的同事临时有事,没法及时响应。

她有留意到剪映之前推出过一些 AI 功能,尝试找一下解决办法。确实有款「克隆音色」的功能,只要真人输入几段话,AI 就能仿真输出。她试了一下,只要把速度调快,效果似乎不错,气口不如真人自然,但比预期要好。

但是在她把成片分享给同事后,大部分人反馈,没有什么情感,AI 味道还是很重。最后只好放弃。

张巧告诉新莓 daybreak,「最后那位同事花了一个多小时才录好,文稿不是她写的,需要时间熟悉。AI 生成就很快,文字丢进去就好,我看重的就是效率。」

她甚至期望更早使用 AI 生成视频,现在她团队内人工剪辑一条 2 分钟的视频要耗费 4 个小时,还不算前期素材收集整理,单人一天最多剪辑两条。限制产出的核心因素就在人工。

张楠必然了解这些创作者的心理。在全身心投入剪映之前,她曾花几个月时间做大量用户访谈,听到了期待和不满的声音。带着历史包袱的剪映,转型压力更大。

这个 2019 年由字节收购公司脸萌团队做出的产品,已经是国内用户规模最大的视频编辑工具。虽然各个中短视频平台都有自己的剪辑工具,但剪映的使用率最高。最后一次公开数据显示,2021 年剪映月活为 1 亿。

与 TikTok 相匹配的 CapCut,上线近 4 年,调研机构 data.ai 的报告显示,2023 年 1 月,这款产品的月活超过了 2 亿,一度超越 Instagram 和 YouTube 成为美国下载次数最多的免费 App。

林洋日常制作的短视频,会投放到淘宝的短视频专区——逛逛,也会发布在抖音和 B 站。刚开始,他会使用 pr,后来改用剪映,因为效率高。他告诉新莓 daybreak,「如果对短视频质量要求不高,更看重数量,剪映很适合,每天能有产出 10 个左右」。

甚至新媒体从业者也在广泛使用这款编辑工具。张巧说,她熟悉的一些官媒朋友都在使用剪映。

梁汝波在字节内部信中对张楠的描述是,她从 0 到 1 推出了抖音、剪映等备受用户喜欢的产品。是的,从一开始张楠就是剪映的核心领导人物。而且据说,剪映从立项到上线,只花了三个月时间。抖音对剪映用户的快速增长,也做出了巨大贡献。

2019 年,字节在收购 FaceU 的基础上,建立了影像中台,包括相机特效中台等。有段时间这是张楠关注的重心之一。剪映就是从影像中台演化出来的一个独立业务。郭列曾经的副手刘佳彬做过影像中台的负责人。

后来,这个中台孵化出包括剪映的轻颜、醒图等产品和业务,他们与抖音、TikTok、西瓜视频、今日头条等字节系生态深度绑定。

张楠重掌剪映,剪映对于字节的重要性又拔高了一个层次。在张楠职务变动的正式消息公布前后,一些变化已经显现。

2023 年年底,剪映开始测试一个名为「Dreamina」的文成图 AIGC 工具。5 月 9 日,这款产品被更名为「即梦」,功能不再局限于文生图。

目前来看,字节并未对这款产品过多曝光,产品也只有网页版,并未出现在手机应用商店。

新莓 daybreak 登录网页版试用后发现,这款产品有图片生视频和文本生视频两个功能。最长可生成 6 秒的短视频。我们输入一段文字,产出一段 3 秒的视频大概所需 2-3 分钟,但视频显示的人物细节还与 Sora 差距较大。

除此之外,剪映也在做着 AI 主题的各种小动作——智能字幕、文字成片、视频翻译、音色克隆等功能。

这是对外用户感知到的变化。对内她更是雷厉风行的做出诸多调整。

精简组织的同时,人员调整,北京和深圳的团队往来频繁。有媒体引用一位剪映员工的表述,过去一年,他的直系领导更换了 5 个,负责的业务也不断调整。张楠注重战略工作,也关注竞争对手的动态,要求团队「甚至比竞争对手自己还要了解产品」,包括但不限于核心功能、盈利点以及具体到某月某日发生的更新等。

字节赶场 AGI 竞赛

剪映不是字节的唯一一张牌。前不久豆包大模型发布会,超过 2600 万月活跃用户的应用豆包,也可能承载文生视频的使命。

朱骏在现场讲解,如果你是一个自媒体的从业者,可以在豆包桌面版本上点击「文案创作」这个「AI 技能按钮」,选择「抖音文案」,然后填入主题「介绍建筑师安藤忠雄」,一个分镜头的抖音视频脚本就生成好了。

按照官方讲述,豆包 Pro 模型能广泛应用在问答、总结、创作、对话、分类等诸多场景。我们理解为,视频创作应该不会被排除在外。这分明就是内部赛马的节奏。

现场谭待披露,过去一年,字节内部 50 多个业务开始大量使用豆包大模型嫁接 AI,包括抖音、头条、番茄小说等。不过在他的对外讲述中,这个名单没有提及剪映。

实际上,字节这个成绩单似乎交得有点晚。

今日头条是国内最早的人工智能信息分发平台,字节熟稔于算法、智能分发。但在去年,GPT 爆发,公司高层批评对此敏感度不够,AI 由此被提升至字节战略高点。

梁汝波在年初内部会议上反思,公司层面直到 2023 年才开始讨论 GPT,而业内做得比较好的大模型创业公司,都是在 2018 年至 2021 年创立的。

张一鸣也释放出很多高度关注 ChatGPT 的信息。

去年 4 月,他在公开信中表示,「字节跳动无法错过 AGI。如同任何中国互联网公司都无法错过 AGI。AGI 可以解决组织的第二曲线增长困境。」公开信发布后的一个月,《中国企业家》杂志报道,张一鸣正在废寝忘食地研读 OpenAI 的系列论文。

早年间,字节在 AI 上倾注了大量心血,2016 年成立的 AI Lab,聚焦于自然语言处理、机器学习、数据挖掘等方面的研究。遗憾的是,AI lab 并未坚持到最后,大概四年后核心人员离职,研究也放缓了脚步。

直到 2023 年 ChatGPT 问世,字节开始全力追赶 AI。当年 2 月,字节部署了代号为「Seed」的团队,专注于模型层,由朱文佳带队。年底,又正式组建了一个新的 AI 部门——Flow 部门,专注于 AI 大模型的应用研发层。字节产品与战略副总裁朱骏和字节技术副总裁洪定坤,二人分别负责部门的产品线和技术线。

到了今年,字节还在不断抽调体系内优秀高管人才至 Flow 部门。3 月,有消息称,飞书产品副总裁齐俊元也调至 Flow 部门,主要负责豆包的 PC 端业务。

最近,凤凰网科技采访到豆包的产品人士提到,今年以来,字节的 AI 业务,尤其是 Flow,可以说是整个字节内部强度最大的部门,「基本上都是单休,但有几个产品的数据表现还不错,特别是豆包,内部士气正旺」。

这一轮 AGI 竞赛,字节虽然也在基础大模型、面向开发者的中间连接层有产品响应,但外界更关注,或者决定字节命脉的还在于应用层。

去年中旬,字节在海内外分别推出豆包和 Cici 两款 AI 对话产品。数据显示,目前豆包/Cici 的全球总 DAU 在 300 万左右。今年 4 月,Flow 部门又上线了一款名为「星绘」的 AI 相机类 APP,在国外也有一款功能相似的 APP「Picpic」上线。

受益于豆包模型的剪映正在加速 AI 转型。比如,在视频内容的智能分析、自动标注、剪辑建议等方面,豆包大模型的算法能力可以极大提升剪映的智能化水平;又或者,在视频编辑过程中,豆包大模型可以提供智能剪辑、自动配乐、特效生成等功能,帮助用户更高效地完成视频创作。

在所有字节系产品中,剪映被视为是字节当下最有希望承接AI大模型落地的产品。

界面新闻曾报道一位知情人士分析称,剪映是一个视频创作工具,处于内容创作的上游,往 AI 方向走即文生视频。此外,剪映创作的视频内容有抖音承接,创作者后续使用字节系的文生视频、多模态数字人产品创作内容,都有较大的想象空间。

文生视频的挑战是颠覆性的,即使手握生态、数据和用户,对于挑战,字节仍需做足准备。

(应采访对象要求,文中林洋,张巧为化名)

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章