HelloKitty • 2023-02-03 17:43
1781
本文由 白鲸技术栈 撰写/授权提供,转载请注明原出处。
回顾「生成式 AI」的发展历程,包括文字、影音在内等多种内容,AI 都可以做得比人更好,而当生成式 AI 产出可以大量、快速、客製化创作优质内容,人类的价值何在?又该如何「换位子」呢?
2022 年末,网路上最受讨论的,是一隻聊天机器人—「ChatGPT」。由美国人工智慧研究机构「OpenAI」发表,短短两週内吸引了上百万人使用。专家认为「ChatGPT」的出现,跟智慧型手机、网际网路的出现一样,将根深蒂固地改变人类的工作和生活。
「ChatGPT」的「生成式AI」(Generative AI)技术,让任何人都可以用简单的自然对话(而非程式语言),指挥 AI 创作各种内容。
什么是「生成式 AI」?如何爆红?目前有哪些应用?而人类在 AI 创作时代如何「另谋高就」?
「生成式AI」(Generative AI)的发展历程
生成式 AI(Generative AI),是指让「机器学习模型」研究类似作品的数据,然后去创造一个全新的作品,可以是文字、图像、音讯档、影片、程式码、甚至建筑设计。
过去七年,Google、Meta 等科技巨头、以及微软投资的 OpenAI,都在打造Generative AI 的「语言模型」(Language Model)。这三家先驱者用大量电脑运算能力和数据「训练」这些「语言模型」,让它们能自己创作内容。训练过程,可分成三个阶段:
A. 萌芽期(2015 年之前):
只有小型模型。这些模型在「数据分析」上表现出色,如预测外送抵达时间、诈骗讯息分类……等。但在模仿人类语言的「内容创作」上并不及格,无法像真人一般写作、写程式、画图。
B. 突破期(2015 年至 2022 年):
2017 年,Google Research 发表「Transformer模型」,是自然语言运算(Natural Language Processing, NLP)领域的里程碑。Transformer 模型需要被训练的时间比以往少,产出的品质却大幅提高,并且容易针对各应用领域的需求客製化。(详细可参考维基百科之介绍)
如 Google 开发出 BERT、LaMDA。Meta 开发的 OPT-175B、BlenderBot。微软投资的 OpenAI 开发出 GPT-3(用于文字)、DALL-E2(用于绘图)、Whisper(用于语音辨识)。
Photo Credit: GettyImages
为什么都是富可敌国的大公司?因为训练这些模型的成本很高。
例如,GPT-3 最初在 45TB 的数据上进行训练、运用了高达 1750 亿个参数来预测结果,单次训练就要 1200 万美元。中国的悟道预训练模型,则使用了 1.75 兆个参数进行训练,动员了清华大学、北京大学、中国科学院等机构的资源。
2015 年到 2020 年之间,训练这些模型的计算量增加了六个数量级,使得这些模型能够以近乎、甚至超越人类的水平,来执行任务。
只不过在这个阶段,这些模型并未进入大众视野。因为他们需要庞大资源才能运转,成本也还没降低到可以供大众在云端使用。
C. 业界落地期(2022年~):
随着电脑运算成本降低、新技术如扩散模型(Diffusion Model)出现,训练和营运行逐渐降低。Google 等公司陆续公开这些模型,让开发者可以试用。
当核心的生成模型被训练出来后,不用太大量的数据,就可依据各领域进行客製化调整。于是 Google 开发的 BERT 便有专注生医领域的模型BioBERT、法律领域的模型Legal-BERT。这让很多专业人士也开始试用。
然后在 2022 年,生成式AI在一般大众之间爆红。
文字影音等多种内容,AI 都可以做得比人更好
2022 年,生成式 AI 出现了杀手级应用,让一般大众开始使用。如绘图领域的Midjourney、Stable Diffusion、DALL·E2,以及聊天机器人 ChatGPT。
同时,先驱者公开它们的语言模型(如OpenAI开放GPT-3),让新创公司省掉耗费金钱和时间的训练阶段,直接在各专业领域推出应用产品。
这些新创涵盖的範围,不仅是透过文字生成文字、图片、声音、程式、音乐、影像、3D、NFT,甚至可以反向操作,用语音生成文字(如逐字稿应用)、图片生成图片(如快速去背、图像编辑)、连结生成文字(如快速撷取 url 网页内文产出脚本)、影片生成影片(如从会议影片快速生成部落格文章、推特推文、精彩花絮......等等)。这裡有网友整理出的生成式 AI 的各类型应用。
以商机庞大的行销产业为例,生成式AI的商业应用潜力已经相当惊人。
从部落格文章撰写、SEO 优化、影片编辑、社群行销文案产生、广告素材生成……等,全部有AI可帮你代劳。各赛道都塞满竞争者:
(以下只列出部分)
行销工作 | 新创公司 |
部落格文章点子产生器 | Hubspot Blog Ideas Generator, Portent Idea Generator |
部落格文章、社群贴文、email文案、SEO优化内容产生器 | Jasper, Writesonic, TextCortex |
文字生成广告素材图片 | Memorable |
文字生成行销影片 | Synthesia, Movio |
(文字生成行銷文案公司Jasper的使用情境)
(文字生成行销影片公司 Synthesia 的使用情境)
从点子发想,到实际撰写内容、拍摄图片、拍摄影片,如今生成各式各样的行销素材,都可以坐在电脑前面一键完成。不需抓耳挠腮、肠枯思竭,也不必为了打光跑进跑出,NG 重来数遍。
美国已有许多公司开始採用这类的 AI 工具。如云端运算大厂 VMWare 的内容行销人员,就运用 Japser 产出行销邮件内容、广告文案、社群内容。当 AI 已经可以执行大部分的写作任务时,写手就可以专注于寻找更好的写作题材、研究内容方向、制定内容策略方向。这种跟 AI 玩「大风吹,换位子」的现象,已经在大企业发生。
另外,如摩根士丹利(Morgan Stanley)银行也透过 GPT-3,来为客户创造客製化金融内容。由真人用特定字眼来「提示」(prompt)AI,然后由 AI 创造初稿,然后再由真人来编辑、审稿,
行销领域,只是生成式 AI 应用的冰山一角。根据美国知名创投公司——红杉资本(Sequoia Capital)的分析,生成式 AI 也可用于自动创作程式语言、艺术作品、游戏、产品设计等。
AI 百花齐放,人类何去何从?大风吹之后,还有我们的位子吗?
AI 创作时代,人类如何「换位子」?
当生成式 AI 产出可以大量、快速、客製化创作优质内容,人类的价值何在?
几个趋势已经注定「回不去」了:
1. AI 将成为多数「功能性」内容撰写的主力:这类内容有明确架构、重复性高,目的在于传递讯息、提供清晰、必要的说明
不需传达个人风格、品牌、形象。不需感性或阐释。例如促销讯息、折扣码说明、产品说明书、社群贴文、教育训练影片、广告企划案、研究报告、白皮书、业务企划书、说明书,
这些内容都可以透过 AI 工具快速做出草稿,微调后即可发送。也就是说,行销、业务、营运、客服都能透过 AI 节省大量人力。换句话说,在这领域,AI 最容易取代人类的价值。
2. 把 AI 当手,人类当脑
内容人才的价值已经不在于「写」,而在于捕捉市场趋势、时事动态、客户心态,制定最符合当下时空背景的内容策略。目前的 AI 虽然能高效产出内容,但还无法分析受关注的时事议题、市场趋势,找出可切入的内容策略。
另外,AI 也还无法同理、模拟客户的心理,也不能推测客户可能会想看的文章。AI 也还无法统整公司内部的资料库,从中挖掘有价值的主题产製成内容。进入 AI 创作时代,人类的最大胜算是换位子当大脑,把手的工作都让给 AI。
3.洞悉观赏者的情绪与需求,才能在新的内容混战中杀出血路
生成式AI加速了内容产製,会让内容更为氾滥。乱军中,能吸引到眼球的内容,有可能在于内容更紧贴时事、更迎合观赏者的心理状态,更能贴近社会上瀰漫的各种情绪,或更具备个人独特的风格与特色。
生成式 AI 还在以凶猛的态势发展——2022 年爆红,2023 年将预计将多点开花。生成式 AI 的「军火供应商」——OpenAI,因 ChatGPT 一夕爆红。据传将得到微软新一轮高达 100 亿美元的融资,让公司估值高达的 290 亿美元。微软看好无数的第三方公司将可透过 OpenAI 的 API 打造全新应用服务,用 AI 改变商业运作流程。
AI 创作引领的新时代就在眼前。或许我们害怕的是,这一切都才刚开始而已
扫码关注公众号
获取更多技术资讯