免费的GPT-4o足够强,但治不好OpenAI的产品焦虑

HelloKitty 2024-05-16 17:10

扫一扫 在手机阅读、分享本文

1362

本文由 甲子光年 撰写/授权提供,转载请注明原出处。

文章来源于:甲子光年

作者:刘杨楠

5 月 14 日凌晨 1 点,继 OpenAI 在 AI 搜索上“虚晃一枪”之后,让萨姆·奥尔特曼(Sam Altman)感觉“像魔术一样”的新模型终于浮出水面。

不是 GPT-5,不是 AI 搜索,而是最新旗舰生成式 AI 模型 GPT-4o!

GPT-4o(“o”代表“omni”,意为“全能的”)是迈向更自然的人机交互的一步——它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。

整场发布会时长仅 30 分钟,OpenAI CTO 米拉·穆拉蒂(Mira Murati)带来主题演讲。“这是我们第一次在易用性方面真正迈出一大步。”穆拉蒂在公司旧金山总部的现场演示中说道, “这种互动变得更加自然,也更加容易。”

值得注意的是,此次发布会 OpenAI CEO 萨姆·奥尔特曼并未现身。在 OpenAI 官网披露的 GPT-4o 贡献者中,依然没有看到 OpenAI 首席科学家伊利亚·苏茨克维尔(Ilya Sutskever)的身影。

“GPT-4o 是我们最好的模型”

整场发布会的主角,就是 OpenAI 最新旗舰生成式 AI 模型 GPT-4o。

OpenAI 官网博客显示,GPT-4o(“o”代表“omni”)是迈向更自然的人机交互的一步。它接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像的任意组合输出。

相比今年 2 月的 Sora, OpenAI 此次发布显得更有诚意——GPT-4o 将免费提供给所有用户使用,Plus 用户则可以享受到5倍的调用额度。

穆拉蒂表示,GPT-4o 将提供与 GPT-4 同等水平的智能。

同时,GPT-4o 的运行速度大大提升,最大亮点在于其语音交互模式采用了全新技术,让聊天机器人对话的响应速度大幅提升。OpenAI 官网博客显示,GPT-4o 在谈话中对音频输入的平均响应时间为 320 毫秒,最短的响应时间为 232 毫秒,与人类的响应时间相似。

GPT-4o 还有超高的“语言天赋”,能支持 50 种语言,并显着提高了非英语语言的性能,包括改进分词器以更好地压缩其中的许多语言:

1.png

根据传统基准测试,GPT-4o 在文本、推理和编码智能方面实现了 GPT-4 Turbo 级别的性能,同时在多语言、音频和视觉功能上设置了新的高水位线。

开发人员现在可以在 API 中访问 GPT-4o。与 GPT-4 Turbo 相比,GPT-4o 速度提高 2 倍,价格降低一半,速率限制提高 5 倍。

在现场演示环节,GPT-4o 更是展现了各类花式操作——它能根据演示者的实时要求变换语音语调,演绎话剧;能实时读图;甚至还跟演示者们开起玩笑,唱起歌。

此外,OpenAI 还发布了桌面版的 ChatGPT 和新的用户界面。

用户可以向 ChatGPT(由 GPT-4o 提供支持)提出问题,并在 ChatGPT 回答时打断它。OpenA I表示,该模型提供“实时”响应能力,甚至可以感知用户声音中的情感,从而生成“一系列不同情感风格”的声音(包括唱歌)。

GPT-4o 还升级了 ChatGPT 的视觉能力。给定一张照片或一个桌面屏幕,GPT-4o 可以快速回答相关问题,主题范围包括“此软件代码中发生了什么?”到“这个人穿什么牌子的衬衫?”

“我们认识到这些模型正变得越来越复杂,” 穆拉蒂说道,“但我们希望用户与人工智能模型的交互体验能够更加自然、轻松,让用户可以将注意力完全集中在与模型的协作上,而无需在意界面本身。”

穆拉蒂还透露,未来几周内,GPT-4o 将分阶段集成至 OpenAI 的各个产品之中,而且会在 ChatGPT Plus 中推出新版语音模式 GPT-4o 的 alpha 版。

OpenAI 研究员威廉·费达斯(William Fedus)表示:“GPT-4o 是我们最先进的新前沿模型。我们一直在 LMSys arena 上测试一个版本 im-also-a-good-gpt2-chatbot。”

2.png

“这不仅是世界上最好的模型,而且可以在 ChatGPT 中免费使用,这对于前沿模型来说是前所未有的。”费达斯补充道,“我们发现在更难的提示集上——特别是编码——存在更大的差距:GPT-4o 比我们之前的最佳模型实现了 +100 ELO。”

3.png

奥尔特曼也在 X 上表示:“GPT-4o 是我们最好的模型。”

4.png

OpenAI 此次发布几乎在想尽办法“讨好”用户,在“交互体验”上下足了功夫,直接免费开放使用更让用户感受到了 OpenAI 的诚意。

但「甲子光年」发现,在这种诚意背后,这家已被捧上神坛的 AI 创业公司,正深陷于某种焦虑之中。

OpenAI 的产品焦虑

虽然奥尔特曼今天并未到场,但 5 月 11 日,他便亲自下场预告。可是,翻翻评论区,网友们的关注点似乎有点儿跑偏。

有人喊话奥尔特曼让 OpenAI 首席科学家伊利亚回归:

5.png

6.png

有人关心 GPT-5 到底何时发布:

7.png

伊利亚的去向和 GPT-5 的发布是 OpenAI 留给外界的两大谜题,也是外界最关心的两大问题。

2024 年,人们对 OpenAI 最大的期待便是 GPT-5。然而,每当奥尔特曼在访谈中被问及 GPT-5 相关进度时,却总是支支吾吾、讳莫如深。奥尔特曼在普罗大众心中的画像也逐渐从一位开天辟地的怪力少年,转变为一个在各国政客间长袖善舞,在各种场合大打太极的“成熟企业家”。

更致命的是,ChatGPT 和 GPT-4 之后,OpenAI 似乎一直没能推出相同重量级的 AI 产品,这些都在不断消磨外界对 OpenAI 的期待与信心。

今年 2 月,OpenAI 发布 Sora——1 份技术报告、32 篇引用论文、一些画面堪比电影镜头的 demo 和 1 个故作高深的“世界模拟器”概念就是 OpenAI 给出的全部,没有技术论文,也没有可公开体验的产品入口。

「甲子光年」曾向多位 AI 从业者提问:“ChatGPT 和 Sora,谁带给你的震撼更大?”各位受访人几乎不约而同地回答:“Sora 有震撼,但没 ChatGPT 的震撼大。”

造成这种感官差异的直接原因是,ChatGPT 能直接体验,但 Sora 不能。虽然 ChatGPT 也会犯一些荒唐的错误,但真实的交流感带给人们的震撼,远远大于只可远观、不能上手体验的 Sora。甚至不少声音开始猜测,Sora 精美的 Demo 或许是工程师在背后屡次微调的结果,Sora 实时交互的结果“可能远不如此”。

对于外界的猜测、质疑,OpenAI 并未回应,而是迅速扔出下一个“靶子”——AI 搜索。

过去一周,外媒不断有消息传出 OpenAI 将推出 AI 搜索产品,更有媒体猜测,谷歌一年一度的 I/O 大会即将于 5 月 14 日举办,而 OpenAI 此举是针对谷歌的精准狙击。

8.png

OpenAI Search 测试界面,图片来源:赛博禅心

不过,AI 搜索的热度炒了半天,所谓的 AI 搜索产品最终只是虚晃一枪。

昆仑万维董事长兼 CEO 方汉近期在一次直播中直言:“我觉得搜索引擎对于 OpenAI 的用户增长也不会有根本性的变化。”有数据显示,从去年 5 月开始,ChatGPT 的 C 端增长便逐渐触顶。

而产品焦虑一日不解,OpenAI 距离“伟大的公司”就永远有一墙之隔。

GPT-4o 能治好吗?

今天再次复盘 ChatGPT 的成功会发现,这是一次不可复现的“无心插柳”。

2022 年中,OpenAI 开始训练 GPT-4。半年后的 11 月 30 日,OpenAI 发布 ChatGPT,全球各界都为之颤动。

OpenAI 内部曾对是否发布 ChatGPT 有过很长一段时间争论,因为谁都无法 100% 确认这是正确的事情。

彼时,OpenAI 对自己的定位是一家为开发人员和企业构建工具的公司,而非直接面向普罗大众。因此,OpenAI 要面临的核心挑战,是 ChatGPT 的使用门槛是否足够低,以至于能让完全不懂技术的人用起来。

在此之前发布的视觉模型 DaLL-E 已经让 OpenAI 尝到了甜头。但 ChatGPT 能复制 DALL-E 的成功吗?

奥尔特曼是名副其实的“冒险派”,他鼓励公司发布 ChatGPT,“尝试一下”。在他看来,用户和模型进行文本形式的交互会产生一些很重要的个性化结果。

很快,用户的热情证明,这次试验无比成功。从 2022 年 11 月上线的第一个完整月(2022 年 11 月)开始,到 12 月这一数字达到了 2.66 亿人次,月环比增长了近 75%。到 2023 年 1 月,总访问量翻了一番多,达到 6.16 亿人次,2 月就首次突破 10 亿人次大关。

这突如其来的成功,在 OpenAI 的意料之外。

“我们并没有认为 GPT-3 系列模型已经跨越了将其应用于消费者或企业的门槛,本以为 GPT-4 会成为第一个跨越这道门槛的模型,所以我们的很多计划和预测都是围绕 2023 年 3 月发布 GPT-4 来安排的。”OpenAI COO 布拉德·莱特凯普(Brad Lightcap)此前在英伟达 2024 GTC 大会上分享道。

按照莱特凯普的说法,OpenAI 用了 6 个月来适应 ChatGPT 的爆炸性增长,并确保公司有足够的 GPU 来满足用户的需求。

直到 2023 年后半年,OpenAI 开始感受到了来自行业一线的真实需求。OpenAI 曾公布,截止 2023 年 8 月,80% 的财富 500 强公司已采用 ChatGPT。80% 的统计数据是指拥有注册 ChatGPT 帐户的财富 500 强公司的百分比,由与企业电子邮件域关联的帐户确定。

于是,OpenAI 迅速行动。2023 年 8 月 28 日,OpenAI 推出 ChatGPT Enterprise,正式进军企业市场。它提供企业级安全和隐私、无限的高速 GPT-4 访问、用于处理更长输入的更长上下文窗口、高级数据分析功能、自定义选项等等。

这是一个很微妙的时间点——ChatGPT 流量见顶,开始走下坡路。

根据第三方网站 SimilarWeb 的监测数据,2023 年 6 月 ChatGPT 的网站与移动客户端的全球流量(PV)环比下降 9.7%,美国地区的流量环比下降 10.3%。同时,ChatGPT 的独立访客数量(UV)下降了 5.7%,访客在网站上花费的时间也下降了 8.5%。

这是自 2022 年 11 月 30 日发布以来,ChatGPT 首次出现流量负增长。其实,ChatGPT 增长放缓的势头在 2023 年 5 月已经出现端倪,5 月的增长率仅为 2.8%。

当时,一家 AI Lab 负责人告诉「甲子光年」,ChatGPT 流量下滑 10%,但真正的挑战不在这里。“大部分人都是带着体验的目的,看看 ChatGPT 到底有多强大才去注册的,包括我也是。但这不意味着我会天天用它。除了做一些简单的科普,或者给孩子写作文之外,大部分人日常其实也不太会用到。”这位 AI Lab 负责人说。

莱特凯普自己也在一次访谈中犀利点评 ChatGPT:“人们玩儿过一会儿后就认为它并不是真正的工具,而更像一个玩具。”

更严峻的是,ChatGPT 的烧钱速度同样出人意料。

当 OpenAI 的早期投资人埃隆·马斯克(Elon Musk)问到 ChatGPT 的成本时,奥尔特曼给到的数据是“每次对话的平均费用为几美分”。2023 年 4 月,国外一位分析师估算的数据则是每天的运营成本高达 70 万美元。

2023 年 2 月 1 日,OpenAI 开始商业化探索,推出付费版本的 ChatGPT Plus,定价每月 20 美元,提供的增值服务包括“高峰时段免排队、快速响应以及优先获得新功能”等。

如此看来,ChatGPT 虽然备受喜爱,但在商业层面,却算不上一个真正成功的产品。这些被 ChatGPT 烧掉的钱,就要用B端来填。

数据显示,截至 2023 年 11 月,已经有 92% 的 500 强企业以某种形式部署 ChatGPT。Block、Canva、Carlyle、雅诗兰黛、普华永道和 Zapier 均为 OpenAI 的早期客户。

C 端流量与 B 端客户量的此消彼长之间,OpenAI 也逐渐由一家伟大而光荣的非营利性 AGI 实验室,加速转变为一家“平庸”的商业公司——他们或许能赚到很多钱,却没有造出能够说服用户的产品。

直到今天,让奥尔特曼感到“像魔术一样”的 GPT-4o 面世。

只是 GPT-4o 真能治好 OpenAI 的产品焦虑吗?答案或许并不清晰。

从模型能力上来看,实时语音交互是 GPT-4o 在多模态方面最亮眼的进展。然而事实上,语音交互类产品并不新鲜。在可查阅的历史中,AI 语音交互类产品在商业化方面并没有太多成功的案例,苹果的 Siri 到今天都是一个十分鸡肋的功能。

而发布会上的 GPT-4o,看起来依然是一个“有趣的玩具”。

从“无心插柳”的 ChatGPT,到“只可远观”的 Sora、“虚晃一枪”的 SearchGPT,再到今天的 GPT-4o,都只是 OpenAI 向世界展示其 AI 能力的“半成品”,而并非一个真正能够说服用户的商业产品,这在某种程度上限制了 OpenAI 用户的增长。

当然,不可否认的是,从这次发布会的效果来看,GPT-4o 或许会成为又一个成功的PR案例,被写入 OpenAI 的历史。

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章