OpenAI谷歌苹果再燃AI争霸战,谁将担纲「Her」时代王者?

zhaoling 2024-05-13 16:58

扫一扫 在手机阅读、分享本文

1062

本文由 量子位 撰写/授权提供,转载请注明原出处。

文章来源于:新智元

作者:新智元编辑部

新一轮 AI 大战,即将拉开序幕!

1.png

下周一,OpenAI 将开启线上直播,官宣 GPT-4 升级,甚至还有一个超级「AI 助手」等着我们。

OpenAI「音频 AGI 研究负责人」Alexis Conneau 已更换主页背景,并与奥特曼同频——下周我们将会见证 Magic。

2.png

OpenAI 研究科学家 Bowen Cheng 甚至表示,这可比 GPT-5 酷多了。

3.png

这些种种,暗示着真正的「Her」即将登场。

4.png

顶着 OpenAI 的压力,谷歌将在第二天的 I/O 大会上公布模型新进展,据传还将发布一个名为「Pixie」个人数字助理,由 Gemini 加持。

5.png

紧接着,微软将在 21 日召开 Build 开发者大会,大概率将 OpenAI 最新能力集成到自家产品线中,甚至可能会透露最新 5000 亿参数自研大模型 MAI-1。

还有万众期待的苹果 WWDC 大会,将发布集成生成式 AI 能力的 iOS 18 系统,并把 ChatGPT 塞进 iPhone 之中。

6.png

一系列重磅发布,连番轰炸,简直不给其他公司喘气的机会。

有网友问道,「苹果是在放弃自己的『AJAX』人工智能系统,全力与 OpenAI 公司合作?还是直到他们的 AI 能力赶上之前,OpenAI 只是权宜之计」?

苹果内幕人 Gurman 总结了苹果的人工智能战略:

- 设备端LLM(自研)

- 云端LLM(自研)

- 聊天机器人(可能是 OpenAI,也可能是谷歌)

苹果不打算自己开发聊天机器人,但意识到市场对此有需求,因此会从外部获取这项技术。这一策略与其在搜索领域的做法相似。

7.png

显然,现在的局面是,OpenAI 与微软、甚至苹果通过 AI 合作捆绑在一起,只剩下谷歌自己单打独斗。

不知,这波 AI 争霸之战,谁胜谁负?

ChatGPT 可以通话,周一直播再爆料

全网的焦点,还是在 OpenAI。

「他们将会发布什么」,这一话题热度只增不减,鲜有人讨论谷歌 I/O 大会。

关于周一的发布预测,网友 Ananay 又有了一个新发现:

ChatGPT 或将具备具备通话能力

其实可以从如下代码中,打电话、拒接等关键词中,可以看出这一功能。

8.png

另外,OpenAI 已经部署了 webRTC 服务器来实现这一功能,这些服务器最近也进行了配置。

9.png

10.png

起初,网友还以为,这是 OpenAI 部署 WebRTC 服务器可能是为了纯语音模式,而现在看来,并非如此。

11.png

因为,这个功能是由 Livekit 提供的。(这是一个可以提供实时音视频通信的解决方案)

12.png

下面网友评论道,这是不是意味着,ChatGPT 能够主动给我打电话,而不需要我先发起呼叫?

他提出这一问题,是因为在电影 Her 中,人工智能助手 Samantha 主动给男主人公打了电话,告知他一些事情。

13.png

想象一下,ChatGPT 助手主动给你打电话,提醒或查看用户习惯,将是多么神奇的一件事。

不过,Ananay 表示,这需要用户自己选择允许这一功能。

14.png

Hallid.ai 的联合创始人 indigo 也做了一个全面的预测/趋势猜想。

根据 indigo 的介绍,GPT-4 的新版应该会按照参数规模不同,分化成多个版本。

昨天,就有网友猜测,可能会有 gpt4-lite、gpt4-auto、gpt4-lite-auto 的版本发布。

15.png

而几天前出现在 LMSYS 竞技场上的 gpt2-chatbot,可能是轻量级的 GPT-4 新版。而且,这意味着,GPT-3.5 的使命要结束了,最新轻量版本可能会免费用,同时 API 价格大降。

至于,奥特曼所说的「魔法」,可能就是升级后的 GPT-4——gpt4-auto,具备自主执行 Agent 任务的能力,记忆更强,规划能力更强。

当然,「AI 助手」也将 Her 带入现实。

16.png

17.png

来源:indigo

昨天,OpenAI 视频生成研究科学家 Will Depue 发了一张奇点降临的 logo,或许又在暗示着什么。

18.png

谷歌打擂台,或推出 AI 助手 Pixie

在这个与 OpenAI 和微软对飙的关键时刻,谷歌明确表示,这场大会发布的内容都是关于 AI 的。

19.png

根据谷歌官网,本年度的 I/O 大会将在美东时间 5 月 14 日下午 1 点召开。

20.png

21.gif

据猜测,谷歌将在搜索引擎中融合生成式 AI,让用户可以进行对话式搜索。

此外,谷歌也一直在测试新的搜索功能,比如针对英语学习者的 AI 对话练习,以及在购物时生成虚拟试穿图像。

不仅仅是搜索引擎,更多的谷歌应用也会更深入地集成 AI 功能,比如在 Google Maps 中帮用户找到合适的餐厅、购物中心和电动汽车充电站。

打客服电话时转接太久怎么办?

谷歌测试的 AI 新功能甚至可以帮你自动等待转接,直到有人接听再来通知你。

除了各种应用,操作系统也不能落下。

上个月 Android 15 的开发者预览已经发布,谷歌将在 I/O 大会上进一步介绍其中的新功能,可能会加入更深度的 Gemini 集成。

目前在安卓系统中,生成式 AI 的功能主要由 Gemini Nano 驱动,用在各种软件功能中。

22.png

比如 Magice Compose 可以在 Google Messages 等应用程序中提供回复建议,Cinematic Wallpaper 利用机器学习帮助用户定制屏幕壁纸。

可以想象一下,有 AI 进一步参与的安卓会带来哪些更个性化的用户体验?比如,更智能的手机主屏幕、锁屏界面和通知栏?

去年的 I/O 大会上我们看到了与 ChatGPT 竞争的大语言模型 Gemini,今年是否会有新的模型出现呢?

除了 Gemini 的新版本,或许也可以期待一下谷歌推出的图像和视频大模型。

Reddit 上有网友爆料,称谷歌存货中有 3 个模型已经在测试但还未向公众发布,估计会在 2024 I/O 大会亮相。

23.png

这三个模型分别是图像生成模型 Imagen 3,以及两个可以对图像进行优化、补全的模型 Juno 和 Miro。

据说,Miro 还会有视频生成的功能。

24.gif

此外,谷歌可能会在今年 I/O 上发布新版本的 AI 助手「Pixie」,或许可以取代原有的同类产品 Google Assistant。

Pixie 由语言模型 Gemini 驱动,安装在谷歌自己开发的硬件设备 Pixel 上,对其他第三方设备是否开放我们尚未可知。

但本次 I/O 大会上我们应该不会看到更新版本的 Pixel 产品,谷歌已经在近期发布了新版本 Pixel 8a,而且已经开放给用户预定购买。

25.png

网上流出的新版本Pixel 9外观

预计,Pixel 9 与折叠款 Pixel 9 Pro Fold 预计将在今年秋季发布。

苹果紧抓救命稻草

与此同时,面对 OpenAI 和谷歌来势汹汹的 AI 语音助手冲击,网友们向苹果喊话:

留给苹果的时间不多了!

虽然已有消息称 OpenAI 与苹果即将敲定一项合作协议,让 ChatGPT 能够装进 iPhone 中,并为今年的 iOS 系统提供全新的生成式 AI 能力。

但苹果并不准备放弃自家的 Siri。

近日,纽约时代报道,苹果将对 Siri 进行升级重组,以应对其他聊天机器人竞争对手。

26.png

而这一决定早已做下。

2023 年年初,苹果高管 Craig Federighi 和 John Giannandrea 花费数周时间测试了风头一时无两的 OpenAI 新聊天机器人 ChatGPT 后,就深感危机。

他们认为生成式人工智能的出现让 Siri 显得过时、落后。

27.png

Siri 作为苹果 2011 年推出、每部 iPhone 中最初的虚拟助手,一直以来都仅限于满足个人请求,不能跟上用户发起的对话。

例如,有人先询问了旧金山的天气然后说:「纽约怎么样?」时,Siri  经常会误解用户的提问。

但 ChatGPT 知道用户想要的是后一个问题的回答。

在意识到新技术已经超越 Siri 之后,这家科技巨头发起了十多年来最重大的重组。

28.png

苹果公司决心在科技行业的人工智能竞赛中迎头赶上,它将生成式人工智能作为公司内部的特殊标杆项目,围绕着十年一遇的计划来组织员工。

Siri 超进化

据苹果的三名内部人士透露,苹果将于今年 6 月 10 日的年度开发者大会上发布改进后的 Siri。

新版本中的基础技术包含新的生成式人工智能,将允许 Siri 与用户进行聊天而不是一次回答一个问题。

并且使 Siri 的对话性更强、用途更广。

Siri 的更新是苹果公司在全面拥抱生成式 AI 领域处于领先地位的举措之一。

为了支持其新的 Siri 功能,还在今年的 iPhone 中增加了内存。

29.png

此外,苹果还讨论了与包括 Google、Cohere 和 OpenAI 在内的几家公司合作,以获得支持聊天机器人的 AI 模型使用权的可能性。

另一方面,苹果的高管也在担心新兴的 AI 技术将作为未来主要的操作系统取代 iOS,威胁苹果在全球智能手机市场的主导地位。

并且,这项新技术还可能促成一个以 AI 应用(AI 智能体)为核心的生态系统。

这可能会削弱苹果的 App Store,该商店每年的销售额约为 240 亿美元。

但苹果更担心的是,如果不能开发出自己的 AI 系统,iPhone 将会在与其他先进技术的比较中可能变成「哑巴手机」,失去市场。

iPhone 目前占据了全球智能手机利润的 85% 份额,并创造了超过 2000 亿美元的销售额。

可以预想这个损失是不可估量的,也是苹果不能接受的。

在这种危机的紧迫感促使下,苹果取消了另一项重大的投资——

一个耗资 100 亿美元的自动驾驶汽车项目,并调派数百名工程师转向 AI 的开发工作。

并且,苹果还将延续一贯的设备流程工具上的一致性,探索创建由 iPhone 和 Mac 处理器驱动的服务器。

30.png

内部人士的爆料里,苹果对 Siri 的升级并不在于让它与 ChatGPT 竞争诗歌创作等内容生成的部分,而是让 Siri 专注于处理它原有的任务:

包括设置闹钟、创建日历备忘提醒、添加购物清单中的物品,以及总结短信内容。

苹果计划宣称升级后的 Siri 将比竞对公司的人工智能提供更加私密的服务,成本更划算。

因为Siri是在iPhone上处理请求,这避免了数据在云端的泄露以及云计算的成本。

但是,苹果公司也面临着安装在iPhone上的小型人工智能系统的风险:

研究发现,较小的人工智能系统可能比较大的系统更容易出现幻觉。

Siri联合创始人Tom Gruber表示:

「Siri的目标始终是创建一个能理解语言和上下文的对话界面,但这是个难题。

随着技术的变革,我们应该能做得更好。只要不试图用同一种方法解决所有问题,就能避免很多困难。」

苹果在人工智能领域拥有多项优势,包括在全球超过 20 亿台在使用的设备,领先的半导体团队等。

它们能够支持苹果推广 AI 产品,并支持包括面部识别在内需要大量芯片的 AI 任务。

一个月时间,苹果能否扭转局势

但在过去的十年里,苹果从未制定出一个全面的人工智能战略,Siri 自推出以来也没有大的升级改进。

同时,作为语音助手的局限性也减弱了公司智能音箱 HomePod 的吸引力,因为它无法稳定完成一些简单的任务,比如响应歌曲播放请求。

曾在 Siri 团队工作两年后,创立了生成式人工智能平台 Brighten.ai 的 John Burkey 表示:

「Siri 团队创立以来,未能获得过与苹果内其他团队同等的关注和资源。

而苹果的不同部门,往往各自独立,信息共享有限。

但事实是 AI 需要被整合到产品中,才能取得成功。」

31.png

另外,苹果在招募和留住领先人工智能人才方面也有着相当的阻力。

由于苹果的保密性,研究成果发表论文、参加会议的都很少,这对于科学家来说几乎是不可忍受的弊端。

最近几个月来,苹果略微调整了一贯的战略,增加了人工智能论文发表的数量,但业内的研究人员仍质疑论文的质量,认为它们是苹果的营销炒作手段。

但对一些初出茅庐且野心勃勃的研究人员来说,加入苹果能够成为项目的领导成员,是他们选择苹果的重要原因。

尽管苹果已调整了发展战略,并吸收了不少新鲜血液。

但在这场声势浩大、令人眼花缭乱的AI语音助手之战中,苹果能否在 6 月的开发者大会上逆转劣势尚未可知。

未来的 AI 语音助手形态如何,又会怎样影响我们的生活?

这个问题的答案正在不断接近我们。

*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。

AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636

微信图片_20240222160346.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章