HelloKitty • 2024-05-13 16:58
1409
本文由 量子位 撰写/授权提供,转载请注明原出处。
文章来源于:新智元
作者:新智元编辑部
新一轮 AI 大战,即将拉开序幕!
下周一,OpenAI 将开启线上直播,官宣 GPT-4 升级,甚至还有一个超级「AI 助手」等着我们。
OpenAI「音频 AGI 研究负责人」Alexis Conneau 已更换主页背景,并与奥特曼同频——下周我们将会见证 Magic。
OpenAI 研究科学家 Bowen Cheng 甚至表示,这可比 GPT-5 酷多了。
这些种种,暗示着真正的「Her」即将登场。
顶着 OpenAI 的压力,谷歌将在第二天的 I/O 大会上公布模型新进展,据传还将发布一个名为「Pixie」个人数字助理,由 Gemini 加持。
紧接着,微软将在 21 日召开 Build 开发者大会,大概率将 OpenAI 最新能力集成到自家产品线中,甚至可能会透露最新 5000 亿参数自研大模型 MAI-1。
还有万众期待的苹果 WWDC 大会,将发布集成生成式 AI 能力的 iOS 18 系统,并把 ChatGPT 塞进 iPhone 之中。
一系列重磅发布,连番轰炸,简直不给其他公司喘气的机会。
有网友问道,「苹果是在放弃自己的『AJAX』人工智能系统,全力与 OpenAI 公司合作?还是直到他们的 AI 能力赶上之前,OpenAI 只是权宜之计」?
苹果内幕人 Gurman 总结了苹果的人工智能战略:
- 设备端LLM(自研)
- 云端LLM(自研)
- 聊天机器人(可能是 OpenAI,也可能是谷歌)
苹果不打算自己开发聊天机器人,但意识到市场对此有需求,因此会从外部获取这项技术。这一策略与其在搜索领域的做法相似。
显然,现在的局面是,OpenAI 与微软、甚至苹果通过 AI 合作捆绑在一起,只剩下谷歌自己单打独斗。
不知,这波 AI 争霸之战,谁胜谁负?
ChatGPT 可以通话,周一直播再爆料
全网的焦点,还是在 OpenAI。
「他们将会发布什么」,这一话题热度只增不减,鲜有人讨论谷歌 I/O 大会。
关于周一的发布预测,网友 Ananay 又有了一个新发现:
ChatGPT 或将具备具备通话能力
其实可以从如下代码中,打电话、拒接等关键词中,可以看出这一功能。
另外,OpenAI 已经部署了 webRTC 服务器来实现这一功能,这些服务器最近也进行了配置。
起初,网友还以为,这是 OpenAI 部署 WebRTC 服务器可能是为了纯语音模式,而现在看来,并非如此。
因为,这个功能是由 Livekit 提供的。(这是一个可以提供实时音视频通信的解决方案)
下面网友评论道,这是不是意味着,ChatGPT 能够主动给我打电话,而不需要我先发起呼叫?
他提出这一问题,是因为在电影 Her 中,人工智能助手 Samantha 主动给男主人公打了电话,告知他一些事情。
想象一下,ChatGPT 助手主动给你打电话,提醒或查看用户习惯,将是多么神奇的一件事。
不过,Ananay 表示,这需要用户自己选择允许这一功能。
Hallid.ai 的联合创始人 indigo 也做了一个全面的预测/趋势猜想。
根据 indigo 的介绍,GPT-4 的新版应该会按照参数规模不同,分化成多个版本。
昨天,就有网友猜测,可能会有 gpt4-lite、gpt4-auto、gpt4-lite-auto 的版本发布。
而几天前出现在 LMSYS 竞技场上的 gpt2-chatbot,可能是轻量级的 GPT-4 新版。而且,这意味着,GPT-3.5 的使命要结束了,最新轻量版本可能会免费用,同时 API 价格大降。
至于,奥特曼所说的「魔法」,可能就是升级后的 GPT-4——gpt4-auto,具备自主执行 Agent 任务的能力,记忆更强,规划能力更强。
当然,「AI 助手」也将 Her 带入现实。
来源:indigo
昨天,OpenAI 视频生成研究科学家 Will Depue 发了一张奇点降临的 logo,或许又在暗示着什么。
谷歌打擂台,或推出 AI 助手 Pixie
在这个与 OpenAI 和微软对飙的关键时刻,谷歌明确表示,这场大会发布的内容都是关于 AI 的。
根据谷歌官网,本年度的 I/O 大会将在美东时间 5 月 14 日下午 1 点召开。
据猜测,谷歌将在搜索引擎中融合生成式 AI,让用户可以进行对话式搜索。
此外,谷歌也一直在测试新的搜索功能,比如针对英语学习者的 AI 对话练习,以及在购物时生成虚拟试穿图像。
不仅仅是搜索引擎,更多的谷歌应用也会更深入地集成 AI 功能,比如在 Google Maps 中帮用户找到合适的餐厅、购物中心和电动汽车充电站。
打客服电话时转接太久怎么办?
谷歌测试的 AI 新功能甚至可以帮你自动等待转接,直到有人接听再来通知你。
除了各种应用,操作系统也不能落下。
上个月 Android 15 的开发者预览已经发布,谷歌将在 I/O 大会上进一步介绍其中的新功能,可能会加入更深度的 Gemini 集成。
目前在安卓系统中,生成式 AI 的功能主要由 Gemini Nano 驱动,用在各种软件功能中。
比如 Magice Compose 可以在 Google Messages 等应用程序中提供回复建议,Cinematic Wallpaper 利用机器学习帮助用户定制屏幕壁纸。
可以想象一下,有 AI 进一步参与的安卓会带来哪些更个性化的用户体验?比如,更智能的手机主屏幕、锁屏界面和通知栏?
去年的 I/O 大会上我们看到了与 ChatGPT 竞争的大语言模型 Gemini,今年是否会有新的模型出现呢?
除了 Gemini 的新版本,或许也可以期待一下谷歌推出的图像和视频大模型。
Reddit 上有网友爆料,称谷歌存货中有 3 个模型已经在测试但还未向公众发布,估计会在 2024 I/O 大会亮相。
这三个模型分别是图像生成模型 Imagen 3,以及两个可以对图像进行优化、补全的模型 Juno 和 Miro。
据说,Miro 还会有视频生成的功能。
此外,谷歌可能会在今年 I/O 上发布新版本的 AI 助手「Pixie」,或许可以取代原有的同类产品 Google Assistant。
Pixie 由语言模型 Gemini 驱动,安装在谷歌自己开发的硬件设备 Pixel 上,对其他第三方设备是否开放我们尚未可知。
但本次 I/O 大会上我们应该不会看到更新版本的 Pixel 产品,谷歌已经在近期发布了新版本 Pixel 8a,而且已经开放给用户预定购买。
网上流出的新版本Pixel 9外观
预计,Pixel 9 与折叠款 Pixel 9 Pro Fold 预计将在今年秋季发布。
苹果紧抓救命稻草
与此同时,面对 OpenAI 和谷歌来势汹汹的 AI 语音助手冲击,网友们向苹果喊话:
留给苹果的时间不多了!
虽然已有消息称 OpenAI 与苹果即将敲定一项合作协议,让 ChatGPT 能够装进 iPhone 中,并为今年的 iOS 系统提供全新的生成式 AI 能力。
但苹果并不准备放弃自家的 Siri。
近日,纽约时代报道,苹果将对 Siri 进行升级重组,以应对其他聊天机器人竞争对手。
而这一决定早已做下。
2023 年年初,苹果高管 Craig Federighi 和 John Giannandrea 花费数周时间测试了风头一时无两的 OpenAI 新聊天机器人 ChatGPT 后,就深感危机。
他们认为生成式人工智能的出现让 Siri 显得过时、落后。
Siri 作为苹果 2011 年推出、每部 iPhone 中最初的虚拟助手,一直以来都仅限于满足个人请求,不能跟上用户发起的对话。
例如,有人先询问了旧金山的天气然后说:「纽约怎么样?」时,Siri 经常会误解用户的提问。
但 ChatGPT 知道用户想要的是后一个问题的回答。
在意识到新技术已经超越 Siri 之后,这家科技巨头发起了十多年来最重大的重组。
苹果公司决心在科技行业的人工智能竞赛中迎头赶上,它将生成式人工智能作为公司内部的特殊标杆项目,围绕着十年一遇的计划来组织员工。
Siri 超进化
据苹果的三名内部人士透露,苹果将于今年 6 月 10 日的年度开发者大会上发布改进后的 Siri。
新版本中的基础技术包含新的生成式人工智能,将允许 Siri 与用户进行聊天而不是一次回答一个问题。
并且使 Siri 的对话性更强、用途更广。
Siri 的更新是苹果公司在全面拥抱生成式 AI 领域处于领先地位的举措之一。
为了支持其新的 Siri 功能,还在今年的 iPhone 中增加了内存。
此外,苹果还讨论了与包括 Google、Cohere 和 OpenAI 在内的几家公司合作,以获得支持聊天机器人的 AI 模型使用权的可能性。
另一方面,苹果的高管也在担心新兴的 AI 技术将作为未来主要的操作系统取代 iOS,威胁苹果在全球智能手机市场的主导地位。
并且,这项新技术还可能促成一个以 AI 应用(AI 智能体)为核心的生态系统。
这可能会削弱苹果的 App Store,该商店每年的销售额约为 240 亿美元。
但苹果更担心的是,如果不能开发出自己的 AI 系统,iPhone 将会在与其他先进技术的比较中可能变成「哑巴手机」,失去市场。
iPhone 目前占据了全球智能手机利润的 85% 份额,并创造了超过 2000 亿美元的销售额。
可以预想这个损失是不可估量的,也是苹果不能接受的。
在这种危机的紧迫感促使下,苹果取消了另一项重大的投资——
一个耗资 100 亿美元的自动驾驶汽车项目,并调派数百名工程师转向 AI 的开发工作。
并且,苹果还将延续一贯的设备流程工具上的一致性,探索创建由 iPhone 和 Mac 处理器驱动的服务器。
内部人士的爆料里,苹果对 Siri 的升级并不在于让它与 ChatGPT 竞争诗歌创作等内容生成的部分,而是让 Siri 专注于处理它原有的任务:
包括设置闹钟、创建日历备忘提醒、添加购物清单中的物品,以及总结短信内容。
苹果计划宣称升级后的 Siri 将比竞对公司的人工智能提供更加私密的服务,成本更划算。
因为Siri是在iPhone上处理请求,这避免了数据在云端的泄露以及云计算的成本。
但是,苹果公司也面临着安装在iPhone上的小型人工智能系统的风险:
研究发现,较小的人工智能系统可能比较大的系统更容易出现幻觉。
Siri联合创始人Tom Gruber表示:
「Siri的目标始终是创建一个能理解语言和上下文的对话界面,但这是个难题。
随着技术的变革,我们应该能做得更好。只要不试图用同一种方法解决所有问题,就能避免很多困难。」
苹果在人工智能领域拥有多项优势,包括在全球超过 20 亿台在使用的设备,领先的半导体团队等。
它们能够支持苹果推广 AI 产品,并支持包括面部识别在内需要大量芯片的 AI 任务。
一个月时间,苹果能否扭转局势
但在过去的十年里,苹果从未制定出一个全面的人工智能战略,Siri 自推出以来也没有大的升级改进。
同时,作为语音助手的局限性也减弱了公司智能音箱 HomePod 的吸引力,因为它无法稳定完成一些简单的任务,比如响应歌曲播放请求。
曾在 Siri 团队工作两年后,创立了生成式人工智能平台 Brighten.ai 的 John Burkey 表示:
「Siri 团队创立以来,未能获得过与苹果内其他团队同等的关注和资源。
而苹果的不同部门,往往各自独立,信息共享有限。
但事实是 AI 需要被整合到产品中,才能取得成功。」
另外,苹果在招募和留住领先人工智能人才方面也有着相当的阻力。
由于苹果的保密性,研究成果发表论文、参加会议的都很少,这对于科学家来说几乎是不可忍受的弊端。
最近几个月来,苹果略微调整了一贯的战略,增加了人工智能论文发表的数量,但业内的研究人员仍质疑论文的质量,认为它们是苹果的营销炒作手段。
但对一些初出茅庐且野心勃勃的研究人员来说,加入苹果能够成为项目的领导成员,是他们选择苹果的重要原因。
尽管苹果已调整了发展战略,并吸收了不少新鲜血液。
但在这场声势浩大、令人眼花缭乱的AI语音助手之战中,苹果能否在 6 月的开发者大会上逆转劣势尚未可知。
未来的 AI 语音助手形态如何,又会怎样影响我们的生活?
这个问题的答案正在不断接近我们。
*插播一条消息:在全球化的时代浪潮中,AI+跨境电商正迎来前所未有的发展机遇,为了让不同领域的企业聚集在一起,展示在AI跨境电商领域的服务和产品,促进行业内的信息流通和合作机会,白鲸跨境与白鲸技术栈正在招募一群富有激情和创造力的伙伴,共同绘制AI+跨境电商的生态图谱!如有感兴趣者,可点击下方链接进行报名。
AI+跨境电商图谱招募令报名链接:https://www.baijing.cn/activity/1636
扫码关注公众号
获取更多技术资讯