谷歌I/O的AI新叙事:从大模型到一站式服务,AI与XR终于会师!

HelloKitty 2025-05-22 10:54

扫一扫 在手机阅读、分享本文

395

本文由 智能Pro 撰写/授权提供,转载请注明原出处。

以下文章来源于:智能Pro

作者:失魂引

5 月 21 日凌晨,科技巨头谷歌召开了 I/O 2025 开发者大会,除了万众瞩目的 AI 功能,谷歌还公布了安卓 XR 平台和安卓 16 的新规划及部分新特性。

谷歌 CEO Sundar Pichai 表示,去年同期谷歌 AI 大模型和 API 每月处理 9.7 万亿个 Token,现在这一数字增长到了 480 万亿个,谷歌搜索业务的 AI 综述功能月活用户也达到了 15 亿人。

AI 正逐渐融入我们的生活,成为不可或缺的一部分。无论是谷歌推出的全新大模型和 AI 应用,还是 XR 平台和手机系统,都无法脱离 AI 的影响。

AI:从大模型变成一站式服务平台

作为谷歌 I/O 大会的绝对主角,AI 可谓重头戏,发布的新品也最多。此前已多次曝光的 Gemini 2.5 系列,于本场大会确认 6 月上线,其中 Gemini 2.5 Pro 号称世界上最智能的 AI 模型,新版本刷榜 LMArena,在 ELO 基准测试中拿到了 1448 分。

Gemini 2.5 Pro 新增深度思考版本,在 USAMO 2025、LiveCodeBench、MMMU 等多项测试中,Gemini 2.5 Pro 深度思考版本表现均领先 Gemini 2.5 Pro。Gemini 2.5 Flash 则属于轻量级模型,相较上一代效率提升了 22%,使用的 Token 可减少 20% 到 30%,资源消耗更少。

deep-think-chart.width-1000.format-webp.jpg

(图源:谷歌)

Gemini 2.5 系列模型新增的文本转语音能力,可以表现出极为丰富的细节,甚至窃窃私语,适合个人创作者为影视节目配音。

谷歌还带来了文本扩散模型 Gemini Diffusion,采用不同于文本预测的逐步优化噪声生成内容,在编程和数学领域表现更加出色。

基于 Gemini 2.5 系列模型的能力,谷歌 Project Mariner 也有望快速落地。该项目此前代号为 Jarvis,与美漫《钢铁侠》中的超级人工智能系统同名,是一个可以操作浏览器或其他软件的 AI 智能体,能够监督多达 10 个同时执行的任务,并且通过用户展示任务操作进行学习。

包括 Gemini 2.5 系列在内的谷歌最强 AI 功能和能力,也将通过 AI 搜索赋能到谷歌搜索。搜索引擎加入AI搜索并不稀奇,如国内互联网巨头百度的搜索引擎,也支持 AI 搜索功能,会将 AI 搜索生成的内容放在第一位。谷歌 AI 搜索将加入图表生成、票务查找,甚至展现视频、地图等信息,提供的内容更加丰富,相较传统搜索模式的优势也更大。

QQ截图20250521174315.png

(图源:谷歌)

可能是与 OpenAI 杠上的原因,谷歌也展示了智能购物功能,在购买衣物时,用户可上传个人照片,AI 会把商店里的衣服自动穿戴到照片中的人物身上,帮助用户更直观地了解衣服是否合身。

在多模态大模型 Gemini 2.5 系列之外,谷歌还发布了文生图模型 Imagen 4 和视频生成模型 Veo 3。Imagen 4 不仅生成图片的速度相较上一代快 3 到 10 倍,细节方面也更加丰富,能够生成织物、水滴、动物毛发等复杂物体,而且分辨率高达 2K,还可以制作贺卡、海报、漫画。

Veo 3 大幅提升了生成画面的质量,首次支持生成带有音频的视频。谷歌展示的视频显示,从物理模拟和口型对照,Veo 3 都表现出了惊人的效果。

集合视频生成模型 Veo、图像生成模型 Imagen、多模态模型 Gemini 于一体的应用 Flow,则是谷歌专为内容创作者打造的 AI 电影创作应用。据谷歌介绍,Flow 可以通过输入文字或导入素材创作视频,并通过 Gemini 对于自然语言的理解微调视频,能够将电影创作从专业场景变成任何人都可以轻易上手的工作。面向 B 端市场的 Flow,未来能力不断增强后,或许可以颠覆传统影视剧制作模式。

Flow.png

(图源:谷歌)

Flow 将率先向美国本土谷歌 AI Pro 和 AI Ultra 用户推送,后续面向全球用户推送。至于价格,AI Pro 每月 19.99 美元(当前约合人民币 144 元),AI Ultra 每月 249.99 美元(约合人民币 1801 元),站在国内消费者的角度上来看,AI Pro 和 AI Ultra 过于昂贵。

2022 年 GPT-3 引爆 AI 行业,至今已过去了大约两年半时间,AI 大模型的能力飞速提升。到今天,AI 行业已经进入「能力变现」的关键时期。本届 I/O 开发者大会上,谷歌发布了多款AI大模型,但主题并非强调 AI 大模型的能力,而是着重解读 AI 大模型的应用场景,目的或许在于将 AI 大模型进一步推向市场,增强 AI 业务的营收能力。

XR:构建统一生态,优化交互逻辑

谷歌与三星联手开发的安卓 XR 平台去年项目公布后,已获得了数百家软件开发商的支持。I/O 开发者大会上,基于该平台的首款 XR 设备——三星 Project Moohan 亮相。该产品类似苹果 Vision Pro,搭载骁龙 XR2 Plus Gen 2 芯片,无需连接 PC 或其他设备,能够独立运行,将于今年晚些时候发售。

基于安卓 XR 平台的第二款设备,是中国企业 Xreal 开发的 Project Aura,该产品也在 I/O 开发者大会上发布,是首款安卓 XR 平台的 AR 眼镜。这款产品搭载高通骁龙处理器,具体型号未知,支持光学透视(OST),也能提供虚拟透视(VST)的沉浸式体验。

这两款产品最值得关注的,是首个基于 Gemini 的安卓 XR 平台。谷歌表示,与 AI 深度融合的安卓 XR 平台,支持第一人称视角智能辅助和无接触辅助功能,用户可通过自然语言与设备交互,完成信息查询、日程管理、实时导航等操作。例如在 XR 设备之上,用户可以与 Gemini 谈论看到的一切现实世界或屏幕显示的内容。

Recommended_Header_Option_1.width-2200.format-webp.jpg

(图源:谷歌)

站在消费者的角度,XR 设备的主要问题在于应用生态少、交互不方便、续航时间短。

谷歌充分发挥了安卓平台积累的优势,与三星联手打造的安卓 XR 平台已获得数百家软件开发商支持,有望统一非苹果 XR 设备的系统生态。建立统一生态后,软件开发者无需为不同 XR 品牌单独开发和适配应用,能够降低成本,增加利润空间,更有为XR设备开发软件的积极性。

Gemini 的加入,进一步优化了 XR 设备的交互逻辑,对于自然语义理解能力的提升,令其能够实现「全场景可见即可说」。

软件层面可以解决的问题,谷歌都在尝试解决,功能更丰富的 XR 设备,有望一改销量下滑的趋势。但 XR 设备距离取代手机,成为下一代计算平台依然遥远,性能、续航等问题,仍待芯片和电池厂商解决。

安卓 16:

Live Updates 上线,谷歌效仿苹果?

在 AI 大模型和安卓 XR 平台、设备之外,谷歌还公布了 Wear OS 6 和安卓 16 的部分功能和特性。Wear OS 6 融合了 Material 3 Expressive 设计语言,更适合圆形屏幕,系统引入了动态色彩主题。谷歌推出了全新 API,帮助开发者设计表盘。不过 Wear OS 是闭源系统,厂商难以随意更改,国内消费者可选运的行 Wear OS 的产品不多。

安卓 16 在 I/O 开发者大会上公布的消息较少,主要围绕 Live Updates 功能。该功能与苹果的 Live Activities 相似,可以通过进度条的形式,显示导航、外卖配送、网约车状态等信息。

77094b36acaf2edddf7c04a62eeae1e63b0193fe.jpg

(图源:谷歌)

国内消费者对这些功能大概不陌生,OPPO、vivo、小米、荣耀等品牌的国产旗舰,已陆续加入了进度条显示部分 App 状态的功能。

在此前召开的 The Android Show 活动中,负责 Pixel 和安卓系统 UI 的谷歌产品管理总监 Allen Huang 确认,安卓 16 稳定版将于 6 月发布。或许是与 I/O 开发者大会时间相隔不长,此次谷歌没有透露太多安卓 16 的消息,国内消费者们还需要等待一段时间。

按照之前安卓 16 测试版披露的信息,安卓 16 将支持桌面模式,在安全性、UI、相机、稳定性、加载模式、大屏适配等方面均有所升级。

另外,谷歌在 I/O 大会上公布了为安卓手机打造的全能 AI 助手 Project Astra。Astra 能够根据使用场景和用户的要求,主动制定解决方案并采取行动。模拟屏幕点击和滑动操作的特性,表明其可能基于多模态 Gemini Nano 模型的视觉识别能力。

国内外主流手机厂商都在测试手机跨应用操作,国内厂商已经适配了部分应用,Astra 的方案可能无法做到一步到位和快速操作,但更具普适性,无需与应用一对一适配。

AI、XR 步入成熟期,但盈利依然困难

经过多年发展,AI、XR 行业正从成长期向成熟期迈进,产品更加注重实用性。本次 I/O 大会,谷歌发布的众多 AI 大模型,包括上文未提到的端侧多模态模型 Gemma 3n 和基于Gemma 3架构的开源医疗模型 MedGemma,均从实用角度出发,与搜索引擎、安卓 XR、安卓 16 深度融合。

IO25_Intro_Hero.width-2200.format-webp.jpg

(图源:谷歌)

不过 AI 和 XR 两大行业的头部企业,短时间内依然难以实现盈利。互联网大厂都在投入巨资建设数据中心,未来两三年投入大概率大于营收,但现阶段的亏损是为了打造体验更好的产品,与竞争对手一较高下,并赢得消费者的认可。

XR 行业的困境则在于,生态建设、续航和性能的提升需要时间。数百家软件开发商与谷歌合作,与手机行业数不清的软件开发商相比,还是太少了。即便有他们的支持,安卓 XR 平台也需要数年时间建设软件生态。续航的提升,要看新型电池技术的应用,性能的提升则仰赖高通和联发科等芯片厂商。

除了三星和 XREAL,Gentle Monster、Warby Parker 等眼镜品牌也将与谷歌合作,打造基于安卓 XR 的产品。入场企业越来越多,相信谷歌和开发者会加快构建 XR 生态的速度,满足更多消费者的需求,量产规模扩大并平摊研发成本后,XR 设备的价格可能也会下降。亏损多年的 XR 眼镜厂商,即便无法扭亏为盈,也将有机会收窄亏损幅度。

至于安卓 16 系统的具体功能,静待下个月的谷歌发布会吧。Project Astra 仅仅是首秀,虽然谷歌已经打磨了很长时间,但我们恐怕仍难以在安卓 16 上看到该功能,不必抱有太高期待。

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章