开源化、多元化、商业化,谷歌杠上了大模型

HelloKitty 2024-08-09 16:59

扫一扫 在手机阅读、分享本文

942

本文由 DoNews 撰写/授权提供,转载请注明原出处。

文章来源于:DoNews

作者:曹双涛

编辑:杨博丞

在日前谷歌举办的 2024 年 I/O Connect China 谷歌开发者大会上,AI 大模型多元化成为市场关注的焦点。

围绕 APP 软件开发,谷歌推出三种不同规格的 Gemini 模型。谷歌方面称,Gemini Nano 是最高效的模型,适合处理设备端任务。

据悉,Gemini 1.5 Flash 是谷歌迄今为止最快、最经济的模型,适合处理高容量任务。面对所有开发者开放的 Gemini 1.5 Pro,支持 200 万 token 上下文窗口。为减少算力消耗,Gemini 1.5 Pro 和 1.5 Flash 均已上线上下文缓存功能。

考虑到开发者可能需要更大的灵活性和掌控力,谷歌推出 Gemini 姊妹大模型 Gemma。新发布的 Gemma2 相较于 Gemma,新增 90 亿和 270 亿参数两种规格。其中,270 亿参数版本经过优化,同时支持 Google Cloud 上的单个英伟达 GPU 以及 Vertex AI 单个 TPU 运行。

目前 Gemini 相关大模型已集成到 Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ 和 Firebase 等开发工具中,可帮助开发者编写、调试、测试代码、生成文档、理解代码库等。

以 Flutter 为例,小米 SU7 配套应用就是基于 Flutter 所打造。在原有 Flutter 基础上,谷歌推出 Flutter 3.24 和 Dart 3.5。新版最大看点是“Flutter GPU”新 API 的早期预览版。如通过内置 Flutter SDK,开发者可使用 Dart 代码访问 GPU,进而提高图像渲染能力。

为方便开发者使用,谷歌推出多个 Package。如 Flutter_Scene 可将 3D 项目直接导入,进而提高游戏体验。

此外,谷歌也推出 Android Studio ON IDX 早期预览版,和原有 Android Studi 不同的是其支持在浏览器中完全运行。为保证借助 AI 构建应用的可靠性、合规性和安全性。谷歌推出包括如 Firebase AI Monitoring 信息中心、Checks AI Safety 等开发组件。

在 AI 大模型开源席卷全球下,谷歌推出开源大模型项目 Project Oscar。但初始阶段,Project Oscar 仅支持 93000 条代码提交以及 2000 名开发者 Go 编程语言项目。

围绕 Web 网站开发,随着 Web GPU、WASM 和 Gemini 内置到 Chrome 中,谷歌全新推出的 Speculation Rules API 可做到搜索即时导航,摆脱冗长页面加载。面向单页应用推出的 View Transitions API,可提高页面过渡体验。二者结合,进而保证页面过渡的无缝衔接。

为保证 Web 开发者开发效率,谷歌顺势推出试和优化应用 Chrome DevTools,其在开发者网站出现问题时会发出警告和错误提示。该应用已内置到 Gemini 中。

围绕下一代安卓原生应用开发,谷歌推出多款新产品。设备端 AI 模型 Gemini Nano 和系统服务 AI Core;用于业务逻辑共享代码,适用于移动端、Web、服务器和桌面平台的 Kotlin Multi Platform;并为 DataStore、Room 和 ViewModel 等多个 Jetpack 库添加 Kotlin Multi platform 支持。

测试平台 Android Device Streaming,则联合小米、OPPO、一加、三星等手机厂商,方便开发者进行终端测试,现处于 Beta 阶段。Gemini in Android Studio 纳入 Android Studio 稳定版,新增代码生成和代码转换功能,以及AI隐私设置控制数据分享功能。

围绕云业务,谷歌提出的云端新旅程具有五大特点:一是云上开发新范式,新推出的 Vertex AI 功能可实现上下文缓存和接地功能。二是自成体系的灵活扩展,新推出 150 多种模型,包括 Gemini 系列、Gemma 开源模型、Anthropic Claude 模型、Meta Llama 模型和 Hugging Face 模型库。

三是打破壁垒的跨云之旅,新推出的优化 PostgreSQL 数据库和 BigQuery Omni 功能,支持跨云互联和联合查询以及多“云”协同。四是轻松实现强大功能,新推出的自动化与智能默认设置,搭建全套云基础设施只需 45 分钟,包括网络、身份验证和日志记录等。

五是 AI 智能助力,新推出的 Gemini Code AssistIDE 插件,提供代码生成、补全、解释和测试生成功能。Gemini in Databases 则提供 SQL 生成和数据库操作智能化。

围绕开发者发布多款大模型,无疑彰显谷歌想要加速推进大模型商业化的决心。但目前谷歌的 AI 能力,尤其是输出和检索能力可能仍需提高。

今年 6 月份海外用户在询问谷歌“制作披萨使用多少胶水”问题时,谷歌 AI 搜索给出的答案为:据 Business insider2024 年 5 月的相关显示文章,谷歌 Al 搜索结果建议在披萨酱中加入 1/8  杯,即 2 汤匙,白色无毒的胶水,以防止奶酪滑落。

文章作者 KatieNotopoulos 表示,胶水没有明显改变酱汁的稠度,而披萨呈现出诱人的橙色。海外媒体 The Verge 验证后发现,该截图并非伪造。因披萨中不能加入任何胶水,该答案也引发海外用户对谷歌 AI 检索能力的质疑。

1.png

图源:The Verge

2.png

图源:The Verge

我们在对 Gemini 实测过程中发现,一方面 Gemini 文生图能力已被关闭,且 Gemini 暂时也不支持文生视频。另一方面,Gemini 的逻辑推理、数学计算能力仍需提高。

3.png

图源:Gemini官网

我们将 2024 年高考数学真题给到 Gemini 且特意强调是多选题,三道题目正确答案分别为(BD)(ACD)(ABC),但 Gemini 给出的答案分别是(AC)(AD)(AB),虽说第 10 题和第 11 题 Gemini 的***括正确选项,但第 9 题却全部是错误选项。

4.png

图源:2024年高考数学真题

5.png

图源:Gemini官网

此外,随着谷歌大模型日益增多,正面临数据中心电力消耗产生的二氧化碳排放迅速增加的棘手问题。

谷歌相关环境报告指出,2023 年仅谷歌数据中心电力消耗就增长 17%,由电力消耗所产生的二氧化碳污染较 2022 年同期增长 13% 至 1430 万吨,大致相当于 38 家燃气发电厂每年可能排放的二氧化碳量。

不仅仅是谷歌,Microsoft2023 财年的温室气体排放量比 2020 年高出约 30%。对于未来如何降低碳排放,谷歌相关报告指出,随着我们进一步将人工智能集成到我们的产品中,由于人工智能计算强度的增加导致的能源需求增加,以及与我们的技术基础设施投资预期增加相关的排放,减少排放可能具有挑战性。

按照当前 AI 大模型发展速度,未来对电力需求或将成倍增长。作为全球拥有最多数据中心的美国,引发当地民众对人工智能压倒电网的电力需求急剧上升的担忧,并可能使煤炭和天然气工厂的存在时间比其他方式更长。

商业化、输出质量稳定化、减碳化等各种问题的存在,即使对于谷歌这样的全球大厂短期内也难言轻松。

微信图片_20240802161354.png

微信图片_20240207151541.png

微信图片_20240313155219.jpg

微信图片_20230104175528.jpg

扫一扫 在手机阅读、分享本文

扫码关注公众号

获取更多技术资讯

客服微信
享受1V1专属服务
免费领取技术福利
发送名片申请入群
与CTO聊合作
(备注姓名、公司及职位)
热门文章