开源化、多元化、商业化，谷歌杠上了大模型

HelloKitty • 2024-08-09 16:59

扫一扫在手机阅读、分享本文

1736

本文由 DoNews 撰写/授权提供，转载请注明原出处。

文章来源于：DoNews

作者：曹双涛

编辑：杨博丞

在日前谷歌举办的 2024 年 I/O Connect China 谷歌开发者大会上，AI 大模型多元化成为市场关注的焦点。

围绕 APP 软件开发，谷歌推出三种不同规格的 Gemini 模型。谷歌方面称，Gemini Nano 是最高效的模型，适合处理设备端任务。

据悉，Gemini 1.5 Flash 是谷歌迄今为止最快、最经济的模型，适合处理高容量任务。面对所有开发者开放的 Gemini 1.5 Pro，支持 200 万 token 上下文窗口。为减少算力消耗，Gemini 1.5 Pro 和 1.5 Flash 均已上线上下文缓存功能。

考虑到开发者可能需要更大的灵活性和掌控力，谷歌推出 Gemini 姊妹大模型 Gemma。新发布的 Gemma2 相较于 Gemma，新增 90 亿和 270 亿参数两种规格。其中，270 亿参数版本经过优化，同时支持 Google Cloud 上的单个英伟达 GPU 以及 Vertex AI 单个 TPU 运行。

目前 Gemini 相关大模型已集成到 Android Studio、Chrome DevTools、Project IDX、Colab、VS Code、IntelliJ 和 Firebase 等开发工具中，可帮助开发者编写、调试、测试代码、生成文档、理解代码库等。

以 Flutter 为例，小米 SU7 配套应用就是基于 Flutter 所打造。在原有 Flutter 基础上，谷歌推出 Flutter 3.24 和 Dart 3.5。新版最大看点是“Flutter GPU”新 API 的早期预览版。如通过内置 Flutter SDK，开发者可使用 Dart 代码访问 GPU，进而提高图像渲染能力。

为方便开发者使用，谷歌推出多个 Package。如 Flutter_Scene 可将 3D 项目直接导入，进而提高游戏体验。

此外，谷歌也推出 Android Studio ON IDX 早期预览版，和原有 Android Studi 不同的是其支持在浏览器中完全运行。为保证借助 AI 构建应用的可靠性、合规性和安全性。谷歌推出包括如 Firebase AI Monitoring 信息中心、Checks AI Safety 等开发组件。

在 AI 大模型开源席卷全球下，谷歌推出开源大模型项目 Project Oscar。但初始阶段，Project Oscar 仅支持 93000 条代码提交以及 2000 名开发者 Go 编程语言项目。

围绕 Web 网站开发，随着 Web GPU、WASM 和 Gemini 内置到 Chrome 中，谷歌全新推出的 Speculation Rules API 可做到搜索即时导航，摆脱冗长页面加载。面向单页应用推出的 View Transitions API，可提高页面过渡体验。二者结合，进而保证页面过渡的无缝衔接。

为保证 Web 开发者开发效率，谷歌顺势推出试和优化应用 Chrome DevTools，其在开发者网站出现问题时会发出警告和错误提示。该应用已内置到 Gemini 中。

围绕下一代安卓原生应用开发，谷歌推出多款新产品。设备端 AI 模型 Gemini Nano 和系统服务 AI Core；用于业务逻辑共享代码，适用于移动端、Web、服务器和桌面平台的 Kotlin Multi Platform；并为 DataStore、Room 和 ViewModel 等多个 Jetpack 库添加 Kotlin Multi platform 支持。

测试平台 Android Device Streaming，则联合小米、OPPO、一加、三星等手机厂商，方便开发者进行终端测试，现处于 Beta 阶段。Gemini in Android Studio 纳入 Android Studio 稳定版，新增代码生成和代码转换功能，以及AI隐私设置控制数据分享功能。

围绕云业务，谷歌提出的云端新旅程具有五大特点：一是云上开发新范式，新推出的 Vertex AI 功能可实现上下文缓存和接地功能。二是自成体系的灵活扩展，新推出 150 多种模型，包括 Gemini 系列、Gemma 开源模型、Anthropic Claude 模型、Meta Llama 模型和 Hugging Face 模型库。

三是打破壁垒的跨云之旅，新推出的优化 PostgreSQL 数据库和 BigQuery Omni 功能，支持跨云互联和联合查询以及多“云”协同。四是轻松实现强大功能，新推出的自动化与智能默认设置，搭建全套云基础设施只需 45 分钟，包括网络、身份验证和日志记录等。

五是 AI 智能助力，新推出的 Gemini Code AssistIDE 插件，提供代码生成、补全、解释和测试生成功能。Gemini in Databases 则提供 SQL 生成和数据库操作智能化。

围绕开发者发布多款大模型，无疑彰显谷歌想要加速推进大模型商业化的决心。但目前谷歌的 AI 能力，尤其是输出和检索能力可能仍需提高。

今年 6 月份海外用户在询问谷歌“制作披萨使用多少胶水”问题时，谷歌 AI 搜索给出的答案为：据 Business insider2024 年 5 月的相关显示文章，谷歌 Al 搜索结果建议在披萨酱中加入 1/8 杯，即 2 汤匙，白色无毒的胶水，以防止奶酪滑落。

文章作者 KatieNotopoulos 表示，胶水没有明显改变酱汁的稠度，而披萨呈现出诱人的橙色。海外媒体 The Verge 验证后发现，该截图并非伪造。因披萨中不能加入任何胶水，该答案也引发海外用户对谷歌 AI 检索能力的质疑。