HelloKitty • 2025-10-22 14:33
319
本文由 硅星人Pro 撰写/授权提供,转载请注明原出处。
以下文章来源于:硅星人Pro
作者:周一笑
北京时间 10 月 22 日凌晨,没等来传闻中的 Gemini 3,等来了 OpenAI 正式发布首款 AI 浏览器 ChatGPT Atlas。
简单来说,这是一个把 ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT 侧边栏,让 AI 帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。
听起来有点像 Chrome 装了个 ChatGPT 插件?确实如此,但 OpenAI 的野心远不止于此。
关于 OpenAI 开发浏览器的传闻早在 2024 年 11 月就已流传,做浏览器的目标很明确,争夺互联网信息入口的控制权,获取更多用户数据。如今靴子落地,Google 股价一度下跌了不少。
有趣的是,OpenAI 正是用一个长得最像 Chrome 的浏览器,来挑战 Chrome,用你最熟悉的方式打败你。ChatGPT Atlas 没有选择激进的界面革新,也没有太多功能创新,而是保留了多标签、地址栏这些用户习以为常的元素,只是把 AI 放到了浏览的中心位置。
那么,ChatGPT Atlas 究竟有哪些功能?它和市面上已有的 AI 浏览器相比,又有什么不同?
让 ChatGPT 无处不在的浏览体验
侧边栏:ChatGPT 随时待命
ChatGPT Atlas 最核心的设计是将 ChatGPT 深度嵌入浏览器。在任何网页上,用户都可以点击 Ask ChatGPT 按钮,唤出一个侧边栏。这个侧边栏自动获取当前页面的上下文,用户可以直接要求 ChatGPT 总结代码差异、比较产品参数、分析文章观点,无需再复制粘贴内容。
首席设计师 Ryan 在发布会上演示了这一功能,强调这是“范式转变”,浏览器从"仅仅展示信息"变成"理解信息甚至编辑信息"的工具。但坦白说,Perplexity 的 Comet、The Browser Company 的 Dia 这些 AI 浏览器早就有了。侧边栏+页面上下文,已经是 AI 浏览器的标配。
类似的是 Cursor Chat 功能,在网页的任何文本框中,用户用光标选中文字后可以直接调用 ChatGPT 进行内联编辑。比如在 Gmail 写邮件时,选中一段话,让 ChatGPT"整理我的语言"或"改成更正式的语气",修改后的文本直接替换原文。这确实省去了在多个标签页之间来回切换的麻烦。
浏览器记忆:帮你记住更多
ChatGPT Atlas 引入了“浏览器记忆”功能,这是它与传统浏览器的重要区别。它不只记录你访问过哪些网站,还会记住你在页面上的操作行为,看了什么内容、对比了哪些产品、完成了什么任务。
这意味着你可以用自然语言搜索历史,比如问"找出我上周看过的所有职位招聘,并总结行业趋势",ChatGPT 会调用这些记忆给出个性化的分析。CEO Fidji Simo 在博客中举了个例子,她经常浏览无麸质食谱,现在可以直接让 ChatGPT“根据我最近看的食谱制定本周菜单”,并通过 Agent 模式在 Instacart 上自动下单。又是菜谱?看来 OpenAI 对"根据食谱买菜"这个场景情有独钟。
当然,这个功能完全可选。用户可以在设置中查看、归档或删除所有记忆,也可以在地址栏控制某个网站是否允许 ChatGPT 读取。清除浏览历史会同步删除相关记忆。
记忆功能本来就是 ChatGPT 率先推出的特性,迁移到浏览器是自然的延伸。但问题在于,这需要用户对 OpenAI 有足够的信任,毕竟,让 AI 记住你的所有浏览操作和行为,听起来就像在网上“裸奔”。
Agent 模式:本地版 Operator
对于 Plus、Pro 和 Business 订阅用户,ChatGPT 提供了 Agent 模式。这是一个可以代表用户执行任务的 AI 代理,它能打开标签页、点击按钮、填写表单、完成购物流程。可以简单理解为本地版的 Operator。它在 Atlas 的标签页里行动,而不是像 Operator 那样用一台云端的独立浏览器。
发布会上的演示场景包括根据食谱计算八人份配料并在 Instacart 下单、在 Google Doc 中添加评论并转换为 Linear 任务。又是订票、买菜、订餐厅。这些演示场景从 Operator 发布时就在用,已经不新鲜了。
经过我们的测试,目前的网页 AI 代理在简单任务上表现尚可,但处理复杂问题时仍不够可靠。OpenAI 自己也承认,Agent 可能会犯错,甚至可能受到网页中隐藏的恶意指令影响。OpenAI 强调 Agent 是"协作式"的,用户可以随时监控进度或接管控制权。
在我们的测试中 ChatGPT Atlas 未能完成电商比价任务
安全方面,Agent 仅在用户的标签页内运行,不能在计算机上执行代码或访问文件系统。在金融网站等敏感场景,它会暂停并等待用户确认。用户也可以选择"登出模式",限制 Agent 访问已登录的账户数据。
它和其他 AI 浏览器最大不同,
就是它是 OpenAI 发布的
AI 浏览器赛道已经相当拥挤。Perplexity 的 Comet 主打 AI 侧边栏和多步骤任务自动化,还有能主动给出洞见的背景助手,同样免费开放,Microsoft Edge 的 Copilot 模式整合了聊天和搜索功能,支持多标签对比和语音控制,与微软生态深度绑定;The Browser Company 的 Dia 则更注重界面美学和工作流优化,强调与标签对话的能力,可以作为写作伙伴和个人助理。
所以单从目前功能层面,ChatGPT Atlas 并没有从样貌上彻底重新设计浏览器。侧边栏、页面总结、自动化任务,这些都是很多 AI 浏览器的标准配置。它也没有推翻浏览器的形态本身,只是把 AI 放到了浏览的中心位置,让用户在熟悉的界面中获得智能化的体验。此外,首发就面向所有用户开放(Agent 模式除外),也体现了 OpenAI 快速占领市场的决心。
在体验上,接下来它还需要证明自己不只是 Chrome 加了个 ChatGPT 插件。毕竟 Edge 早就引入了 Copilot,而 Chrome 也可以轻易加入 Gemini 侧边栏,Gemini 光标、Agent 模式,还有着庞大的用户基数和生态优势。
但在此之外,OpenAI 的 Atlas 绝对不只是“又一个浏览器”这么简单。
在 OpenAI 的思路里,你也能看到,他们强调的 Atlas 的亮点之一,就在于与 ChatGPT 账户的深度整合,浏览器可以调用用户在 ChatGPT 中的历史对话和偏好设置,实现跨设备、跨平台的一致体验,跨会话、跨网站的记忆系统也不只是单次对话的上下文,对于重度 ChatGPT 用户来说,有了它至少可以少开一个应用,也不用跨窗口复制粘贴了。
OpenAI CEO Fidji Simo 在博客中阐述了发布 ChatGPT Atlas 的意图,“我们希望 ChatGPT 从一个孤立的、被动的文本聊天界面,演变为一个直觉化的超级助手,连接你需要的所有服务。”她提出了 ChatGPT 将成为你生活的操作系统。而浏览器是这一战略的关键节点,因为它是大多数人获取信息、完成任务的入口。
也就是说,OpenAI 的 Atlas 最大的“不同”,就是它是由 OpenAI 发布的。
ChatGPT Atlas 带来的是 ChatGPT 整个生态的能力与用户关系。这使得它是第一个可以不只在 Chrome 设定的规则内进行功能修补,而试图从根本上改变人们对浏览器的使用逻辑的产品——它要在已经被 ChatGPT 塑造了使用习惯的数亿用户的基础上,把浏览体验的核心从谷歌的搜索引擎,转移到 OpenAI 的 AI 模型上。
这本质上还是 OpenAI 要把 ChatGPT 打造成未来全知全能的操作系统的路线里,必要的一步。
用一个最像 Chrome 的样子,对用户来说熟悉的界面几乎没有学习成本;而对竞争对手,尤其是谷歌而言,这算是一个真正的警告了。接下来可以预期的是,它会迫使谷歌、微软等巨头更快速地将 AI 深度整合进自己的浏览器产品。所有人都会卷入 OpenAI 的 AI 时代操作系统之争中去。
扫码关注公众号
获取更多技术资讯