• 科学人
2299
需用时 04:35
OpenAI 的新浏览器,拯救我的这个双11

每年的双 11,都如同一个回旋镖正中高中毕业多年的我——算不明白,根本算不明白。

但今年不一样了。

我问 ChatGPT Atlas(OpenAI 上周刚刚推出的 AI 浏览器) ,“我是买 iPhone 17 还是 iPhone 17 Pro?怎么买最划算?”

然后,Atals 自动调取我浏览过的商品页,综合历史价格、促销活动和用户口碑,为我总结了每个平台的优缺点和优惠方案......

现在的商战,只适合交给 AI 去打|图源:ChatGPT Atlas

这些在一个界面里就完成了(那我以前遭的罪算什么???),丝滑到都快让我忘了,“浏览网页”是个多么“具体”的动作——打开搜索引擎,输入搜索关键词,根据排序从上往下,一页一页得翻找着,点开内容一看还不对。

经常有种“给我干哪儿来了”的迷茫感|作者截图

如果想在上班摸鱼时比下新 iPhone 的价格,又不好刷手机,开了十几个标签页,在几个电商平台间来回切换,比价格、看评价、算优惠......

信息是凌乱的,网页是割裂的,切换起来是手忙脚乱的——但是我们习惯了。

“小聪明”

浏览器一直在变聪明。

Chrome 从 2008 年开始,它以更快的加载、更干净的界面和开放的插件生态,带来了现代浏览器的黄金时代。

Chrome 开放的生态极大增强了它的吸引力|作者截图

此后十年,浏览器迎来功能创新的高峰,标签分组、阅读模式、跨设备同步、插件市场......

浏览器正在变得强大,但有一点始终没变,它只负责开门,却从不关心你是否找到了想要的东西——因为浏览器不理解你在干什么。

直到 AI 出现后,AI 插件几乎是一夜之间占领了浏览器侧边栏。你能随时在网页右侧唤出“ChatGPT 们”,让 AI 帮你总结网页,实时翻译 YouTube 视频。

“AI 插件”一度成为了一条很卷的“赛道”。原因很简单,谁都不想放过抢占“用户入口”的机会。

Chrome 应用商店里的 AI 插件|作者截图

AI 插件带来的体验提升,更多是减少在多个网页间跳转的摩擦感。但它始终如“外挂”一般,没能整合完整的用户使用场景,举个例子,它可以帮你总结网页,却不知道你从搜索哪个问题发散而来。

简而言之,这种体验提升是缝补式的,“芯”没换,我们的上网方式没有改变。

微软是巨头中动作最快的一个。微软将 Copilot 集成进 Edge 里,实现了调用各种各样插件来实现的功能。Edge 有了一个厉害的“副驾驶”,但开车的没变——Edge 没有成为一个全新物种。

那么,全新物种长什么样?

AI 浏览器群像

AI 浏览器颠覆的是一个主次逻辑,不是往浏览器里装 AI,而是围着 AI 造浏览器。

这场变革的起点,要从 Arc 说起。

2022 年,The Browser Company 推出 Arc 浏览器,喊着“重新定义上网”的口号,彻底抛弃了 Chrome 的老旧模板,把标签页、书签、笔记、下载管理器全塞进侧边栏,能一边浏览一边写笔记。

虽说没什么 AI 味儿,但 Arc 让用户们第一次意识到,浏览器不只用来看网页,而是能延伸到桌面系统。

Arc 出场方式就不一般|图源:Arc

2023 年,Arc 开始试水 AI,加入了网页总结、跨标签搜索等功能。虽然还依赖 GPT-3 等外部模型,但已经让人看到了浏览器“自我思考”的可能。

到 2024 年底,Arc 宣布停更,团队转而推出全新的 AI 原生浏览器:Dia。这也被认为是“AI 浏览器元年”的起点。

2025 年,AI 浏览器赛道正式爆发:Dia、Comet、Zen、Genspark……

先说,师承 Arc 的Dia,直接将浏览器变成”互联网的指挥中心”。

Dia 激进地取消了地址栏和标签页,从一开始就不打算让你“自己浏览”。你只要说出需求,它自己去扒拉网页、提炼重点、生成结构化内容。

Dia 的重点在跨网页的协同力:你可以同时点开五个长视频、几篇训练计划、三条小红书帖子,再问 Dia “我身高 170,体重 120,爱踢足球,想重点锻炼臀腿肌肉,根据这些材料,给我制定一个每天 45 分钟的力量训练方案。”

用 AI 浏览器帮我看视频|图源:Dia

Genspark 来自国内,它能基于网页信息生成“Office 牛马三件套”。

Comet 也是极具野心的黑马。我用 Comet 同时打开几篇学术论文,1.5h的讲座视频和 Google Docs 文档,告诉它执行这样的任务,“提取论文里关于‘深度学习模仿人类注意力机制’的关键段落,结合教授讲座的内容,写一段 300 字的摘要,最后排版到我的 Google Docs 里。”

Comet 自动在后台完成整个链路,不需要我干预,同时也不打扰我做其他事情。

用 Comet 根据我的需求制定独特的 Citywalk 路线|图源:Comet

“这是构建完成端到端工作流的唯一方式(指让用户在一个统一的环境中完成一系列连续任务)。”其 CEO Srinivas 说。

这些浏览器风格迥异,但底层逻辑相似,它们解决了传统浏览器仅是访问信息的局限,将每一页信息孤岛聚合起来。

交互逻辑也变成了,让人和 AI 相互,AI 操作浏览器执行命令。

欢迎来到“指令上网”时代

最近在试用 Atlas 时,我发现它又进一步完善了人和 AI 交互的问题。

用大模型取代传统搜索引擎回复查询,用 Agent 自动化执行用户指令。这些能力上,Atlas 和其他 AI 浏览器没什么不同。

“记忆”是 Atlas 核心卖点之一|图源:ChatGPT

但我在这里举一个例子。

前一阵,我在玩游戏时遇到了一个大 Bug,连续困扰我好几天。在 Dia 上,我打开大量论坛、帖子和 YouTube 视频,它帮我分析完,总结出 Bug 原因和解决方案。这已经很智能了。

但在 Atlas 上,除了这些,它会记得我更早之前提到过的电脑配置、显示设置、看过的帖子,甚至我已经尝试过哪些方法。然后它生成了一个针对性的建议,“你这个 Bug,可能和 DLSS 模式有关。你之前提到游戏开的是‘超高质量’,建议尝试 DLAA 或关闭光追测试下帧率变化。”

同一个指令,上面 Atlas 的回答串联起我最近看的所有帖子,并且会主动搜索更多帖。下面的 Dia,并没有跳出我打开的当前网页|图源:作者自制

Atlas 会记住我此前的问题|图源:Atlas

再比如,我花了很多天做旅行规划,搜索旅行路线、看机票、浏览酒店。当我觉得看得差不多了,我告诉 Atlas,“帮我整理上次看的那几个酒店,再推荐几个同类型的,按位置和价格排个名。”

然后 Atlas 会调出过往对话历史、网页记录,判断出我目标酒店的位置、价位、星级等信息,给我找到更多同类别的酒店,再帮我总结不同酒店之间的优劣势。

这是“理解用户”层面的能力。原因是,ChatGPT 才是浏览器的“芯”。

Atlas 是 OpenAI 的一个战略信号,你所有的需求都可以涌向 ChatGPT,然后 AI 帮你上网找答案,无论你想查询、创作、工作......

“我们认为 AI 代表了十年难遇的一次机会,让我们重新思考浏览器。” Sam Altman 发布 ChatGPT Atlas 时这么说。

过去浏览器是基于网页存在的。这与万维网设计初衷有关。而 AI 正在重塑我们获取和处理信息的方式,导致现在我们不再“围着网页转了”。

我们不必自己操作网页,摸索着找答案,而是发指令,让 AI 代为执行。

Comet CEO Srinivas 曾表示要将浏览器打造成一个操作系统。而这已经是所有 AI 浏览器的野心。AI Agent 是系统的核心,去完成用户交付的一切。让浏览器实现从“浏览”到“做事”的变化。

每一次范式转移,都伴随着一次信任和伦理的“大讨论”,关于隐私、数据边界、信息控制......技术史从来如此。还有,更难的是用户习惯的改变。

怎么说呢,Atlas 给我的感觉,有些像初代 iPhone,不是功能最全的,却是最像未来的。

作者:糕级冻雾

编辑:沈知涵

封面图来源:Atlas

Guokr

【直播】错过等千年?带你追“唐朝的彗星”

2025 最亮彗星之一的莱蒙彗星来袭!这颗彗星轨道周期约为1150-1350年,推算起来上次来还是唐朝。

我们直接把观测点搬去北京郊外奶牛农场,躲开光污染还能吸牛气!3台10万级大口径设备已经架好,专门拍这位“天外来客”。 今晚直播蹲住,可别错过这颗跨越千年的彗星!

The End

发布于2025-10-27, 本文版权属于果壳网(guokr.com),禁止转载。如有需要,请联系果壳

举报这篇文章

果壳

果壳网官方帐号

pic