爲什麼說AI Agent時代將迎來第三次瀏覽器之戰?

作者:Gate Ventures

TL;DR

第三次瀏覽器戰爭正在悄然展開。回顧歷史,從上世紀 90 年代的 Netscape、微軟的 IE,再到開源精神的 Firefox 與 Google 的 Chrome,瀏覽器之爭一直是平台控制權與技術範式變遷的集中體現。Chrome 憑藉更新速度與生態聯動奪得霸主地位,而 Google 通過搜索與瀏覽器的「雙寡頭」結構,形成了信息入口的閉環。

但今天,這一格局正在動搖。大型語言模型(LLM)的崛起,使得越來越多用戶在搜索結果頁「零點擊」完成任務,傳統的網頁點擊行爲正在減少。同時,Apple 有意在 Safari 中替換默認搜索引擎的傳聞,進一步威脅 Alphabet (Google 母公司 ) 的利潤根基,市場已開始顯露出對「搜索正統」的不安。

瀏覽器本身也正面臨角色重塑。它不僅是展示網頁的工具,更是數據輸入、用戶行爲、隱私身分等多種能力的集合容器。AI Agent 雖強,但若要完成復雜的頁面交互、調用本地身分數據、控制網頁元素,仍然需要借助瀏覽器的信任邊界和功能沙盒。瀏覽器正在從人類界面,變成 Agent的系統調用平台。

在本文,我們探討了瀏覽器是否還有存在的必要,同時我們認爲真正可能打破當前瀏覽器市場格局的,不是另一個「更好的 Chrome」,而是一種新的交互結構:不是信息的展示,而是任務的調用。未來瀏覽器要爲 AI Agent 設計 — — 不僅能讀,還能寫和執行。像 Browser Use 這樣的項目正嘗試將頁面結構語義化,把可視化界面變成 LLM 可調用的結構化文本,實現頁面到指令的映射,極大降低交互成本。

市面上主流項目已開始試水:Perplexity 構建原生瀏覽器 Comet,用 AI 代替傳統搜索結果;Brave 把隱私保護與本地推理結合,用 LLM 增強搜索與屏蔽功能;而 Donut 等 Crypto 原生項目,則瞄準 AI 與鏈上資產交互的新入口。這些項目共同特徵是:試圖重構瀏覽器的輸入端,而非美化其輸出層。

對創業者而言,機遇藏在輸入、結構與代理的三角關係中。瀏覽器作爲未來 Agent 調用世界的接口,意味着誰能提供可結構化、可調用、可信任的「能力塊」,誰就能成爲新一代平台的組成部分。從 SEO 到 AEO(Agent Engine Optimization),從頁面流量到任務鏈調用,產品形態與設計思維都在重構。第三次的瀏覽器戰爭,發生在「輸入」而非「展示」;決定勝負的,不再是誰抓住用戶的眼球,而是誰贏得了 Agent 的信任,獲得調用的入口。

瀏覽器發展簡史

在上世紀 90 年代初,互聯網尚未成爲日常生活的一部分時,Netscape Navigator 橫空出世,如同開啓新大陸的帆船,爲數以百萬計的用戶打開了通往數字世界的大門。這款瀏覽器並非第一個,但卻是第一個真正意義上走向大衆、塑造互聯網體驗的產品。彼時,人們第一次能如此輕鬆地通過圖形界面瀏覽網頁,仿佛整個世界都突然變得觸手可及。

然而,輝煌往往短暫。微軟很快意識到瀏覽器的重要性,並決定將 Internet Explorer 強行捆綁進 Windows 操作系統,讓其成爲默認瀏覽器。這一策略堪稱「平台殺手鐧」,直接瓦解了 Netscape 的市場主導地位。許多用戶並非主動選擇 IE,而是因爲系統默認便接受了它。IE 借助 Windows 的分發能力,迅速成爲行業霸主,Netscape 則陷入了衰敗的軌道。

在困境中,Netscape 的工程師選擇了一條激進而理想主義的道路 — — 他們將瀏覽器原始碼公開,向開源社區發出召喚。這一決定,仿佛是一次技術界的「馬其頓式讓位」,預示着舊時代的終結與新力量的崛起。這段代碼後來成爲 Mozilla 瀏覽器項目的基礎,最初命名爲 Phoenix(意爲鳳凰涅槃),卻因商標問題幾經更名,最終定名爲 Firefox。

Firefox 並非簡單復制 Netscape,它在用戶體驗、插件生態、安全性等方面實現了多項突破。它的誕生標志着開源精神的勝利,也爲整個行業注入新的活力。有人形容 Firefox 是 Netscape 的「精神繼承者」,如同奧斯曼帝國繼承了拜佔庭的餘暉。這一比喻雖誇張,卻頗具意味。

但在 Firefox 正式發布前的幾年,微軟早已發布了六個版本的 IE,憑藉時間優勢和系統捆綁策略,使 Firefox 一開始便處於追趕地位,注定這場競賽並非起跑線平等的公平競爭。

與此同時,另一個早期玩家也在悄然登場。1994 年,Opera 瀏覽器問世,它來自挪威,起初只是一個實驗性項目。但從 2003 年的 7.0 版本起,它引入了自研的 Presto 引擎,率先支持 CSS、自適應布局、語音控制以及 Unicode 編碼等前沿技術。雖然用戶數量有限,但技術上始終走在行業前列,成爲「極客的最愛」。

同年,蘋果推出了 Safari 瀏覽器。這是一場別有意味的轉折。彼時,微軟曾向瀕臨破產的蘋果注資 1.5 億美元,以維持競爭表象、避免反壟斷審查。雖然 Safari 從誕生起的默認搜索引擎是 Google,但這段與微軟的歷史糾葛象徵着互聯網巨頭之間復雜而微妙的關係:合作與競爭,總是如影隨形。

2007 年,IE7 隨 Windows Vista 推出,但市場反饋平平。反觀 Firefox,憑藉更快的更新節奏、更友好的擴展機制以及對開發者的天然吸引力,市場份額穩步提升至約 20%。IE 的統治逐漸松動,風向正在改變。

谷歌則是另一種打法。雖然從 2001 年起就開始醞釀打造自家瀏覽器,但花了六年時間才說服 CEO 埃裏克·施密特批準這個項目。Chrome 於 2008 年問世,基於 Chromium 開源項目與 Safari 所用的 WebKit 引擎打造。它被戲稱爲「臃腫」的瀏覽器,但憑藉谷歌對廣告投放與品牌塑造的深厚功力,迅速崛起。

Chrome 的關鍵武器並非功能,而是頻繁的版本更新節奏(每六周一次)與全平台統一體驗。2011 年 11 月,Chrome 首次超越 Firefox,市場份額達到 27%;六個月後,又反超 IE,完成了從挑戰者到主宰者的轉變。

與此同時,中國的移動互聯網也在形成自己的生態系統。阿裏巴巴旗下的 UC 瀏覽器在 2010 年代初迅速躥紅,尤其是在印度、印尼、中國等新興市場,依靠輕量級設計、壓縮數據節省流量等特性,贏得了低端設備用戶的青睞。2015 年,其全球移動瀏覽器市場份額突破 17%,在印度一度高達 46%。但這場勝利並不持久。隨着印度政府加強對中國應用的安全審查,UC 瀏覽器被迫退出關鍵市場,逐漸失去往日輝煌。

進入 2020 年代,Chrome 的主導地位已經確立,全球市場份額穩定在約 65%。值得注意的是,Google 搜索引擎與 Chrome 瀏覽器雖然同屬 Alphabet,但從市場層面看卻是兩個獨立的霸權體系 — — 前者控制了全球約九成的搜索入口,後者則掌握了大多數用戶進入網路的「第一窗口」。

爲了守住這一雙重壟斷結構,谷歌不惜重金投入。2022 年,Alphabet 向蘋果支付約 200 億美元,只爲讓 Google 保持在 Safari 中的默認搜索地位。有分析指出,這筆支出相當於谷歌從 Safari 流量中獲取搜索廣告收入的 36%。換言之,谷歌正爲護城河支付「保護費」。

但風向又一次變化。隨着大型語言模型(LLM)的崛起,傳統搜索開始受到衝擊。2024 年,Google 的搜索市場份額自 93% 跌至 89%,雖仍稱霸,但裂痕初現。更具顛覆性的,是關於蘋果或將推出自有 AI 搜索引擎的傳聞 — — 若 Safari 默認搜索改投自家陣營,這不僅將改寫生態格局,更可能撼動 Alphabet 的利潤支柱。市場反應迅速,Alphabet 股價從 170 美元應聲下跌至 140 美元,反映的不僅是投資者的恐慌,更是對搜索時代未來走向的深度不安。

從 Navigator 到 Chrome,從開源理想到廣告商業化,從輕量瀏覽器到 AI 搜索助手,瀏覽器之爭始終是一場關於技術、平台、內容與控制權的戰爭。戰場不斷遷移,但本質從未改變:誰掌握入口,誰就定義未來。

在 VC 眼中,依托 LLM 和 AI 時代人們對搜索引擎的新需求,第三次瀏覽器戰爭正在逐步展開。以下是部分知名 AI 瀏覽器賽道的項目的融資情況。

現代瀏覽器的老舊架構

談及瀏覽器的架構,經典的傳統架構如下圖所示:

客戶端 — 前端入口

查詢經 HTTPS 送達最近的 Google Front End,完成 TLS 解密、QoS 採樣和地理路由。若檢測到異常流量(DDoS、自動抓取)可在此層限流或挑戰。

查詢理解

前端需要理解用戶鍵入的單詞的含義,有三個步驟:神經拼寫校正,將 「recpie」 糾正爲 「recipe」;同義詞擴展,將「how to fix bike」,拓展到「repair bicycle」。意圖解析,判定查詢是資訊、導航還是交易意圖,並分配 Vertical請求。

候選召回

Google 使用的查詢技術被稱爲:倒排索引。在正序索引中,我們都是給定一個 ID 就可以索引到文件。但是用戶不可能知道想要的內容在上千億個文件中的編號,因此其採用了非常傳統的倒排索引,通過內容來查詢到哪些文件有對應的關鍵字。接下來,Google 採用向量索引用於處理語義搜索,即查找與查詢含義相似的內容。它將文本、圖像等內容轉換爲高維向量(embedding),並根據這些向量之間的相似性進行搜索。例如,即使用戶搜索「如何制作披薩面團」,搜索引擎也能返回與「披薩面團制作指南」相關的結果,因爲它們在語義上相似。經歷了倒排索引和向量索引,大約十萬量級的網頁會被初篩出來。

多級排序

系統通常通過 BM25、TF-IDF、頁面質量分等數千維輕特徵,將十萬級規模的候選頁面篩選至約 1000 篇,構成初步候選集。這類系統被統稱爲推薦引擎。其依賴多種實體生成的海量特徵,包括用戶行爲、頁面屬性、查詢意圖與上下文信號。例如,Google 會綜合用戶歷史、其他用戶的行爲反饋、頁面語義、查詢含義等信息,同時還考慮上下文要素,如時間(一天中時段、一周中的具體日子)與實時新聞等外部事件。

深度學習進行主排序

在初步檢索階段,Google 使用 RankBrain 和 Neural Matching 等技術來理解查詢的語義,並從海量文檔中篩選出初步相關的結果。RankBrain 是 Google 於 2015 年引入的機器學習系統,旨在更好地理解用戶查詢的含義,尤其是首次出現的查詢。它通過將查詢和文檔轉換爲向量表示,計算它們之間的相似性,從而找到最相關的結果。例如,對於查詢「如何制作披薩面團」,即使文檔中沒有完全匹配的關鍵詞,RankBrain 也能識別出與「披薩基礎」或「面團制作」相關的內容。

Neural Matching 是 Google 於 2018 年推出的另一項技術,旨在更深入地理解查詢和文檔之間的語義關係。它使用神經網路模型來捕捉詞語之間的模糊關係,幫助 Google 更好地匹配查詢和網頁內容。例如,對於查詢「爲什麼我的筆記本電腦風扇聲音很大」,Neural Matching 能夠理解用戶可能在尋找有關過熱、灰塵積聚或高 CPU 使用率的故障排除信息,即使這些詞語沒有直接出現在查詢中。

深度重排:BERT 模型的應用

在初步篩選出相關文檔後,Google 使用 BERT(Bidirectional Encoder Representations from Transformers)模型對這些文檔進行更精細的排序,以確保最相關的結果排在前面。BERT 是一種基於 Transformer 的預訓練語言模型,能夠理解詞語在句子中的上下文關係。在搜索中,BERT 被用於重新排序初步檢索到的文檔。它通過對查詢和文檔進行聯合編碼,計算它們之間的相關性得分,從而對文檔進行重新排序。例如,對於查詢「停車在沒有路緣的坡道上」,BERT 能夠理解「沒有路緣」的含義,並返回建議駕駛員將車輪朝向路邊的頁面,而不是誤解爲有路緣的情況。而對於 SEO 工程師來說,就是需要精確的學習 Google 排序和機器學習的推薦算法,來針對性的優化網頁內容重而獲得更高的排名展示。

以上就是典型的 Google 搜索引擎的工作流程。但是在當前的 AI 和大數據爆發的時代,用戶對瀏覽器的交互產生了新的需求。

爲什麼 AI會重塑瀏覽器

首先我們需要明確,爲什麼瀏覽器這一形態仍然會存在?是否存在一種第三形態,除了人工智能代理和瀏覽器之外的選擇?

我們認爲,存在即無法替代。爲什麼人工智能能夠使用瀏覽器,卻無法完全取代瀏覽器?因爲瀏覽器是通用平台,不僅僅是讀取數據的入口,更是輸入數據的通用入口。這個世界不可能只有信息輸入,還必須產生數據並與網站進行交互,所以整合個性化用戶信息的瀏覽器仍將廣泛存在。

我們抓住這個點:瀏覽器作爲通用入口,不僅用於讀取數據,用戶往往還需要與數據進行交互。瀏覽器本身是存儲用戶指紋的絕佳場所。更復雜的用戶行爲和自動化行爲,必須以瀏覽器爲載體。瀏覽器可以存儲用戶的所有行爲指紋、通行證等隱私信息,在自動化過程中實現無需信任的調用。而與數據交互的動作,可以演變爲:

用戶 → 調用 AI Agent →瀏覽器。

也就是說,唯一可能被取代的部分,是符合世界演變趨勢的方向 — — 更智能化、更個性化、以及更自動化。誠然,這部分可以交給 AI Agent 來處理,但 AI Agent 本身絕非適合承載用戶個性化內容的場所,因爲其在數據安全與便捷性方面面臨多重挑戰。具體而言:

瀏覽器是個性化內容的存儲場所:

  • 多數大型模型托管在雲端,會話上下文依賴服務器保存,難以直接調用本機密碼、錢包、Cookie 等敏感數據。
  • 將全部瀏覽和支付數據送往第三方模型,需重新獲得用戶授權;歐盟《DMA》與美國州級隱私法均要求數據最小化出境。
  • 自動填寫雙重驗證驗證碼、調用攝像頭或利用 GPU 進行 WebGPU 推理,都必須在瀏覽器沙盒內完成。
  • 數據上下文高度依賴瀏覽器,包括標籤頁、Cookie、IndexedDB、Service Worker Cache、Passkey 憑據以及擴展數據,都沉澱在瀏覽器中。

交互形式的深刻變革

回到剛開始的話題,我們使用瀏覽器的行爲大致可以分爲三種形式:讀取數據、輸入數據、交互數據。人工智能大模型(LLM)已經深刻改變了我們讀取數據的效率和方式,過去用戶基於關鍵詞搜索網頁的行爲顯得非常老舊且低效。

針對用戶搜索行爲的演化 — — 是獲取總結答案,還是點擊網頁,已經有不少研究進行分析。

在用戶的行爲模式方面,2024 年的研究顯示,在美國每 1,000 次 Google 查詢中,只有 374 次最終點擊開放網頁。換言之,近 63% 屬於「零點擊」行爲。用戶習慣直接從搜索結果頁獲取天氣、匯率、知識卡片等信息。

在用戶的心理方面,一項 2023 年的調查指出,44% 受訪者認爲常規自然結果比精選摘要(featured snippet)更值得信賴。學術研究也發現,在存在爭議或無統一真相的議題中,用戶更偏好包含多來源連結的結果頁。

也就是說,確實有一部分用戶對 AI 摘要的信賴度不高,但也有相當比例的用戶行爲已經轉向「零點擊」。所以,AI 瀏覽器仍然需要探索一個恰當的交互形態 — — 特別是在數據讀取這一部分,因爲當前大模型的「幻覺問題」(hallucination)仍未根除,許多用戶仍難以完全信任自動生成的內容摘要。在這方面,如果將大模型嵌入瀏覽器,實際上不需要對瀏覽器進行顛覆性變革,只需逐步解決模型的準確性與可控性,這項改進也正在持續推進中。

而真正可能觸發瀏覽器大規模變革的,是數據交互這一層。過去人們通過輸入關鍵字完成交互 — — 這是瀏覽器能理解的極限。而現在,用戶越來越傾向於使用一整段自然語言描述復雜任務,比如:

  • 「尋找紐約到洛杉磯某個時間段的直飛機票」
  • 「尋找紐約飛上海然後到洛杉磯的機票」

這些行爲,即使對人類來說也需要耗費大量時間去訪問多個網站、收集與比較數據。但這些 Agentic Tasks(代理任務)正在逐步被 AI Agent接管。

這也符合歷史演進的方向:自動化與智能化。人們渴望解放雙手,AI Agent 必將深度嵌入瀏覽器。未來的瀏覽器必須爲全自動化而設計,尤其要考慮:

  • 如何兼顧人類閱讀體驗與 AI Agent可解析性,
  • 如何在同一個頁面上,既服務於用戶,也服務於代理模型。

只有滿足這兩者的設計,瀏覽器才能真正成爲 AI Agent 執行任務的穩定載體。

接下來,我們將聚焦五個備受關注的項目,包括 Browser Use、Arc(The Browser Company)、Perplexity、Brave 以及 Donut。這些項目分別代表了 AI 瀏覽器的未來演進方向,及其在 Web3 和 Crypto 場景中的原生結合潛力。

Browser Use

這正是 Perplexity 和 Browser Use 獲得巨額融資背後的核心邏輯所在。尤其是 Browser Use,是 2025 年上半年湧現出的第二個最具確定性與增長潛力的創新機會。

Browser 是構建了一個真正意義上的語義層,其核心在於爲下一代瀏覽器構建了語義識別架構。

Browser Use 把傳統「DOM=給人看的節點樹」重新解碼成「語義 DOM=給 LLM 看的指令樹」,讓代理無需「看片點坐標」就能精準點擊、填寫與上傳;這條路線以「結構化文本 → 函數調用」取代視覺 OCR 或坐標 Selenium,所以執行更快、token 更省、出錯更少。TechCrunch 稱之爲「讓 AI 真正讀懂網頁的膠水層」,而 3 月完成的 1700 萬美元種子輪正是押注這一底層革新。

HTML 渲染後形成標準 DOM 樹;瀏覽器再派生一棵 accessibility tree,爲屏幕閱讀器提供更豐富的「角色」與「狀態」標籤。

  • 把每個可交互元素(, 等)抽象成 JSON 片段,附帶 角色、可見性、坐標、可執行動作 等元數據;
  • 將整棵頁面轉譯成扁平化「語義節點清單」,供 LLM 在系統提示裏一次性讀取;
  • 接收 LLM 輸出的高層指令(如 click(node_id=「btn-Checkout」)),回放到真瀏覽器。官方博客把這個過程稱作「把網站接口變成 LLM 可解析的 structured text」

同時,一旦這套標準被引入 W3C,那麼可以很大程度上解決瀏覽器輸入的問題。我們以 The Browser Company 的公開信和案例,來進一步闡述爲什麼 The Browser Company 的想法是錯誤的。

ARC

The Browser Company (Arc 母公司 ) 在其公開信中表示,ARC 瀏覽器將進入常規維護階段,團隊將重心會放在完全面向 AI 的瀏覽器 DIA。信中也坦言,目前尚未確定 DIA 的具體實現路徑。同時,團隊在信中提出了若幹對未來瀏覽器市場的預測。基於這些預測,我們進一步認爲,若要真正顛覆現有瀏覽器格局,關鍵在於對交互側的輸出做出改變。

以下是我們截取的三個來自 ARC 團隊對未來瀏覽器市場的預測。

首先,其認爲 Webpages 不再成爲主要的交互界面。不可否認,這是一個具有挑戰性的判斷,也正是我們對其創始人反思結果持保留態度的關鍵所在。在我們看來,該觀點顯著低估了瀏覽器的作用,也正是其在探索 AI 瀏覽器路徑時忽視的關鍵問題。

大模型在意圖捕捉方面表現優異,例如理解「幫我訂機票」這樣的指令。然而,在信息密度承載能力上,它們仍顯不足。當用戶需要一個如儀表盤、彭博終端風格的記事本,或類似 Figma 的可視化畫布時,沒有什麼能比像素級精度排列的專用網頁更具優勢。每款產品都量身定制的人體工程學設計 — — 圖表、拖放功能、熱鍵 — — 並非裝飾性的浮渣,而是壓縮認知的可供性。這些能力是簡單對話式交互無法承載的。以 Gate.com 爲例,若用戶希望進行投資操作,僅依賴 AI 對話遠遠不夠,因爲用戶對信息輸入、精度與結構化呈現有着高度依賴。

RC 團隊在其路徑設想中存在一個本質性偏差,即未能清晰地區分「交互」由輸入與輸出兩個維度構成。在輸入側,其觀點在某些場景下具有一定合理性,AI 的確可以提升指令式交互的效率;但在輸出側,該判斷明顯失衡,忽略了瀏覽器在信息呈現與個性化體驗中的核心作用。例如,Reddit 擁有其獨特的布局方式和信息架構,而 AAVE 則有着完全不同的界面與結構。瀏覽器作爲一個既容納高度私密性數據,又能通用渲染多樣化產品界面的平台,瀏覽器在輸入層的替代性本就有限,而在輸出側,其復雜性與不可標準化特性更使其難以被顛覆。相較之下,當前市面上的 AI 瀏覽器更多集中在「輸出總結」層面:摘要網頁、提煉信息、生成結論,尚不足以構成對 Google 等主流瀏覽器或搜索體系的根本性挑戰,分瓜的也只是搜索總結的市場份額。

因此,真正能夠撼動市佔率高達 66% 的 Chrome 的,注定不會是「下一個 Chrome」。要實現這一顛覆,必須對瀏覽器的渲染模式進行根本性重塑,使其能夠適配智能時代 AI Agent 主導下的交互需求,尤其是在輸入側的架構設計上。正因如此,我們更認可 Browser Use 所採取的技術路徑 — — 其關注點在於瀏覽器底層機制的結構性變革。任何系統一旦實現「原子化」或「模塊化」,其由此衍生出的可編程性與組合性將帶來極具破壞力的顛覆潛力,而這正是 Browser Use 當前所推進的方向。

總結而言,AI Agent 的運行仍高度依賴瀏覽器的存在。瀏覽器不僅是復雜個性化數據的主要存儲場所,也是多樣化應用的通用渲染界面,因此將在未來繼續作爲核心交互入口。隨着 AI Agent 深度嵌入瀏覽器以完成固定任務,其將通過調用用戶數據與特定應用進行交互,即主要作用於輸入側。爲此,瀏覽器的現有渲染模式需進行創新,以實現對 AI Agent 的最大程度兼容與適配,從而更有效地捕捉應用。

Perplexity

Perplexity 是一個以其推薦系統著稱的 AI 搜索引擎,最新估值高達 140 億美元,較 2024 年 6 月的 30 億美元增長近 5 倍。月均處理搜索查詢量超過 4 億次,2024 年 9 月處理了約 2.5 億次查詢,用戶查詢量同比增長 8 倍,月活躍用戶超過 3000萬。

其主要的特點是能夠實時的總結頁面,在獲取即時信息方面佔據優勢。今年初,其開始構建自己的原生瀏覽器 Comet。Perplexity 把即將發布的 Comet 描述成一個不僅「顯示」網頁、更能「思考」網頁的瀏覽器。官方稱它將在瀏覽器內部深度嵌入 Perplexity 的答案引擎,這是喬布斯式的「整機」思路:將 AI 任務深埋到瀏覽器底層,而非做側邊欄插件。用帶引用的簡潔答案取代傳統的「十條藍色連結」,直接與 Chrome競爭。

但其仍需解決兩個核心問題:高搜索成本以及來自邊際用戶的低利潤率。盡管 Perplexity 在 AI 搜索領域已處於領先位置,但 Google 在 2025 年 I/O 大會上同樣宣布對其核心產品進行大規模智能化重塑。針對瀏覽器的重塑,Google 推出了一個新的瀏覽器標籤頁體驗,名爲 AI Model,集成了 Overview、Deep Research 以及未來的 Agentic 功能,整體項目被稱爲 「Project Mariner」。

Google 正在積極的進行 AI 重塑,因此僅憑表層的功能模仿,例如 Overview、DeepResearch 或 Agentics,難以真正對其構成威脅。真正有可能在混沌中建立新秩序的,將是從底層重構瀏覽器架構、將大語言模型(LLM)深度嵌入瀏覽器內核,在交互方式上實現根本性的變革。

Brave

Brave是 Crypto 行業裏面最早期也是最成功的瀏覽器,其基於 Chromium 架構,因此能夠兼容 Google Store 上的插件。其依靠隱私和瀏覽賺取 Tokens 這一模式來吸引用戶。Brave 的發展路徑在一定程度上展現了其成長潛力。但是從產品角度來看,隱私固然重要,但其需求仍主要集中於特定用戶羣體,對大衆而言隱私意識尚未成爲主流決策因素。因此,試圖依靠該特性顛覆現有巨頭的可能性較低。

截至目前,Brave 的月活躍用戶已達到 8,270 萬,日活躍用戶爲 3,560 萬,市場份額約爲 1%–1.5%。用戶規模呈持續增長態勢:從 2019 年 7 月的 600 萬,增長至 2021 年 1 月的 2,500 萬,2023 年 1 月達 5,700 萬,至 2025 年 2 月突破 8,200 萬,年均復合增長率仍維持在兩位數水平。其月均搜索查詢量約爲 13.4 億次,約爲 Google 的0.3%。

以下是 Brave 的迭代路線圖。

Brave 正計劃升級爲隱私優先的 AI 瀏覽器。然而,受限於其獲取用戶數據較少,導致大模型的可定制化程度較低,反而不利於實現快速且精準的產品迭代。在即將到來的 Agentic Browser 時代,Brave 或將在特定注重隱私的用戶羣體中保有穩定份額,但難以成爲主要玩家。其 AI 助手 Leo 更類似於外掛插件,僅在現有產品基礎上進行功能性增強,具備一定的內容總結能力,但尚無全面轉向 AI Agent 的明確戰略,交互層面的革新仍顯不足。

Donut

近期,Crypto 行業在 Agentic Browser 領域亦有所進展。初創項目 Donut 於 Pre-seed 輪獲得了 700 萬美元融資,由紅杉中國(Hongshan)、HackVC 與 Bitkraft Ventures 共同領投。目前項目仍處於早期構想階段,願景在於實現「探索 — 決策 — 加密原生執行」(Discovery, Decision-making, and Crypto-native Execution)的一體化能力。

這一方向的核心在於結合加密原生的自動化執行路徑。正如 a16z 所預言,未來 Agent 有望取代搜索引擎成爲主要流量入口,創業者將不再圍繞 Google 排序算法展開競爭,而是爭奪由 Agent 執行所帶來的訪問和轉化流量。業界已將這一趨勢稱爲「AEO」(Answer / Agent Engine Optimization),或更進一步的「ATF」(Agentic Task Fulfilment),即不再優化搜索排名,而是直接服務於能夠替用戶完成下單、訂票、寫信等任務的智能模型。

給創業者

首先,必須承認:Browser 本身依舊是互聯網世界最大的未被重構的「總入口」。全球桌面用戶約 21 億、移動端超 43 億,它是數據輸入、交互行爲、個性化指紋存儲的共同載體。這個形態之所以存續,不是因爲慣性,而是因爲瀏覽器天然具備雙向屬性:既是數據「讀入口」,也是行爲「寫出口」。

因此,對於創業者而言,真正具備顛覆潛力的並非「頁面輸出」層面的優化。即便能在新標籤頁中實現類似 Google 的 AI 概覽功能,本質上仍屬於瀏覽器插件層的迭代,尚未構成範式的根本性變革。真正的突破口在於「輸入側」 — — 即如何使 AI Agent 主動調用創業者的產品,以完成具體任務。這將成爲未來產品能否嵌入 Agent 生態、獲得流量與價值分配的關鍵。

搜索時代拼「點擊」;代理時代拼「調用」。

如果你是一名創業者,不妨把你的產品重新想象成一顆 API 組件 — — 讓智能體不僅能「讀懂」它,更能「調用」它。這就要求你在產品設計一開始就考慮三個維度:

一、接口結構標準化:你的產品是「可調用」的麼?

產品是否具備被智能體調用的能力,取決於其信息結構能否標準化並抽象爲明確的 schema。例如,用戶註冊、下單按鈕、評論提交等關鍵操作,是否可通過語義化的 DOM 結構或 JSON 映射進行描述?系統是否提供狀態機,使 Agent 能夠穩定復現用戶行爲流程?用戶在頁面上的交互是否支持腳本化還原?是否具備穩定訪問的 WebHook 或 API Endpoint?

這正是 Browser Use 融資成功的本質原因 — — 它將瀏覽器從平鋪渲染的 HTML 轉變爲一棵可被 LLM 調用的語義樹。對於創業者而言,在網頁產品中引入類似的設計理念,即是在爲 AI Agent 時代進行結構化適配。

二、身分與通行:你能幫 Agent「越過信任障壁」嗎?

AI 代理要完成交易、調用支付或資產,需要某種可信中間層 — — 你能成爲它嗎?瀏覽器天然可以讀取本地存儲、調用錢包、識別驗證碼、接入雙因子驗證,這正是它比雲端大模型更適合做執行的原因。在 Web3 場景中尤其如此:調用鏈上資產的接口標準並不統一,Agent 若無「身分」或「籤名能力」,將寸步難行。

所以,對 Crypto 創業者而言,這裏有一個極具想象力的空白區:「區塊鏈世界的 MCP(Multi Capability Platform)」。這既可以是一個通用指令層(讓 Agent 調用 Dapp),也可以是標準化的合約接口集,甚至是某種運行在本地的輕量錢包 + 身分中臺。

三、流量機制的再理解:未來不是 SEO,是 AEO /ATF

過去你要爭取 Google 的算法青睞;現在你要被 AI Agent 嵌入進任務鏈裏。這意味着產品要有清晰任務顆粒度:不是一個「頁面」,而是一串「可調用能力單元」;意味着你要開始做 Agent 優化(AEO)或任務調度適配(ATF):例如註冊流程是否可簡化爲結構化步驟、定價是否可通過接口拉取、庫存是否實時可查;

你甚至要開始適配不同 LLM 框架下的調用語法 — — OpenAI 和 Claude 對函數調用、tool usage 的偏好並不一致。Chrome 是通往舊世界的終端,而不是通往新世界的入口。真正有未來的創業項目,不是再造一個瀏覽器,而是讓現有瀏覽器爲 Agent 服務,爲新一代的「指令流」建立橋梁。

  • 你要構建的,是 Agent 調用你的世界的「接口語法」;
  • 你要爭取的,是成爲智能體信任鏈中的一個環節;
  • 你要搭建的,是下一個搜索模式裏的「API 城堡」。

如果說 Web2 是靠 UI 抓住用戶的注意力,那 Web3 + AI Agent 時代,就是靠調用鏈抓住 Agent的執行意圖。

查看原文
此页面可能包含第三方内容,仅供参考(非陈述/保证),不应被视为 Gate 认可其观点表述,也不得被视为财务或专业建议。详见声明
  • 讚賞
  • 留言
  • 分享
留言
0/400
暫無留言
交易,隨時隨地
qrCode
掃碼下載 Gate APP
社群列表
繁體中文
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)