爲什麼說AI Agent時代將迎來第三次瀏覽器之戰？

Question

作者：Gate Ventures### TL;DR第三次瀏覽器戰爭正在悄然展開。回顧歷史，從上世紀 90 年代的 Netscape、微軟的 IE，再到開源精神的 Firefox 與 Google 的 Chrome，瀏覽器之爭一直是平台控制權與技術範式變遷的集中體現。Chrome 憑藉更新速度與生態聯動奪得霸主地位，而 Google 通過搜索與瀏覽器的「雙寡頭」結構，形成了信息入口的閉環。但今天，這一格局正在動搖。大型語言模型（LLM）的崛起，使得越來越多用戶在搜索結果頁「零點擊」完成任務，傳統的網頁點擊行爲正在減少。同時，Apple 有意在 Safari 中替換默認搜索引擎的傳聞，進一步威脅 Alphabet (Google 母公司 ) 的利潤根基，市場已開始顯露出對「搜索正統」的不安。瀏覽器本身也正面臨角色重塑。它不僅是展示網頁的工具，更是數據輸入、用戶行爲、隱私身分等多種能力的集合容器。AI Agent 雖強，但若要完成復雜的頁面交互、調用本地身分數據、控制網頁元素，仍然需要借助瀏覽器的信任邊界和功能沙盒。瀏覽器正在從人類界面，變成 Agent的系統調用平台。在本文，我們探討了瀏覽器是否還有存在的必要，同時我們認爲真正可能打破當前瀏覽器市場格局的，不是另一個「更好的 Chrome」，而是一種新的交互結構：不是信息的展示，而是任務的調用。未來瀏覽器要爲 AI Agent 設計 — — 不僅能讀，還能寫和執行。像 Browser Use 這樣的項目正嘗試將頁面結構語義化，把可視化界面變成 LLM 可調用的結構化文本，實現頁面到指令的映射，極大降低交互成本。市面上主流項目已開始試水：Perplexity 構建原生瀏覽器 Comet，用 AI 代替傳統搜索結果；Brave 把隱私保護與本地推理結合，用 LLM 增強搜索與屏蔽功能；而 Donut 等 Crypto 原生項目，則瞄準 AI 與鏈上資產交互的新入口。這些項目共同特徵是：試圖重構瀏覽器的輸入端，而非美化其輸出層。對創業者而言，機遇藏在輸入、結構與代理的三角關係中。瀏覽器作爲未來 Agent 調用世界的接口，意味着誰能提供可結構化、可調用、可信任的「能力塊」，誰就能成爲新一代平台的組成部分。從 SEO 到 AEO（Agent Engine Optimization），從頁面流量到任務鏈調用，產品形態與設計思維都在重構。第三次的瀏覽器戰爭，發生在「輸入」而非「展示」；決定勝負的，不再是誰抓住用戶的眼球，而是誰贏得了 Agent 的信任，獲得調用的入口。### 瀏覽器發展簡史在上世紀 90 年代初，互聯網尚未成爲日常生活的一部分時，Netscape Navigator 橫空出世，如同開啓新大陸的帆船，爲數以百萬計的用戶打開了通往數字世界的大門。這款瀏覽器並非第一個，但卻是第一個真正意義上走向大衆、塑造互聯網體驗的產品。彼時，人們第一次能如此輕鬆地通過圖形界面瀏覽網頁，仿佛整個世界都突然變得觸手可及。然而，輝煌往往短暫。微軟很快意識到瀏覽器的重要性，並決定將 Internet Explorer 強行捆綁進 Windows 操作系統，讓其成爲默認瀏覽器。這一策略堪稱「平台殺手鐧」，直接瓦解了 Netscape 的市場主導地位。許多用戶並非主動選擇 IE，而是因爲系統默認便接受了它。IE 借助 Windows 的分發能力，迅速成爲行業霸主，Netscape 則陷入了衰敗的軌道。在困境中，Netscape 的工程師選擇了一條激進而理想主義的道路 — — 他們將瀏覽器原始碼公開，向開源社區發出召喚。這一決定，仿佛是一次技術界的「馬其頓式讓位」，預示着舊時代的終結與新力量的崛起。這段代碼後來成爲 Mozilla 瀏覽器項目的基礎，最初命名爲 Phoenix（意爲鳳凰涅槃），卻因商標問題幾經更名，最終定名爲 Firefox。Firefox 並非簡單復制 Netscape，它在用戶體驗、插件生態、安全性等方面實現了多項突破。它的誕生標志着開源精神的勝利，也爲整個行業注入新的活力。有人形容 Firefox 是 Netscape 的「精神繼承者」，如同奧斯曼帝國繼承了拜佔庭的餘暉。這一比喻雖誇張，卻頗具意味。但在 Firefox 正式發布前的幾年，微軟早已發布了六個版本的 IE，憑藉時間優勢和系統捆綁策略，使 Firefox 一開始便處於追趕地位，注定這場競賽並非起跑線平等的公平競爭。與此同時，另一個早期玩家也在悄然登場。1994 年，Opera 瀏覽器問世，它來自挪威，起初只是一個實驗性項目。但從 2003 年的 7.0 版本起，它引入了自研的 Presto 引擎，率先支持 CSS、自適應布局、語音控制以及 Unicode 編碼等前沿技術。雖然用戶數量有限，但技術上始終走在行業前列，成爲「極客的最愛」。同年，蘋果推出了 Safari 瀏覽器。這是一場別有意味的轉折。彼時，微軟曾向瀕臨破產的蘋果注資 1.5 億美元，以維持競爭表象、避免反壟斷審查。雖然 Safari 從誕生起的默認搜索引擎是 Google，但這段與微軟的歷史糾葛象徵着互聯網巨頭之間復雜而微妙的關係：合作與競爭，總是如影隨形。2007 年，IE7 隨 Windows Vista 推出，但市場反饋平平。反觀 Firefox，憑藉更快的更新節奏、更友好的擴展機制以及對開發者的天然吸引力，市場份額穩步提升至約 20%。IE 的統治逐漸松動，風向正在改變。谷歌則是另一種打法。雖然從 2001 年起就開始醞釀打造自家瀏覽器，但花了六年時間才說服 CEO 埃裏克·施密特批準這個項目。Chrome 於 2008 年問世，基於 Chromium 開源項目與 Safari 所用的 WebKit 引擎打造。它被戲稱爲「臃腫」的瀏覽器，但憑藉谷歌對廣告投放與品牌塑造的深厚功力，迅速崛起。Chrome 的關鍵武器並非功能，而是頻繁的版本更新節奏（每六周一次）與全平台統一體驗。2011 年 11 月，Chrome 首次超越 Firefox，市場份額達到 27%；六個月後，又反超 IE，完成了從挑戰者到主宰者的轉變。與此同時，中國的移動互聯網也在形成自己的生態系統。阿裏巴巴旗下的 UC 瀏覽器在 2010 年代初迅速躥紅，尤其是在印度、印尼、中國等新興市場，依靠輕量級設計、壓縮數據節省流量等特性，贏得了低端設備用戶的青睞。2015 年，其全球移動瀏覽器市場份額突破 17%，在印度一度高達 46%。但這場勝利並不持久。隨着印度政府加強對中國應用的安全審查，UC 瀏覽器被迫退出關鍵市場，逐漸失去往日輝煌。進入 2020 年代，Chrome 的主導地位已經確立，全球市場份額穩定在約 65%。值得注意的是，Google 搜索引擎與 Chrome 瀏覽器雖然同屬 Alphabet，但從市場層面看卻是兩個獨立的霸權體系 — — 前者控制了全球約九成的搜索入口，後者則掌握了大多數用戶進入網路的「第一窗口」。爲了守住這一雙重壟斷結構，谷歌不惜重金投入。2022 年，Alphabet 向蘋果支付約 200 億美元，只爲讓 Google 保持在 Safari 中的默認搜索地位。有分析指出，這筆支出相當於谷歌從 Safari 流量中獲取搜索廣告收入的 36%。換言之，谷歌正爲護城河支付「保護費」。但風向又一次變化。隨着大型語言模型（LLM）的崛起，傳統搜索開始受到衝擊。2024 年，Google 的搜索市場份額自 93% 跌至 89%，雖仍稱霸，但裂痕初現。更具顛覆性的，是關於蘋果或將推出自有 AI 搜索引擎的傳聞 — — 若 Safari 默認搜索改投自家陣營，這不僅將改寫生態格局，更可能撼動 Alphabet 的利潤支柱。市場反應迅速，Alphabet 股價從 170 美元應聲下跌至 140 美元，反映的不僅是投資者的恐慌，更是對搜索時代未來走向的深度不安。從 Navigator 到 Chrome，從開源理想到廣告商業化，從輕量瀏覽器到 AI 搜索助手，瀏覽器之爭始終是一場關於技術、平台、內容與控制權的戰爭。戰場不斷遷移，但本質從未改變：誰掌握入口，誰就定義未來。在 VC 眼中，依托 LLM 和 AI 時代人們對搜索引擎的新需求，第三次瀏覽器戰爭正在逐步展開。以下是部分知名 AI 瀏覽器賽道的項目的融資情況。### 現代瀏覽器的老舊架構談及瀏覽器的架構，經典的傳統架構如下圖所示：**客戶端 — 前端入口**查詢經 HTTPS 送達最近的 Google Front End，完成 TLS 解密、QoS 採樣和地理路由。若檢測到異常流量（DDoS、自動抓取）可在此層限流或挑戰。**查詢理解**前端需要理解用戶鍵入的單詞的含義，有三個步驟：神經拼寫校正，將 「recpie」 糾正爲 「recipe」；同義詞擴展，將「how to fix bike」，拓展到「repair bicycle」。意圖解析，判定查詢是資訊、導航還是交易意圖，並分配 Vertical請求。**候選召回**Google 使用的查詢技術被稱爲：倒排索引。在正序索引中，我們都是給定一個 ID 就可以索引到文件。但是用戶不可能知道想要的內容在上千億個文件中的編號，因此其採用了非常傳統的倒排索引，通過內容來查詢到哪些文件有對應的關鍵字。接下來，Google 採用向量索引用於處理語義搜索，即查找與查詢含義相似的內容。它將文本、圖像等內容轉換爲高維向量（embedding），並根據這些向量之間的相似性進行搜索。例如，即使用戶搜索「如何制作披薩面團」，搜索引擎也能返回與「披薩面團制作指南」相關的結果，因爲它們在語義上相似。經歷了倒排索引和向量索引，大約十萬量級的網頁會被初篩出來。**多級排序**系統通常通過 BM25、TF-IDF、頁面質量分等數千維輕特徵，將十萬級規模的候選頁面篩選至約 1000 篇，構成初步候選集。這類系統被統稱爲推薦引擎。其依賴多種實體生成的海量特徵，包括用戶行爲、頁面屬性、查詢意圖與上下文信號。例如，Google 會綜合用戶歷史、其他用戶的行爲反饋、頁面語義、查詢含義等信息，同時還考慮上下文要素，如時間（一天中時段、一周中的具體日子）與實時新聞等外部事件。**深度學習進行主排序**在初步檢索階段，Google 使用 RankBrain 和 Neural Matching 等技術來理解查詢的語義，並從海量文檔中篩選出初步相關的結果。RankBrain 是 Google 於 2015 年引入的機器學習系統，旨在更好地理解用戶查詢的含義，尤其是首次出現的查詢。它通過將查詢和文檔轉換爲向量表示，計算它們之間的相似性，從而找到最相關的結果。例如，對於查詢「如何制作披薩面團」，即使文檔中沒有完全匹配的關鍵詞，RankBrain 也能識別出與「披薩基礎」或「面團制作」相關的內容。Neural Matching 是 Google 於 2018 年推出的另一項技術，旨在更深入地理解查詢和文檔之間的語義關係。它使用神經網路模型來捕捉詞語之間的模糊關係，幫助 Google 更好地匹配查詢和網頁內容。例如，對於查詢「爲什麼我的筆記本電腦風扇聲音很大」，Neural Matching 能夠理解用戶可能在尋找有關過熱、灰塵積聚或高 CPU 使用率的故障排除信息，即使這些詞語沒有直接出現在查詢中。**深度重排：BERT 模型的應用**在初步篩選出相關文檔後，Google 使用 BERT（Bidirectional Encoder Representations from Transformers）模型對這些文檔進行更精細的排序，以確保最相關的結果排在前面。BERT 是一種基於 Transformer 的預訓練語言模型，能夠理解詞語在句子中的上下文關係。在搜索中，BERT 被用於重新排序初步檢索到的文檔。它通過對查詢和文檔進行聯合編碼，計算它們之間的相關性得分，從而對文檔進行重新排序。例如，對於查詢「停車在沒有路緣的坡道上」，BERT 能夠理解「沒有路緣」的含義，並返回建議駕駛員將車輪朝向路邊的頁面，而不是誤解爲有路緣的情況。而對於 SEO 工程師來說，就是需要精確的學習 Google 排序和機器學習的推薦算法，來針對性的優化網頁內容重而獲得更高的排名展示。以上就是典型的 Google 搜索引擎的工作流程。但是在當前的 AI 和大數據爆發的時代，用戶對瀏覽器的交互產生了新的需求。### 爲什麼 AI會重塑瀏覽器首先我們需要明確，爲什麼瀏覽器這一形態仍然會存在？是否存在一種第三形態，除了人工智能代理和瀏覽器之外的選擇？我們認爲，存在即無法替代。爲什麼人工智能能夠使用瀏覽器，卻無法完全取代瀏覽器？因爲瀏覽器是通用平台，不僅僅是讀取數據的入口，更是輸入數據的通用入口。這個世界不可能只有信息輸入，還必須產生數據並與網站進行交互，所以整合個性化用戶信息的瀏覽器仍將廣泛存在。我們抓住這個點：瀏覽器作爲通用入口，不僅用於讀取數據，用戶往往還需要與數據進行交互。瀏覽器本身是存儲用戶指紋的絕佳場所。更復雜的用戶行爲和自動化行爲，必須以瀏覽器爲載體。瀏覽器可以存儲用戶的所有行爲指紋、通行證等隱私信息，在自動化過程中實現無需信任的調用。而與數據交互的動作，可以演變爲：用戶 → 調用 AI Agent →瀏覽器。也就是說，唯一可能被取代的部分，是符合世界演變趨勢的方向 — — 更智能化、更個性化、以及更自動化。誠然，這部分可以交給 AI Agent 來處理，但 AI Agent 本身絕非適合承載用戶個性化內容的場所，因爲其在數據安全與便捷性方面面臨多重挑戰。具體而言：瀏覽器是個性化內容的存儲場所：* 多數大型模型托管在雲端，會話上下文依賴服務器保存，難以直接調用本機密碼、錢包、Cookie 等敏感數據。* 將全部瀏覽和支付數據送往第三方模型，需重新獲得用戶授權；歐盟《DMA》與美國州級隱私法均要求數據最小化出境。* 自動填寫雙重驗證驗證碼、調用攝像頭或利用 GPU 進行 WebGPU 推理，都必須在瀏覽器沙盒內完成。* 數據上下文高度依賴瀏覽器，包括標籤頁、Cookie、IndexedDB、Service Worker Cache、Passkey 憑據以及擴展數據，都沉澱在瀏覽器中。### 交互形式的深刻變革回到剛開始的話題，我們使用瀏覽器的行爲大致可以分爲三種形式：讀取數據、輸入數據、交互數據。人工智能大模型（LLM）已經深刻改變了我們讀取數據的效率和方式，過去用戶基於關鍵詞搜索網頁的行爲顯得非常老舊且低效。針對用戶搜索行爲的演化 — — 是獲取總結答案，還是點擊網頁，已經有不少研究進行分析。在用戶的行爲模式方面，2024 年的研究顯示，在美國每 1,000 次 Google 查詢中，只有 374 次最終點擊開放網頁。換言之，近 63% 屬於「零點擊」行爲。用戶習慣直接從搜索結果頁獲取天氣、匯率、知識卡片等信息。在用戶的心理方面，一項 2023 年的調查指出，44% 受訪者認爲常規自然結果比精選摘要（featured snippet）更值得信賴。學術研究也發現，在存在爭議或無統一真相的議題中，用戶更偏好包含多來源連結的結果頁。也就是說，確實有一部分用戶對 AI 摘要的信賴度不高，但也有相當比例的用戶行爲已經轉向「零點擊」。所以，AI 瀏覽器仍然需要探索一個恰當的交互形態 — — 特別是在數據讀取這一部分，因爲當前大模型的「幻覺問題」（hallucination）仍未根除，許多用戶仍難以完全信任自動生成的內容摘要。在這方面，如果將大模型嵌入瀏覽器，實際上不需要對瀏覽器進行顛覆性變革，只需逐步解決模型的準確性與可控性，這項改進也正在持續推進中。而真正可能觸發瀏覽器大規模變革的，是數據交互這一層。過去人們通過輸入關鍵字完成交互 — — 這是瀏覽器能理解的極限。而現在，用戶越來越傾向於使用一整段自然語言描述復雜任務，比如：* 「尋找紐約到洛杉磯某個時間段的直飛機票」* 「尋找紐約飛上海然後到洛杉磯的機票」這些行爲，即使對人類來說也需要耗費大量時間去訪問多個網站、收集與比較數據。但這些 Agentic Tasks（代理任務）正在逐步被 AI Agent接管。這也符合歷史演進的方向：自動化與智能化。人們渴望解放雙手，AI Agent 必將深度嵌入瀏覽器。未來的瀏覽器必須爲全自動化而設計，尤其要考慮：* 如何兼顧人類閱讀體驗與 AI Agent可解析性，* 如何在同一個頁面上，既服務於用戶，也服務於代理模型。只有滿足這兩者的設計，瀏覽器才能真正成爲 AI Agent 執行任務的穩定載體。接下來，我們將聚焦五個備受關注的項目，包括 Browser Use、Arc（The Browser Company）、Perplexity、Brave 以及 Donut。這些項目分別代表了 AI 瀏覽器的未來演進方向，及其在 Web3 和 Crypto 場景中的原生結合潛力。#### **Browser Use**這正是 Perplexity 和 Browser Use 獲得巨額融資背後的核心邏輯所在。尤其是 Browser Use，是 2025 年上半年湧現出的第二個最具確定性與增長潛力的創新機會。Browser 是構建了一個真正意義上的語義層，其核心在於爲下一代瀏覽器構建了語義識別架構。Browser Use 把傳統「DOM＝給人看的節點樹」重新解碼成「語義 DOM＝給 LLM 看的指令樹」，讓代理無需「看片點坐標」就能精準點擊、填寫與上傳；這條路線以「結構化文本 → 函數調用」取代視覺 OCR 或坐標 Selenium，所以執行更快、token 更省、出錯更少。TechCrunch 稱之爲「讓 AI 真正讀懂網頁的膠水層」，而 3 月完成的 1700 萬美元種子輪正是押注這一底層革新。HTML 渲染後形成標準 DOM 樹；瀏覽器再派生一棵 accessibility tree，爲屏幕閱讀器提供更豐富的「角色」與「狀態」標籤。* 把每個可交互元素（, 等）抽象成 JSON 片段，附帶 角色、可見性、坐標、可執行動作 等元數據；* 將整棵頁面轉譯成扁平化「語義節點清單」，供 LLM 在系統提示裏一次性讀取；* 接收 LLM 輸出的高層指令（如 click(node\_id=「btn-Checkout」)），回放到真瀏覽器。官方博客把這個過程稱作「把網站接口變成 LLM 可解析的 structured text」同時，一旦這套標準被引入 W3C，那麼可以很大程度上解決瀏覽器輸入的問題。我們以 The Browser Company 的公開信和案例，來進一步闡述爲什麼 The Browser Company 的想法是錯誤的。#### **ARC**The Browser Company (Arc 母公司 ) 在其公開信中表示，ARC 瀏覽器將進入常規維護階段，團隊將重心會放在完全面向 AI 的瀏覽器 DIA。信中也坦言，目前尚未確定 DIA 的具體實現路徑。同時，團隊在信中提出了若幹對未來瀏覽器市場的預測。基於這些預測，我們進一步認爲，若要真正顛覆現有瀏覽器格局，關鍵在於對交互側的輸出做出改變。以下是我們截取的三個來自 ARC 團隊對未來瀏覽器市場的預測。首先，其認爲 Webpages 不再成爲主要的交互界面。不可否認，這是一個具有挑戰性的判斷，也正是我們對其創始人反思結果持保留態度的關鍵所在。在我們看來，該觀點顯著低估了瀏覽器的作用，也正是其在探索 AI 瀏覽器路徑時忽視的關鍵問題。大模型在意圖捕捉方面表現優異，例如理解「幫我訂機票」這樣的指令。然而，在信息密度承載能力上，它們仍顯不足。當用戶需要一個如儀表盤、彭博終端風格的記事本，或類似 Figma 的可視化畫布時，沒有什麼能比像素級精度排列的專用網頁更具優勢。每款產品都量身定制的人體工程學設計 — — 圖表、拖放功能、熱鍵 — — 並非裝飾性的浮渣，而是壓縮認知的可供性。這些能力是簡單對話式交互無法承載的。以 Gate.com 爲例，若用戶希望進行投資操作，僅依賴 AI 對話遠遠不夠，因爲用戶對信息輸入、精度與結構化呈現有着高度依賴。RC 團隊在其路徑設想中存在一個本質性偏差，即未能清晰地區分「交互」由輸入與輸出兩個維度構成。在輸入側，其觀點在某些場景下具有一定合理性，AI 的確可以提升指令式交互的效率；但在輸出側，該判斷明顯失衡，忽略了瀏覽器在信息呈現與個性化體驗中的核心作用。例如，Reddit 擁有其獨特的布局方式和信息架構，而 AAVE 則有着完全不同的界面與結構。瀏覽器作爲一個既容納高度私密性數據，又能通用渲染多樣化產品界面的平台，瀏覽器在輸入層的替代性本就有限，而在輸出側，其復雜性與不可標準化特性更使其難以被顛覆。相較之下，當前市面上的 AI 瀏覽器更多集中在「輸出總結」層面：摘要網頁、提煉信息、生成結論，尚不足以構成對 Google 等主流瀏覽器或搜索體系的根本性挑戰，分瓜的也只是搜索總結的市場份額。**因此，真正能夠撼動市佔率高達 66% 的 Chrome 的，注定不會是「下一個 Chrome」。要實現這一顛覆，必須對瀏覽器的渲染模式進行根本性重塑，使其能夠適配智能時代 AI Agent 主導下的交互需求，尤其是在輸入側的架構設計上。正因如此，我們更認可 Browser Use 所採取的技術路徑 — — 其關注點在於瀏覽器底層機制的結構性變革。任何系統一旦實現「原子化」或「模塊化」，其由此衍生出的可編程性與組合性將帶來極具破壞力的顛覆潛力，而這正是 Browser Use 當前所推進的方向。**總結而言，AI Agent 的運行仍高度依賴瀏覽器的存在。瀏覽器不僅是復雜個性化數據的主要存儲場所，也是多樣化應用的通用渲染界面，因此將在未來繼續作爲核心交互入口。隨着 AI Agent 深度嵌入瀏覽器以完成固定任務，其將通過調用用戶數據與特定應用進行交互，即主要作用於輸入側。爲此，瀏覽器的現有渲染模式需進行創新，以實現對 AI Agent 的最大程度兼容與適配，從而更有效地捕捉應用。#### **Perplexity**Perplexity 是一個以其推薦系統著稱的 AI 搜索引擎，最新估值高達 140 億美元，較 2024 年 6 月的 30 億美元增長近 5 倍。月均處理搜索查詢量超過 4 億次，2024 年 9 月處理了約 2.5 億次查詢，用戶查詢量同比增長 8 倍，月活躍用戶超過 3000萬。其主要的特點是能夠實時的總結頁面，在獲取即時信息方面佔據優勢。今年初，其開始構建自己的原生瀏覽器 Comet。Perplexity 把即將發布的 Comet 描述成一個不僅「顯示」網頁、更能「思考」網頁的瀏覽器。官方稱它將在瀏覽器內部深度嵌入 Perplexity 的答案引擎，這是喬布斯式的「整機」思路：將 AI 任務深埋到瀏覽器底層，而非做側邊欄插件。用帶引用的簡潔答案取代傳統的「十條藍色連結」，直接與 Chrome競爭。但其仍需解決兩個核心問題：高搜索成本以及來自邊際用戶的低利潤率。盡管 Perplexity 在 AI 搜索領域已處於領先位置，但 Google 在 2025 年 I/O 大會上同樣宣布對其核心產品進行大規模智能化重塑。針對瀏覽器的重塑，Google 推出了一個新的瀏覽器標籤頁體驗，名爲 AI Model，集成了 Overview、Deep Research 以及未來的 Agentic 功能，整體項目被稱爲 「Project Mariner」。Google 正在積極的進行 AI 重塑，因此僅憑表層的功能模仿，例如 Overview、DeepResearch 或 Agentics，難以真正對其構成威脅。真正有可能在混沌中建立新秩序的，將是從底層重構瀏覽器架構、將大語言模型（LLM）深度嵌入瀏覽器內核，在交互方式上實現根本性的變革。#### **Brave**Brave是 Crypto 行業裏面最早期也是最成功的瀏覽器，其基於 Chromium 架構，因此能夠兼容 Google Store 上的插件。其依靠隱私和瀏覽賺取 Tokens 這一模式來吸引用戶。Brave 的發展路徑在一定程度上展現了其成長潛力。但是從產品角度來看，隱私固然重要，但其需求仍主要集中於特定用戶羣體，對大衆而言隱私意識尚未成爲主流決策因素。因此，試圖依靠該特性顛覆現有巨頭的可能性較低。截至目前，Brave 的月活躍用戶已達到 8,270 萬，日活躍用戶爲 3,560 萬，市場份額約爲 1%–1.5%。用戶規模呈持續增長態勢：從 2019 年 7 月的 600 萬，增長至 2021 年 1 月的 2,500 萬，2023 年 1 月達 5,700 萬，至 2025 年 2 月突破 8,200 萬，年均復合增長率仍維持在兩位數水平。其月均搜索查詢量約爲 13.4 億次，約爲 Google 的0.3%。以下是 Brave 的迭代路線圖。Brave 正計劃升級爲隱私優先的 AI 瀏覽器。然而，受限於其獲取用戶數據較少，導致大模型的可定制化程度較低，反而不利於實現快速且精準的產品迭代。在即將到來的 Agentic Browser 時代，Brave 或將在特定注重隱私的用戶羣體中保有穩定份額，但難以成爲主要玩家。其 AI 助手 Leo 更類似於外掛插件，僅在現有產品基礎上進行功能性增強，具備一定的內容總結能力，但尚無全面轉向 AI Agent 的明確戰略，交互層面的革新仍顯不足。#### **Donut**近期，Crypto 行業在 Agentic Browser 領域亦有所進展。初創項目 Donut 於 Pre-seed 輪獲得了 700 萬美元融資，由紅杉中國（Hongshan）、HackVC 與 Bitkraft Ventures 共同領投。目前項目仍處於早期構想階段，願景在於實現「探索 — 決策 — 加密原生執行」（Discovery, Decision-making, and Crypto-native Execution）的一體化能力。這一方向的核心在於結合加密原生的自動化執行路徑。正如 a16z 所預言，未來 Agent 有望取代搜索引擎成爲主要流量入口，創業者將不再圍繞 Google 排序算法展開競爭，而是爭奪由 Agent 執行所帶來的訪問和轉化流量。業界已將這一趨勢稱爲「AEO」（Answer / Agent Engine Optimization），或更進一步的「ATF」（Agentic Task Fulfilment），即不再優化搜索排名，而是直接服務於能夠替用戶完成下單、訂票、寫信等任務的智能模型。### 給創業者首先，必須承認：Browser 本身依舊是互聯網世界最大的未被重構的「總入口」。全球桌面用戶約 21 億、移動端超 43 億，它是數據輸入、交互行爲、個性化指紋存儲的共同載體。這個形態之所以存續，不是因爲慣性，而是因爲瀏覽器天然具備雙向屬性：既是數據「讀入口」，也是行爲「寫出口」。因此，對於創業者而言，真正具備顛覆潛力的並非「頁面輸出」層面的優化。即便能在新標籤頁中實現類似 Google 的 AI 概覽功能，本質上仍屬於瀏覽器插件層的迭代，尚未構成範式的根本性變革。真正的突破口在於「輸入側」 — — 即如何使 AI Agent 主動調用創業者的產品，以完成具體任務。這將成爲未來產品能否嵌入 Agent 生態、獲得流量與價值分配的關鍵。搜索時代拼「點擊」；代理時代拼「調用」。如果你是一名創業者，不妨把你的產品重新想象成一顆 API 組件 — — 讓智能體不僅能「讀懂」它，更能「調用」它。這就要求你在產品設計一開始就考慮三個維度：**一、接口結構標準化：你的產品是「可調用」的麼？**產品是否具備被智能體調用的能力，取決於其信息結構能否標準化並抽象爲明確的 schema。例如，用戶註冊、下單按鈕、評論提交等關鍵操作，是否可通過語義化的 DOM 結構或 JSON 映射進行描述？系統是否提供狀態機，使 Agent 能夠穩定復現用戶行爲流程？用戶在頁面上的交互是否支持腳本化還原？是否具備穩定訪問的 WebHook 或 API Endpoint？這正是 Browser Use 融資成功的本質原因 — — 它將瀏覽器從平鋪渲染的 HTML 轉變爲一棵可被 LLM 調用的語義樹。對於創業者而言，在網頁產品中引入類似的設計理念，即是在爲 AI Agent 時代進行結構化適配。**二、身分與通行：你能幫 Agent「越過信任障壁」嗎？**AI 代理要完成交易、調用支付或資產，需要某種可信中間層 — — 你能成爲它嗎？瀏覽器天然可以讀取本地存儲、調用錢包、識別驗證碼、接入雙因子驗證，這正是它比雲端大模型更適合做執行的原因。在 Web3 場景中尤其如此：調用鏈上資產的接口標準並不統一，Agent 若無「身分」或「籤名能力」，將寸步難行。所以，對 Crypto 創業者而言，這裏有一個極具想象力的空白區：「區塊鏈世界的 MCP（Multi Capability Platform）」。這既可以是一個通用指令層（讓 Agent 調用 Dapp），也可以是標準化的合約接口集，甚至是某種運行在本地的輕量錢包 + 身分中臺。**三、流量機制的再理解：未來不是 SEO，是 AEO /ATF**過去你要爭取 Google 的算法青睞；現在你要被 AI Agent 嵌入進任務鏈裏。這意味着產品要有清晰任務顆粒度：不是一個「頁面」，而是一串「可調用能力單元」；意味着你要開始做 Agent 優化（AEO）或任務調度適配（ATF）：例如註冊流程是否可簡化爲結構化步驟、定價是否可通過接口拉取、庫存是否實時可查；你甚至要開始適配不同 LLM 框架下的調用語法 — — OpenAI 和 Claude 對函數調用、tool usage 的偏好並不一致。Chrome 是通往舊世界的終端，而不是通往新世界的入口。真正有未來的創業項目，不是再造一個瀏覽器，而是讓現有瀏覽器爲 Agent 服務，爲新一代的「指令流」建立橋梁。* 你要構建的，是 Agent 調用你的世界的「接口語法」；* 你要爭取的，是成爲智能體信任鏈中的一個環節；* 你要搭建的，是下一個搜索模式裏的「API 城堡」。如果說 Web2 是靠 UI 抓住用戶的注意力，那 Web3 + AI Agent 時代，就是靠調用鏈抓住 Agent的執行意圖。