Третя війна браузерів тихо розгортається. Оглядаючи історію, від Netscape 90-х, Internet Explorer від Microsoft, до Firefox з відкритим кодом та Chrome від Google, суперечка браузерів завжди була концентрованим відображенням контролю над платформою та зміни технологічних парадигм. Chrome здобув панівну позицію завдяки швидкості оновлень та екологічній взаємодії, тоді як Google через «подвійний олігопол» у пошуку та браузері сформував замкнене коло інформаційного входу.
Але сьогодні ця структура починає хитатися. Зростання великих мовних моделей (LLM) призводить до того, що все більше користувачів виконують завдання на сторінках результатів пошуку «нульовими кліками», традиційна поведінка кліків на веб-сторінках зменшується. Тим часом, чутки про намір Apple замінити пошукову систему за замовчуванням у Safari ще більше загрожують прибутковій основі материнської компанії Alphabet (Google ), ринок вже починає проявляти занепокоєння щодо «правильного» пошуку.
Браузер сам також стикається з перетворенням ролі. Він більше не просто інструмент для відображення веб-сторінок, а й контейнер, що об'єднує різноманітні можливості, такі як введення даних, поведінка користувачів, конфіденційність та ідентичність. AI Agent хоча й потужний, але для виконання складних взаємодій на сторінці, виклику локальних даних про ідентичність та контролю елементів веб-сторінки, все ще потрібно покладатися на довірчі межі та функціональні пісочниці браузера. Браузер перетворюється з інтерфейсу для людей на платформу системних викликів для Agent.
У цій статті ми досліджуємо, чи ще є потреба в браузерах, і одночасно вважаємо, що справжнім фактором, який може змінити поточну структуру ринку браузерів, є не ще один «кращий Chrome», а нова структура взаємодії: не демонстрація інформації, а виклик завдань. У майбутньому браузери повинні бути спроектовані для AI Agent — не лише читати, а й писати та виконувати. Проекти, такі як Browser Use, намагаються семантизувати структуру сторінок, перетворюючи візуальний інтерфейс на структурований текст, який може бути викликаний LLM, що значно знижує вартість взаємодії.
Основні проекти на ринку вже почали експериментувати: Perplexity створює нативний браузер Comet, використовуючи ШІ замість традиційних результатів пошуку; Brave поєднує захист конфіденційності з локальними висновками, використовуючи LLM для покращення функцій пошуку та блокування; а такі криптоорієнтовані проекти, як Donut, намагаються знайти нові точки входу для взаємодії між ШІ та активами на блокчейні. Спільною рисою цих проектів є прагнення перебудувати вхідну частину браузера, а не покращувати його вихідний шар.
Для підприємців можливості приховані в трикутних відносинах між введенням, структурою та агентом. Браузер як інтерфейс для виклику світу майбутнього агентів означає, що той, хто може надати структуровані, викликаємої та надійні «блоки можливостей», той може стати частиною нової генерації платформ. Від SEO до AEO (оптимізація двигунів агентів), від трафіку на сторінці до викликів завдань, форма продукту та дизайнерське мислення перебудовуються. Третя війна браузерів відбувається в «введенні», а не в «відображенні»; вирішальним фактором більше не є те, хто приваблює увагу користувача, а хто здобуває довіру агента і отримує доступ до виклику.
Історія розвитку браузерів
На початку 90-х років минулого століття, коли Інтернет ще не став частиною повсякденного життя, з'явився Netscape Navigator, немов корабель, що відкриває нові землі, відкриваючи мільйонам користувачів двері у цифровий світ. Цей браузер не був першим, але став першим продуктом, який справді вийшов на маси та сформував досвід користування Інтернетом. Тоді люди вперше могли так легко переглядати веб-сторінки через графічний інтерфейс, немов весь світ раптом став доступним.
Однак, блискучість зазвичай є короткочасною. Microsoft швидко усвідомила важливість браузерів і вирішила примусово зв'язати Internet Explorer з операційною системою Windows, зробивши його браузером за замовчуванням. Ця стратегія вважається «вбивцею платформ», яка безпосередньо підірвала домінування Netscape на ринку. Багато користувачів не обирали IE добровільно, а просто приймали його через те, що він був встановлений за замовчуванням. IE завдяки можливостям розповсюдження Windows швидко став лідером галузі, тоді як Netscape потрапила на шлях занепаду.
У скрутному становищі інженери Netscape обрали радикальний та ідеалістичний шлях — вони відкрили вихідний код браузера та звернулися до спільноти з відкритим кодом. Це рішення стало схоже на «македонську поступку» в технічному світі, що передбачало кінець старої ери та піднесення нових сил. Цей код згодом став основою проекту браузера Mozilla, спочатку названого Phoenix (в перекладі «фенікс»), але через проблеми з торговими марками кілька разів змінював назву, врешті решт отримавши назву Firefox.
Firefox не є простим копіюванням Netscape, він досяг численних проривів у користувацькому досвіді, екосистемі плагінів, безпеці та інших аспектах. Його народження стало знаковою перемогою відкритого коду і надало нову енергію всій індустрії. Дехто описує Firefox як «духовного спадкоємця» Netscape, подібно до того, як Османська імперія успадкувала останки Візантії. Це порівняння, хоч і перебільшене, але має глибокий сенс.
Але за кілька років до офіційного випуску Firefox, Microsoft вже випустила шість версій IE, скориставшись перевагою часу та стратегією пакетної поставки системи, що змусило Firefox з самого початку зайняти позицію наздоганяючого, що прирекло це змагання на нерівні стартові позиції.
В той же час, ще один ранній гравець тихо з'являється на горизонті. У 1994 році з'явився браузер Opera, який походить з Норвегії і спочатку був експериментальним проектом. Але з версії 7.0 у 2003 році він впровадив власний двигун Presto, вперше підтримуючи CSS, адаптивну верстку, голосове управління та кодування Unicode, а також інші передові технології. Хоча кількість користувачів була обмеженою, технологічно він завжди випереджав галузь, ставши «улюбленцем гіків».
Того ж року Apple випустила браузер Safari. Це був поворотний момент. Тоді Microsoft інвестувала 150 мільйонів доларів в Apple, яка була на межі банкрутства, щоб зберегти видимість конкуренції та уникнути антимонопольного розслідування. Хоча з моменту свого створення за замовчуванням пошуковою системою Safari був Google, ця історія з Microsoft символізує складні та тонкі відносини між інтернет-гігантами: співпраця та конкуренція завжди йдуть поруч.
У 2007 році IE7 вийшов разом з Windows Vista, але ринкові відгуки були посередніми. Натомість Firefox, завдяки більш швидкому темпу оновлень, більш дружній механіці розширень та природній привабливості для розробників, поступово збільшив свою частку на ринку до приблизно 20%. Панування IE поступово послаблюється, напрямок змінюється.
Google має інший підхід. Хоча розробка власного браузера почалася ще в 2001 році, знадобилося шість років, щоб переконати генерального директора Еріка Шмідта затвердити цей проект. Chrome з'явився у 2008 році, створений на основі відкритого проекту Chromium та веб-двигуна WebKit, що використовується в Safari. Його називали "громіздким" браузером, але завдяки глибоким навичкам Google у рекламі та брендингу, він швидко зріс.
Ключовою зброєю Chrome є не функції, а частота оновлень версій (кожні шість тижнів) та єдиний досвід на всіх платформах. У листопаді 2011 року Chrome вперше перевищив Firefox, досягнувши частки ринку 27%; через шість місяців він знову обігнав IE, завершивши перехід від викликувач до домінуючого.
Водночас, мобільний інтернет Китаю також формує власну екосистему. Браузер UC, що належить Alibaba, швидко набрав популярність на початку 2010-х років, особливо на ринках, що розвиваються, таких як Індія, Індонезія та Китай, завдяки легкому дизайну, стисненню даних для збереження трафіку та іншим характеристикам, які приваблювали користувачів низькобюджетних пристроїв. У 2015 році його частка на глобальному ринку мобільних браузерів перевищила 17%, а в Індії сягала 46%. Але ця перемога не була тривалою. З посиленням урядом Індії перевірок безпеки китайських додатків, UC браузер змушений був вийти з ключового ринку і поступово втратив колишню славу.
У 2020-х роках домінування Chrome вже закріпилося, а частка на світовому ринку стабільно становить близько 65%. Варто зазначити, що пошукова система Google та веб-браузер Chrome, хоча й належать до Alphabet, з точки зору ринку є двома незалежними гегемоніями — перша контролює близько 90% пошукових входів у світі, а друга володіє більшістю користувачів, які входять в Інтернет через «перше вікно».
Щоб зберегти цю подвійну монопольну структуру, Google не шкодує витрат. У 2022 році Alphabet сплатила Apple приблизно 20 мільярдів доларів лише для того, щоб Google залишався за замовчуванням пошуковою системою в Safari. Деякі аналітики зазначили, що ці витрати становлять 36% від доходу Google від пошукової реклами з трафіку Safari. Іншими словами, Google платить "охоронний внесок" за свою захисну стіну.
Але напрямок вітру знову змінився. Зі зростанням великих мовних моделей (LLM) традиційний пошук починає зазнавати ударів. У 2024 році частка ринку пошуку Google впала з 93% до 89%, хоча вона все ще домінує, але тріщини вже з'явилися. Ще більш руйнівними є чутки про те, що Apple може запустити власну AI пошукову систему — якщо Safari змінить свій за замовчуванням пошук на власний, це не лише перепише екосистему, але й може похитнути прибуткову опору Alphabet. Ринок швидко відреагував, акції Alphabet впали з 170 доларів до 140 доларів, що відображає не лише паніку інвесторів, але й глибоке занепокоєння щодо майбутнього ери пошуку.
Від Navigator до Chrome, від відкритих ідей до комерціалізації реклами, від легкого браузера до AI пошукового помічника, боротьба браузерів завжди була війною про технології, платформи, контент та контроль. Поле битви постійно переміщується, але сутність ніколи не змінюється: хто контролює вхід, той визначає майбутнє.
На думку венчурних капіталістів, спираючись на нові потреби людей у пошукових системах в епоху LLM і AI, третя війна браузерів поступово розгортається. Ось деякі відомі проекти на ринку AI браузерів та їх фінансування.
Стара архітектура сучасних браузерів
Говорячи про архітектуру браузера, класична традиційна архітектура зображена на малюнку нижче:
Клієнт — фронтенд вхід
Запит через HTTPS доставляється до найближчого Google Front End, де відбувається завершення TLS-розшифрування, вибірка QoS та географічний маршрутизація. Якщо виявлено аномальний трафік (DDoS, автоматичне збирання даних), його можна обмежити або кинути виклик на цьому рівні.
Розуміння запиту
Фронтенд повинен зрозуміти значення слів, введених користувачем, існує три етапи: нейронна перевірка орфографії, виправлення «recpie» на «recipe»; розширення синонімів, розширення «how to fix bike» до «repair bicycle». Аналіз намірів, визначення, чи є запит інформаційним, навігаційним чи торговим наміром, та призначення запиту Vertical.
Кандидат на відновлення
Технологія запитів, яку використовує Google, називається: зворотний індекс. У прямому індексі ми можемо знайти файл за заданим ID. Але користувачі не можуть знати номер вмісту серед тисяч мільярдів файлів, тому використовується дуже традиційний зворотний індекс, який дозволяє шукати файли за відповідними ключовими словами. Далі Google використовує векторний індекс для обробки семантичного пошуку, тобто для пошуку вмісту, що є схожим за значенням на запит. Це перетворює текст, зображення та інший вміст у високорозмірні вектори (embedding) і проводить пошук на основі схожості між цими векторами. Наприклад, навіть якщо користувач шукає «як приготувати тісто для піци», пошукова система може повернути результати, пов'язані з «посібником з приготування тіста для піци», оскільки вони семантично схожі. Після зворотного індексу та векторного індексу приблизно сто тисяч веб-сторінок проходять первинний відбір.
Багаторівневе сортування
Системи зазвичай через BM25, TF-IDF, оцінки якості сторінок та інші тисячі легких характеристик відбирають мільйонні кандидати до приблизно 1000 статей, формуючи попередній список кандидатів. Ці системи загально називаються рекомендаційними системами. Вони залежать від багатьох характеристик, згенерованих різними сутностями, включаючи поведінку користувачів, атрибути сторінок, наміри запиту та контекстуальні сигнали. Наприклад, Google враховує історію користувача, відгуки інших користувачів, семантику сторінок, значення запитів та іншу інформацію, а також контекстуальні фактори, такі як час (періоди дня, конкретні дні тижня) та зовнішні події, такі як останні новини.
Глибоке навчання для основної сортування
На початковому етапі пошуку Google використовує такі технології, як RankBrain та Neural Matching, щоб зрозуміти семантику запиту та вибрати попередньо релевантні результати з величезної кількості документів. RankBrain – це система машинного навчання, яку Google впровадив у 2015 році, щоб краще розуміти значення запитів користувачів, особливо запитів, які з'являються вперше. Вона перетворює запити та документи на векторні представлення, обчислюючи їхню схожість, щоб знайти найрелевантніші результати. Наприклад, для запиту «як приготувати тісто для піци», навіть якщо в документі немає точно збігаючих ключових слів, RankBrain може виявити зміст, пов'язаний з «основою піци» або «приготуванням тіста».
Neural Matching — це ще одна технологія, яку Google запровадив у 2018 році, що має на меті глибше зрозуміти семантичні зв'язки між запитами та документами. Вона використовує моделі нейронних мереж для виявлення неявних зв'язків між словами, що допомагає Google краще співвідносити запити та зміст веб-сторінок. Наприклад, для запиту «чому мій вентилятор ноутбука так голосно працює», Neural Matching може зрозуміти, що користувач, можливо, шукає інформацію про усунення неполадок, пов'язаних з перегрівом, скупченням пилу або високим використанням ЦП, навіть якщо ці слова не з'являються безпосередньо в запиті.
Глибока перестановка: застосування моделі BERT
Після попереднього відбору відповідних документів Google використовує модель BERT (Bidirectional Encoder Representations from Transformers) для більш детального ранжування цих документів, щоб забезпечити, що найрелевантніші результати з'являються на перших позиціях. BERT — це модель попереднього навчання на основі Transformer, яка здатна розуміти контекстуальні зв'язки слів у реченнях. У пошуку BERT використовується для повторного ранжування попередньо отриманих документів. Він виконує спільне кодування запиту та документа, обчислює їхню релевантність, щоб перенести документи в новий порядок. Наприклад, для запиту «паркування на схилі без бордюру» BERT може зрозуміти значення «без бордюру» і повернути сторінку, що радить водіям повернути колеса до краю дороги, а не неправильно інтерпретувати це як ситуацію з бордюром. А для SEO-інженерів це означає необхідність точно вивчити алгоритми ранжування Google та рекомендацій машинного навчання, щоб цілеспрямовано оптимізувати вміст веб-сторінок і отримати вищі позиції в показах.
Це типовий робочий процес пошукової системи Google. Але в умовах сучасної ери вибуху штучного інтелекту та великих даних, у користувачів з'явилися нові вимоги до взаємодії з браузером.
Чому ШІ перетворює браузери
По-перше, нам потрібно зрозуміти, чому така форма, як браузер, все ще існує? Чи існує третя форма, окрім агентів штучного інтелекту та браузерів?
Ми вважаємо, що існування є незамінним. Чому штучний інтелект може використовувати браузер, але не може повністю його замінити? Тому що браузер є універсальною платформою, яка є не лише входом для читання даних, але й універсальним входом для введення даних. У цьому світі не може бути лише введення інформації, також необхідно генерувати дані та взаємодіяти з веб-сайтами, тому браузер, який інтегрує персоналізовану інформацію користувача, все ще буде широко існувати.
Ми захоплюємо цю ідею: браузер як універсальний вхід, не тільки для читання даних, користувачам часто потрібно взаємодіяти з даними. Браузер сам по собі є відмінним місцем для зберігання відбитків пальців користувача. Складніші поведінки користувачів та автоматизовані дії повинні реалізовуватись через браузер. Браузер може зберігати всі відбитки поведінки користувачів, паролі та іншу приватну інформацію, реалізуючи бездокументний виклик в процесі автоматизації. А дії взаємодії з даними можуть еволюціонувати в:
Користувач → Виклик AI Agent → Браузер.
А це означає, що єдина частина, яка може бути замінена, — це напрямок, що відповідає світовим тенденціям розвитку — більш інтелектуальний, більш персоналізований та більш автоматизований. Звичайно, цю частину можна доручити AI Agent, але сам AI Agent зовсім не підходить для розміщення персоналізованого контенту користувачів, оскільки він стикається з численними викликами в питаннях безпеки даних і зручності. Конкретно кажучи:
Браузер є місцем зберігання персоналізованого контенту:
Більшість великих моделей розміщуються в хмарі, контекст сеансу залежить від збереження на сервері, що ускладнює безпосередній доступ до чутливих даних, таких як паролі, гаманці, Cookie тощо.
Всі дані про перегляд і оплату передаються третім особам, необхідно повторно отримати дозвіл користувача; Європейський Союз вимагає мінімізації даних під час їх передачі за межі, відповідно до «DMA», а також закони про конфіденційність на рівні штатів США.
Автоматичне заповнення коду двофакторної аутентифікації, виклик камери або використання GPU для WebGPU інференції повинні виконуватись у пісочниці браузера.
Контекст даних сильно залежить від браузера, включаючи вкладки, Cookie, IndexedDB, кеш службового працівника, облікові дані Passkey та дані розширення, які всі зберігаються в браузері.
глибока трансформація інтерактивних форм
Повертаючись до початкової теми, ми можемо умовно поділити поведінку користувачів браузера на три основні форми: читання даних, введення даних, взаємодія з даними. Великі моделі штучного інтелекту (LLM) суттєво змінили нашу ефективність і спосіб читання даних, адже раніше поведінка користувачів, що базувалася на пошуку веб-сторінок за ключовими словами, виглядала дуже застарілою та неефективною.
Еволюція поведінки пошуку користувачів — чи це отримання узагальнених відповідей, чи клікання на веб-сторінки, вже було проаналізовано в багатьох дослідженнях.
У дослідженні 2024 року щодо поведінки користувачів зазначається, що в США з кожних 1 000 запитів у Google лише 374 призводять до переходу на відкриту веб-сторінку. Іншими словами, майже 63% становлять "нульові кліки". Користувачі звикли отримувати інформацію про погоду, курси валют, картки знань тощо безпосередньо з сторінки результатів пошуку.
З точки зору психології користувачів, опитування 2023 року вказало, що 44% респондентів вважають, що звичайні природні результати більш надійні, ніж вибрані фрагменти (featured snippet). Академічні дослідження також виявили, що у випадках спірних чи без єдиного правди, користувачі надають перевагу результатам, що містять посилання з кількох джерел.
Це означає, що дійсно є частина користувачів, які не дуже довіряють резюме AI, але також є значна частина користувачів, чия поведінка вже змістилася в бік «нульового кліку». Тому браузеру AI все ще потрібно досліджувати відповідну форму взаємодії — особливо в частині читання даних, оскільки поточна проблема «галюцинацій» (hallucination) великої моделі ще не вирішена, і багато користувачів все ще важко повністю довіряти автоматично згенерованим резюме контенту. У цьому аспекті, якщо вбудувати велику модель у браузер, насправді не потрібно здійснювати руйнівні зміни в браузері, достатньо поступово вирішувати питання точності та керованості моделі, і це покращення також продовжує реалізовуватися.
А справжнім фактором, що може спровокувати масштабну революцію у браузерах, є рівень взаємодії даних. У минулому люди виконували взаємодію, вводячи ключові слова — це межа, яку може зрозуміти браузер. А зараз користувачі все більше схиляються до використання цілих фрагментів природної мови для опису складних завдань, наприклад:
«Знайти прямі авіаквитки з Нью-Йорка до Лос-Анджелеса на певний період часу»
«Знайти квитки з Нью-Йорка до Шанхаю, а потім до Лос-Анджелеса»
Ці дії, навіть для людей, потребують значної кількості часу для відвідування кількох веб-сайтів, збору та порівняння даних. Але ці агентні завдання поступово беруть на себе AI Agent.
Це також відповідає напрямку історичної еволюції: автоматизації та інтелектуалізації. Люди прагнуть звільнити свої руки, AI Agent обов'язково буде глибоко інтегрований у браузер. Майбутній браузер повинен бути спроектований для повної автоматизації, особливо з урахуванням:
Як поєднати досвід читання людини з можливістю розуміння AI Agent,
Як на одній сторінці обслуговувати як користувачів, так і агентні моделі.
Лише задовольняючи ці два вимоги, браузер може стати справжнім стабільним носієм для виконання завдань AI Agent.
Далі ми зосередимося на п'яти найактивніших проектах, включаючи Browser Use, Arc (The Browser Company), Perplexity, Brave та Donut. Ці проекти відповідно представляють майбутню еволюцію AI браузерів та їхній потенціал для нативної інтеграції у Web3 та крипто-сценах.
Використання браузера
Це саме є основною логікою, що стоїть за величезним фінансуванням Perplexity і Browser Use. Особливо Browser Use, це друга найбільш певна та зростаюча інноваційна можливість, що з'явилася в першій половині 2025 року.
Browser є справжнім семантичним шаром, основою якого є семантична розпізнавальна архітектура для наступного покоління браузерів.
Browser Use перетворює традиційне «DOM=дерево вузлів для людей» на «семантичне DOM=дерево інструкцій для LLM», дозволяючи агенту точно натискати, заповнювати та завантажувати без необхідності «переглядати координати точок». Цей маршрут замінює візуальне OCR або координатний Selenium на «структурований текст → виклик функцій», тому виконання проходить швидше, токенів витрачається менше, а помилок виникає менше. TechCrunch називає це «клеєм, який справді допомагає AI зрозуміти веб-сторінки», а 17 мільйонів доларів, зібраних у березні, є ставкою на цю основну інновацію.
HTML рендериться у стандартне дерево DOM; браузер потім створює дерево доступності, щоб надати екранним зчитувачам більш багаті «ролі» та «статуси».
Абстрагувати кожен інтерактивний елемент (наприклад, , тощо) у JSON-фрагменти, супроводжуючи їх метаданими, такими як роль, видимість, координати, виконувані дії тощо;
Перекласти всю сторінку в спрощений «список семантичних вузлів», щоб LLM міг одноразово зчитувати його в системному запиті;
Отримання високорівневих команд з виходу LLM (наприклад, click(node_id=「btn-Checkout」)) та відтворення їх у справжньому браузері. Офіційний блог називає цей процес «перетворення інтерфейсу сайту в структурований текст, зрозумілий LLM»
Водночас, як тільки цей стандарт буде введено в W3C, це може значно вирішити проблеми вводу в браузерах. Ми використовуємо відкритий лист і випадок The Browser Company, щоб далі пояснити, чому ідея The Browser Company є помилковою.
ARC
Компанія Browser (Arc, материнська компанія ), у своєму відкритому листі повідомила, що браузер ARC перейде в стадію регулярного обслуговування, а команда зосередиться на повністю AI-орієнтованому браузері DIA. У листі також зазначається, що наразі не визначено конкретний шлях реалізації DIA. Водночас команда в листі висловила кілька прогнозів щодо майбутнього ринку браузерів. На основі цих прогнозів ми далі вважаємо, що для справжнього руйнування існуючої структури браузерів ключовим є внесення змін у виходи на стороні взаємодії.
Ось три прогнози команди ARC щодо майбутнього ринку браузерів.
По-перше, вважається, що веб-сторінки більше не є основним інтерфейсом взаємодії. Неможливо заперечити, що це складне судження, і саме тому ми з обережністю ставимося до висновків його засновника. На нашу думку, ця точка зору значно недооцінює роль браузера, і це якраз те ключове питання, яке було проігноровано під час дослідження шляху AI-браузера.
Великі моделі відзначаються відмінними показниками у захопленні намірів, наприклад, розуміння команди «допоможи мені забронювати авіаквиток». Проте вони все ще недостатні в здатності нести інформаційну щільність. Коли користувачу потрібен блокнот у стилі інформаційної панелі або терміналу Bloomberg, або візуальна дошка, подібна до Figma, нічого не може бути кращим за спеціалізовану веб-сторінку, налаштовану з точністю на рівні пікселів. Ергономічний дизайн кожного продукту — графіки, функція перетягування, гарячі клавіші — не є декоративними елементами, а скорочують когнітивний навантаження. Ці можливості не можуть бути реалізовані в простих діалогових взаємодіях. Наприклад, на Gate.com, якщо користувач хоче здійснити інвестиційні операції, покладатися лише на розмови з ШІ явно недостатньо, оскільки користувач має високу залежність від введення інформації, точності та структурованої подачі.
У команди RC є суттєвий перекіс у їхньому уявленні про шлях, а саме, що вони не змогли чітко розмежувати "взаємодію", яка складається з двох вимірів: введення та виходу. На стороні введення їхня точка зору в певних ситуаціях має певну раціональність, адже ШІ дійсно може підвищити ефективність інструкційної взаємодії; але на стороні виходу це судження явно дисбалансоване, ігноруючи центральну роль браузера в представленні інформації та персоналізації досвіду. Наприклад, Reddit має свій унікальний спосіб оформлення та інформаційної архітектури, тоді як AAVE має зовсім інший інтерфейс і структуру. Браузер, як платформа, що одночасно вміщує високопривідні дані і може універсально відображати різноманітні інтерфейси продуктів, має обмежену здатність до заміни на рівні введення, а на стороні виходу його складність та неможливість стандартизації ще більше ускладнюють його можливість бути зламаним. У порівнянні з цим, поточні AI браузери на ринку більше зосереджені на "висновках виходу": резюме веб-сторінок, витяг інформації, формування висновків, що поки що недостатньо для складання серйозної конкуренції з такими основними браузерами або системами пошуку, як Google, де частка ринку обмежується лише підсумком пошуку.
Отже, насправді, те, що може зрушити з місця Chrome з часткою ринку 66%, напевно, не буде «наступним Chrome». Щоб досягти цього руйнівного ефекту, потрібно кардинально переосмислити режим рендерингу браузера, щоб він міг адаптуватися до вимог взаємодії в епоху, коли провідну роль відіграє AI Agent, особливо в архітектурному дизайні з боку введення. Саме тому ми більше підтримуємо технічний шлях, обраний Browser Use — його акцент робиться на структурних змінах у базових механізмах браузера. Як тільки будь-яка система реалізує «атомізацію» або «модульність», її програмованість та комбінованість, що виникають внаслідок цього, матиме величезний руйнівний потенціал, і саме в цьому напрямку в даний час рухається Browser Use.
Отже, функціонування AI Agent все ще сильно залежить від наявності браузера. Браузер не тільки є основним місцем зберігання складних персоналізованих даних, але й універсальним інтерфейсом для різноманітних додатків, тому в майбутньому він продовжить бути основним входом для взаємодії. Оскільки AI Agent глибоко інтегрується в браузер для виконання фіксованих завдань, він буде взаємодіяти з конкретними додатками, звертаючись до даних користувача, тобто в основному впливаючи на сторону введення. Для цього існуюча модель рендерингу браузера повинна бути інноваційною, щоб забезпечити максимальну сумісність і адаптацію до AI Agent, що дозволить більш ефективно захоплювати додатки.
Збентеження
Perplexity — це AI пошукова система, відома своєю системою рекомендацій, з останньою оцінкою, що досягла 14 мільярдів доларів, що майже в 5 разів більше, ніж 3 мільярди доларів у червні 2024 року. Середня кількість оброблених пошукових запитів за місяць перевищує 400 мільйонів, у вересні 2024 року оброблено близько 250 мільйонів запитів, обсяг запитів користувачів зріс у 8 разів в річному вимірі, кількість активних користувачів на місяць перевищує 30 мільйонів.
Основною його особливістю є можливість в реальному часі підсумовувати сторінку, завдяки чому він має перевагу в отриманні миттєвої інформації. На початку цього року він почав розробку свого рідного браузера Comet. Perplexity описує незабаром запущений Comet як браузер, який не лише «показує» веб-сторінки, але й «мислить» веб-сторінки. Офіційно він заявляє, що глибоко інтегрує двигун відповідей Perplexity в браузері, що є джобсівським підходом «все-в-одному»: занурити завдання ШІ в основу браузера, а не створювати плагіни для бічної панелі. Використовувати прості відповіді з посиланнями замість традиційних «десяти синіх посилань», безпосередньо конкуруючи з Chrome.
Але все ще потрібно вирішити дві основні проблеми: висока вартість пошуку та низька рентабельність з боку маргінальних користувачів. Незважаючи на те, що Perplexity вже займає провідну позицію в сфері AI-пошуку, Google також оголосила про масштабну інтелектуальну перебудову свого основного продукту на конференції I/O 2025 року. Щодо перебудови браузера, Google представила новий досвід вкладок браузера під назвою AI Model, який інтегрує функції Overview, Deep Research та майбутній Agentic, а весь проект носить назву «Project Mariner».
Google активно займається перетворенням штучного інтелекту, тому лише поверхневе імітування функцій, таких як Overview, DeepResearch або Agentics, навряд чи становитиме справжню загрозу. Справжня можливість встановлення нового порядку в хаосі полягає в реконструкції архітектури браузера знизу вгору, глибокій інтеграції великих мовних моделей (LLM) в ядро браузера та досягненні фундаментальних змін у способах взаємодії.
Відважні
Brave є одним з найперших і найуспішніших браузерів у криптоіндустрії, побудованим на архітектурі Chromium, що дозволяє йому бути сумісним із плагінами з Google Store. Він залучає користувачів, спираючись на модель заробітку токенів через приватність та перегляд. Шлях розвитку Brave певною мірою демонструє його потенціал зростання. Проте з точки зору продукту, хоча приватність є важливою, її потреби все ще в основному зосереджені на певній групі користувачів, для більшості населення усвідомлення приватності поки що не стало основним фактором ухвалення рішень. Тому ймовірність того, що ця особливість зможе підривати існуючих гігантів, є досить низькою.
Станом на сьогодні, щомісячна активність користувачів Brave досягла 82,7 мільйона, а щоденна активність користувачів становить 35,6 мільйона, частка на ринку приблизно 1%–1,5%. Кількість користувачів демонструє постійне зростання: з 6 мільйонів у липні 2019 року до 25 мільйонів у січні 2021 року, до 57 мільйонів у січні 2023 року, і до понад 82 мільйони у лютому 2025 року, середньорічний темп зростання залишається на двозначному рівні. Середня щомісячна кількість пошукових запитів становить близько 1,34 мільярда, що приблизно становить 0,3% від Google.
Наступні етапи ітераційної дорожньої карти Brave.
Brave планує перейти на браузер AI, орієнтований на конфіденційність. Однак, обмежений браком даних користувачів, це призводить до низького рівня налаштування великих моделей, що, в свою чергу, ускладнює швидку та точну ітерацію продукту. У майбутню епоху Agentic Browser, Brave, можливо, зможе зберегти стабільну частку серед певної аудиторії, що зосереджена на конфіденційності, але навряд чи стане головним гравцем. Його AI асистент Leo більше схожий на плагін, який лише покращує функціональність на основі існуючих продуктів, має певні можливості підсумування контенту, але ще не має чіткої стратегії переходу на AI Agent, і нововведення в області взаємодії все ще недостатні.
Пончик
Нещодавно індустрія Crypto також зробила прогрес у сфері Agentic Browser. Стартап Donut отримав 7 мільйонів доларів фінансування на стадії Pre-seed, яке очолили Hongshan, HackVC та Bitkraft Ventures. Наразі проект все ще перебуває на стадії раннього концепту, а його бачення полягає в реалізації інтегрованої здатності «дослідження — прийняття рішень — крипто-нативне виконання» (Discovery, Decision-making, and Crypto-native Execution).
Основна суть цього напрямку полягає в поєднанні автоматизованих виконавчих шляхів, притаманних криптовалютам. Як передбачив a16z, в майбутньому агенти можуть замінити пошукові системи як основний вхідний потік, і підприємці більше не змагатимуться навколо алгоритмів ранжування Google, а змагатимуться за трафік та конверсії, забезпечені виконанням агентів. У галузі цей тренд вже називають «AEO» (Оптимізація Відповідей / Агента), або навіть «ATF» (Виконання Завдань Агента), що означає, що більше не оптимізують ранжування пошуку, а безпосередньо обслуговують інтелектуальні моделі, які можуть виконувати завдання, такі як оформлення замовлень, бронювання квитків, написання листів тощо.
для підприємців
По-перше, потрібно визнати: браузер сам по собі все ще є найбільшим не переробленим «загальним входом» у світі Інтернету. Глобальна кількість користувачів настільних комп'ютерів становить близько 2,1 мільярда, а користувачів мобільних пристроїв понад 4,3 мільярда; він є спільним носієм для введення даних, інтерактивної поведінки та зберігання персоналізованих відбитків пальців. Ця форма існує не через інерцію, а тому, що браузер природно має двосторонні властивості: він є як «входом для читання» даних, так і «виходом для запису» поведінки.
Отже, для підприємців справжнім потенціалом для порушення порядку є не оптимізація на рівні «виводу сторінок». Навіть якщо в новій вкладці вдасться реалізувати функцію огляду AI, схожу на Google, це за своєю суттю залишиться ітерацією на рівні плагінів браузера і не призведе до фундаментальних змін у парадигмі. Справжня точка прориву полягає в «стороні введення» — тобто в тому, як змусити AI Agent активно використовувати продукти підприємців для виконання конкретних завдань. Це стане ключем до того, чи зможуть майбутні продукти інтегруватися в екосистему Agent, отримувати трафік і розподіл вартості.
Пошукова ера - це "клік"; ера посередників - це "виклик".
Якщо ви підприємець, спробуйте переосмислити свій продукт як компонент API — — щоб агенти могли не лише «читати» його, а й «викликати» його. Це вимагає від вас розглянути три виміри з самого початку дизайну продукту:
Од. Стандартизація структури інтерфейсу: чи є ваш продукт «викликаним»?
Чи має продукт можливість бути викликаним інтелектуальним агентом, залежить від того, чи можна стандартизувати його інформаційну структуру та абстрагувати в чітку схему. Наприклад, чи можуть ключові операції, такі як реєстрація користувача, кнопка замовлення, подання коментарів, бути описані за допомогою семантичної структури DOM або відображення JSON? Чи надає система машину станів, щоб агент міг стабільно відтворювати процеси поведінки користувача? Чи підтримує взаємодія користувача на сторінці сценарії для відновлення? Чи має стабільний доступ до WebHook або API Endpoint?
Це саме є суттю успішного фінансування Browser Use — він перетворює браузер з плоского рендерингу HTML на дерево семантики, яке може бути викликане LLM. Для підприємців впровадження подібних дизайнерських концепцій у веб-продуктах є структурованою адаптацією до ери AI Agent.
Два, ідентичність та прохід: ти можеш допомогти Агенту «перейти через бар'єри довіри»?
AI агенту, щоб завершити транзакцію, викликати платіж або активи, потрібен певний надійний посередник — чи можеш ти ним стати? Браузер природно може читати локальне сховище, викликати гаманці, розпізнавати капчі, підключати двофакторну автентифікацію — саме тому він підходить для виконання краще, ніж великі моделі в хмарі. Особливо це стосується сценаріїв Web3: стандарти інтерфейсу для виклику активів на ланцюгу не є однорідними, і якщо агент не має "ідентичності" або "можливості підпису", він не зможе просунутися вперед.
Отже, для крипто-підприємців тут є дуже уявна прогалина: «MCP (Мультифункціональна платформа) світу блокчейн». Це може бути як універсальний рівень команд (що дозволяє агенту викликати Dapp), так і стандартизований набір контрактних інтерфейсів, або навіть щось на кшталт легкого гаманця + платформи ідентифікації, що працює локально.
Три, нове розуміння механізму трафіку: майбутнє - це не SEO, а AEO / ATF
Раніше ви повинні були боротися за прихильність алгоритмів Google; тепер вам потрібно бути вбудованим в ланцюг завдань AI Agent. Це означає, що продукт має мати чітку гранулярність завдань: не «сторінка», а ряд «викликаємих одиниць можливостей»; це означає, що вам потрібно почати оптимізацію агентів (AEO) або адаптацію планування завдань (ATF): наприклад, чи можна спростити процес реєстрації до структурованих кроків, чи можна отримати цінові дані через API, чи можна в реальному часі перевірити запаси;
Вам навіть потрібно почати адаптувати виклики різних LLM фреймворків — OpenAI та Claude мають різні уподобання щодо виклику функцій і використання інструментів. Chrome є терміналом до старого світу, а не входом у новий світ. Справжні підприємницькі проекти майбутнього не полягають у створенні нового браузера, а в тому, щоб змусити існуючі браузери служити агентам, будуючи міст між новим поколінням «інструкцій».
Ти маєш побудувати «синтаксис інтерфейсу» для виклику твого світу з боку Агенту;
Ти повинен прагнути стати ланкою у довіреній мережі інтелектуальних агентів;
Ти повинен побудувати «API замок» у наступній пошуковій моделі.
Якщо Web2 спирався на UI, щоб привернути увагу користувачів, то ера Web3 + AI Agent покладається на виклик ланцюга, щоб захопити наміри виконання агентів.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Чому кажуть, що ера AI Agent призведе до третьої війни браузерів?
Автор: Gate Ventures
ТЛ; ДОКТОР
Третя війна браузерів тихо розгортається. Оглядаючи історію, від Netscape 90-х, Internet Explorer від Microsoft, до Firefox з відкритим кодом та Chrome від Google, суперечка браузерів завжди була концентрованим відображенням контролю над платформою та зміни технологічних парадигм. Chrome здобув панівну позицію завдяки швидкості оновлень та екологічній взаємодії, тоді як Google через «подвійний олігопол» у пошуку та браузері сформував замкнене коло інформаційного входу.
Але сьогодні ця структура починає хитатися. Зростання великих мовних моделей (LLM) призводить до того, що все більше користувачів виконують завдання на сторінках результатів пошуку «нульовими кліками», традиційна поведінка кліків на веб-сторінках зменшується. Тим часом, чутки про намір Apple замінити пошукову систему за замовчуванням у Safari ще більше загрожують прибутковій основі материнської компанії Alphabet (Google ), ринок вже починає проявляти занепокоєння щодо «правильного» пошуку.
Браузер сам також стикається з перетворенням ролі. Він більше не просто інструмент для відображення веб-сторінок, а й контейнер, що об'єднує різноманітні можливості, такі як введення даних, поведінка користувачів, конфіденційність та ідентичність. AI Agent хоча й потужний, але для виконання складних взаємодій на сторінці, виклику локальних даних про ідентичність та контролю елементів веб-сторінки, все ще потрібно покладатися на довірчі межі та функціональні пісочниці браузера. Браузер перетворюється з інтерфейсу для людей на платформу системних викликів для Agent.
У цій статті ми досліджуємо, чи ще є потреба в браузерах, і одночасно вважаємо, що справжнім фактором, який може змінити поточну структуру ринку браузерів, є не ще один «кращий Chrome», а нова структура взаємодії: не демонстрація інформації, а виклик завдань. У майбутньому браузери повинні бути спроектовані для AI Agent — не лише читати, а й писати та виконувати. Проекти, такі як Browser Use, намагаються семантизувати структуру сторінок, перетворюючи візуальний інтерфейс на структурований текст, який може бути викликаний LLM, що значно знижує вартість взаємодії.
Основні проекти на ринку вже почали експериментувати: Perplexity створює нативний браузер Comet, використовуючи ШІ замість традиційних результатів пошуку; Brave поєднує захист конфіденційності з локальними висновками, використовуючи LLM для покращення функцій пошуку та блокування; а такі криптоорієнтовані проекти, як Donut, намагаються знайти нові точки входу для взаємодії між ШІ та активами на блокчейні. Спільною рисою цих проектів є прагнення перебудувати вхідну частину браузера, а не покращувати його вихідний шар.
Для підприємців можливості приховані в трикутних відносинах між введенням, структурою та агентом. Браузер як інтерфейс для виклику світу майбутнього агентів означає, що той, хто може надати структуровані, викликаємої та надійні «блоки можливостей», той може стати частиною нової генерації платформ. Від SEO до AEO (оптимізація двигунів агентів), від трафіку на сторінці до викликів завдань, форма продукту та дизайнерське мислення перебудовуються. Третя війна браузерів відбувається в «введенні», а не в «відображенні»; вирішальним фактором більше не є те, хто приваблює увагу користувача, а хто здобуває довіру агента і отримує доступ до виклику.
Історія розвитку браузерів
На початку 90-х років минулого століття, коли Інтернет ще не став частиною повсякденного життя, з'явився Netscape Navigator, немов корабель, що відкриває нові землі, відкриваючи мільйонам користувачів двері у цифровий світ. Цей браузер не був першим, але став першим продуктом, який справді вийшов на маси та сформував досвід користування Інтернетом. Тоді люди вперше могли так легко переглядати веб-сторінки через графічний інтерфейс, немов весь світ раптом став доступним.
Однак, блискучість зазвичай є короткочасною. Microsoft швидко усвідомила важливість браузерів і вирішила примусово зв'язати Internet Explorer з операційною системою Windows, зробивши його браузером за замовчуванням. Ця стратегія вважається «вбивцею платформ», яка безпосередньо підірвала домінування Netscape на ринку. Багато користувачів не обирали IE добровільно, а просто приймали його через те, що він був встановлений за замовчуванням. IE завдяки можливостям розповсюдження Windows швидко став лідером галузі, тоді як Netscape потрапила на шлях занепаду.
У скрутному становищі інженери Netscape обрали радикальний та ідеалістичний шлях — вони відкрили вихідний код браузера та звернулися до спільноти з відкритим кодом. Це рішення стало схоже на «македонську поступку» в технічному світі, що передбачало кінець старої ери та піднесення нових сил. Цей код згодом став основою проекту браузера Mozilla, спочатку названого Phoenix (в перекладі «фенікс»), але через проблеми з торговими марками кілька разів змінював назву, врешті решт отримавши назву Firefox.
Firefox не є простим копіюванням Netscape, він досяг численних проривів у користувацькому досвіді, екосистемі плагінів, безпеці та інших аспектах. Його народження стало знаковою перемогою відкритого коду і надало нову енергію всій індустрії. Дехто описує Firefox як «духовного спадкоємця» Netscape, подібно до того, як Османська імперія успадкувала останки Візантії. Це порівняння, хоч і перебільшене, але має глибокий сенс.
Але за кілька років до офіційного випуску Firefox, Microsoft вже випустила шість версій IE, скориставшись перевагою часу та стратегією пакетної поставки системи, що змусило Firefox з самого початку зайняти позицію наздоганяючого, що прирекло це змагання на нерівні стартові позиції.
В той же час, ще один ранній гравець тихо з'являється на горизонті. У 1994 році з'явився браузер Opera, який походить з Норвегії і спочатку був експериментальним проектом. Але з версії 7.0 у 2003 році він впровадив власний двигун Presto, вперше підтримуючи CSS, адаптивну верстку, голосове управління та кодування Unicode, а також інші передові технології. Хоча кількість користувачів була обмеженою, технологічно він завжди випереджав галузь, ставши «улюбленцем гіків».
Того ж року Apple випустила браузер Safari. Це був поворотний момент. Тоді Microsoft інвестувала 150 мільйонів доларів в Apple, яка була на межі банкрутства, щоб зберегти видимість конкуренції та уникнути антимонопольного розслідування. Хоча з моменту свого створення за замовчуванням пошуковою системою Safari був Google, ця історія з Microsoft символізує складні та тонкі відносини між інтернет-гігантами: співпраця та конкуренція завжди йдуть поруч.
У 2007 році IE7 вийшов разом з Windows Vista, але ринкові відгуки були посередніми. Натомість Firefox, завдяки більш швидкому темпу оновлень, більш дружній механіці розширень та природній привабливості для розробників, поступово збільшив свою частку на ринку до приблизно 20%. Панування IE поступово послаблюється, напрямок змінюється.
Google має інший підхід. Хоча розробка власного браузера почалася ще в 2001 році, знадобилося шість років, щоб переконати генерального директора Еріка Шмідта затвердити цей проект. Chrome з'явився у 2008 році, створений на основі відкритого проекту Chromium та веб-двигуна WebKit, що використовується в Safari. Його називали "громіздким" браузером, але завдяки глибоким навичкам Google у рекламі та брендингу, він швидко зріс.
Ключовою зброєю Chrome є не функції, а частота оновлень версій (кожні шість тижнів) та єдиний досвід на всіх платформах. У листопаді 2011 року Chrome вперше перевищив Firefox, досягнувши частки ринку 27%; через шість місяців він знову обігнав IE, завершивши перехід від викликувач до домінуючого.
Водночас, мобільний інтернет Китаю також формує власну екосистему. Браузер UC, що належить Alibaba, швидко набрав популярність на початку 2010-х років, особливо на ринках, що розвиваються, таких як Індія, Індонезія та Китай, завдяки легкому дизайну, стисненню даних для збереження трафіку та іншим характеристикам, які приваблювали користувачів низькобюджетних пристроїв. У 2015 році його частка на глобальному ринку мобільних браузерів перевищила 17%, а в Індії сягала 46%. Але ця перемога не була тривалою. З посиленням урядом Індії перевірок безпеки китайських додатків, UC браузер змушений був вийти з ключового ринку і поступово втратив колишню славу.
У 2020-х роках домінування Chrome вже закріпилося, а частка на світовому ринку стабільно становить близько 65%. Варто зазначити, що пошукова система Google та веб-браузер Chrome, хоча й належать до Alphabet, з точки зору ринку є двома незалежними гегемоніями — перша контролює близько 90% пошукових входів у світі, а друга володіє більшістю користувачів, які входять в Інтернет через «перше вікно».
Щоб зберегти цю подвійну монопольну структуру, Google не шкодує витрат. У 2022 році Alphabet сплатила Apple приблизно 20 мільярдів доларів лише для того, щоб Google залишався за замовчуванням пошуковою системою в Safari. Деякі аналітики зазначили, що ці витрати становлять 36% від доходу Google від пошукової реклами з трафіку Safari. Іншими словами, Google платить "охоронний внесок" за свою захисну стіну.
Але напрямок вітру знову змінився. Зі зростанням великих мовних моделей (LLM) традиційний пошук починає зазнавати ударів. У 2024 році частка ринку пошуку Google впала з 93% до 89%, хоча вона все ще домінує, але тріщини вже з'явилися. Ще більш руйнівними є чутки про те, що Apple може запустити власну AI пошукову систему — якщо Safari змінить свій за замовчуванням пошук на власний, це не лише перепише екосистему, але й може похитнути прибуткову опору Alphabet. Ринок швидко відреагував, акції Alphabet впали з 170 доларів до 140 доларів, що відображає не лише паніку інвесторів, але й глибоке занепокоєння щодо майбутнього ери пошуку.
Від Navigator до Chrome, від відкритих ідей до комерціалізації реклами, від легкого браузера до AI пошукового помічника, боротьба браузерів завжди була війною про технології, платформи, контент та контроль. Поле битви постійно переміщується, але сутність ніколи не змінюється: хто контролює вхід, той визначає майбутнє.
На думку венчурних капіталістів, спираючись на нові потреби людей у пошукових системах в епоху LLM і AI, третя війна браузерів поступово розгортається. Ось деякі відомі проекти на ринку AI браузерів та їх фінансування.
Стара архітектура сучасних браузерів
Говорячи про архітектуру браузера, класична традиційна архітектура зображена на малюнку нижче:
Клієнт — фронтенд вхід
Запит через HTTPS доставляється до найближчого Google Front End, де відбувається завершення TLS-розшифрування, вибірка QoS та географічний маршрутизація. Якщо виявлено аномальний трафік (DDoS, автоматичне збирання даних), його можна обмежити або кинути виклик на цьому рівні.
Розуміння запиту
Фронтенд повинен зрозуміти значення слів, введених користувачем, існує три етапи: нейронна перевірка орфографії, виправлення «recpie» на «recipe»; розширення синонімів, розширення «how to fix bike» до «repair bicycle». Аналіз намірів, визначення, чи є запит інформаційним, навігаційним чи торговим наміром, та призначення запиту Vertical.
Кандидат на відновлення
Технологія запитів, яку використовує Google, називається: зворотний індекс. У прямому індексі ми можемо знайти файл за заданим ID. Але користувачі не можуть знати номер вмісту серед тисяч мільярдів файлів, тому використовується дуже традиційний зворотний індекс, який дозволяє шукати файли за відповідними ключовими словами. Далі Google використовує векторний індекс для обробки семантичного пошуку, тобто для пошуку вмісту, що є схожим за значенням на запит. Це перетворює текст, зображення та інший вміст у високорозмірні вектори (embedding) і проводить пошук на основі схожості між цими векторами. Наприклад, навіть якщо користувач шукає «як приготувати тісто для піци», пошукова система може повернути результати, пов'язані з «посібником з приготування тіста для піци», оскільки вони семантично схожі. Після зворотного індексу та векторного індексу приблизно сто тисяч веб-сторінок проходять первинний відбір.
Багаторівневе сортування
Системи зазвичай через BM25, TF-IDF, оцінки якості сторінок та інші тисячі легких характеристик відбирають мільйонні кандидати до приблизно 1000 статей, формуючи попередній список кандидатів. Ці системи загально називаються рекомендаційними системами. Вони залежать від багатьох характеристик, згенерованих різними сутностями, включаючи поведінку користувачів, атрибути сторінок, наміри запиту та контекстуальні сигнали. Наприклад, Google враховує історію користувача, відгуки інших користувачів, семантику сторінок, значення запитів та іншу інформацію, а також контекстуальні фактори, такі як час (періоди дня, конкретні дні тижня) та зовнішні події, такі як останні новини.
Глибоке навчання для основної сортування
На початковому етапі пошуку Google використовує такі технології, як RankBrain та Neural Matching, щоб зрозуміти семантику запиту та вибрати попередньо релевантні результати з величезної кількості документів. RankBrain – це система машинного навчання, яку Google впровадив у 2015 році, щоб краще розуміти значення запитів користувачів, особливо запитів, які з'являються вперше. Вона перетворює запити та документи на векторні представлення, обчислюючи їхню схожість, щоб знайти найрелевантніші результати. Наприклад, для запиту «як приготувати тісто для піци», навіть якщо в документі немає точно збігаючих ключових слів, RankBrain може виявити зміст, пов'язаний з «основою піци» або «приготуванням тіста».
Neural Matching — це ще одна технологія, яку Google запровадив у 2018 році, що має на меті глибше зрозуміти семантичні зв'язки між запитами та документами. Вона використовує моделі нейронних мереж для виявлення неявних зв'язків між словами, що допомагає Google краще співвідносити запити та зміст веб-сторінок. Наприклад, для запиту «чому мій вентилятор ноутбука так голосно працює», Neural Matching може зрозуміти, що користувач, можливо, шукає інформацію про усунення неполадок, пов'язаних з перегрівом, скупченням пилу або високим використанням ЦП, навіть якщо ці слова не з'являються безпосередньо в запиті.
Глибока перестановка: застосування моделі BERT
Після попереднього відбору відповідних документів Google використовує модель BERT (Bidirectional Encoder Representations from Transformers) для більш детального ранжування цих документів, щоб забезпечити, що найрелевантніші результати з'являються на перших позиціях. BERT — це модель попереднього навчання на основі Transformer, яка здатна розуміти контекстуальні зв'язки слів у реченнях. У пошуку BERT використовується для повторного ранжування попередньо отриманих документів. Він виконує спільне кодування запиту та документа, обчислює їхню релевантність, щоб перенести документи в новий порядок. Наприклад, для запиту «паркування на схилі без бордюру» BERT може зрозуміти значення «без бордюру» і повернути сторінку, що радить водіям повернути колеса до краю дороги, а не неправильно інтерпретувати це як ситуацію з бордюром. А для SEO-інженерів це означає необхідність точно вивчити алгоритми ранжування Google та рекомендацій машинного навчання, щоб цілеспрямовано оптимізувати вміст веб-сторінок і отримати вищі позиції в показах.
Це типовий робочий процес пошукової системи Google. Але в умовах сучасної ери вибуху штучного інтелекту та великих даних, у користувачів з'явилися нові вимоги до взаємодії з браузером.
Чому ШІ перетворює браузери
По-перше, нам потрібно зрозуміти, чому така форма, як браузер, все ще існує? Чи існує третя форма, окрім агентів штучного інтелекту та браузерів?
Ми вважаємо, що існування є незамінним. Чому штучний інтелект може використовувати браузер, але не може повністю його замінити? Тому що браузер є універсальною платформою, яка є не лише входом для читання даних, але й універсальним входом для введення даних. У цьому світі не може бути лише введення інформації, також необхідно генерувати дані та взаємодіяти з веб-сайтами, тому браузер, який інтегрує персоналізовану інформацію користувача, все ще буде широко існувати.
Ми захоплюємо цю ідею: браузер як універсальний вхід, не тільки для читання даних, користувачам часто потрібно взаємодіяти з даними. Браузер сам по собі є відмінним місцем для зберігання відбитків пальців користувача. Складніші поведінки користувачів та автоматизовані дії повинні реалізовуватись через браузер. Браузер може зберігати всі відбитки поведінки користувачів, паролі та іншу приватну інформацію, реалізуючи бездокументний виклик в процесі автоматизації. А дії взаємодії з даними можуть еволюціонувати в:
Користувач → Виклик AI Agent → Браузер.
А це означає, що єдина частина, яка може бути замінена, — це напрямок, що відповідає світовим тенденціям розвитку — більш інтелектуальний, більш персоналізований та більш автоматизований. Звичайно, цю частину можна доручити AI Agent, але сам AI Agent зовсім не підходить для розміщення персоналізованого контенту користувачів, оскільки він стикається з численними викликами в питаннях безпеки даних і зручності. Конкретно кажучи:
Браузер є місцем зберігання персоналізованого контенту:
глибока трансформація інтерактивних форм
Повертаючись до початкової теми, ми можемо умовно поділити поведінку користувачів браузера на три основні форми: читання даних, введення даних, взаємодія з даними. Великі моделі штучного інтелекту (LLM) суттєво змінили нашу ефективність і спосіб читання даних, адже раніше поведінка користувачів, що базувалася на пошуку веб-сторінок за ключовими словами, виглядала дуже застарілою та неефективною.
Еволюція поведінки пошуку користувачів — чи це отримання узагальнених відповідей, чи клікання на веб-сторінки, вже було проаналізовано в багатьох дослідженнях.
У дослідженні 2024 року щодо поведінки користувачів зазначається, що в США з кожних 1 000 запитів у Google лише 374 призводять до переходу на відкриту веб-сторінку. Іншими словами, майже 63% становлять "нульові кліки". Користувачі звикли отримувати інформацію про погоду, курси валют, картки знань тощо безпосередньо з сторінки результатів пошуку.
З точки зору психології користувачів, опитування 2023 року вказало, що 44% респондентів вважають, що звичайні природні результати більш надійні, ніж вибрані фрагменти (featured snippet). Академічні дослідження також виявили, що у випадках спірних чи без єдиного правди, користувачі надають перевагу результатам, що містять посилання з кількох джерел.
Це означає, що дійсно є частина користувачів, які не дуже довіряють резюме AI, але також є значна частина користувачів, чия поведінка вже змістилася в бік «нульового кліку». Тому браузеру AI все ще потрібно досліджувати відповідну форму взаємодії — особливо в частині читання даних, оскільки поточна проблема «галюцинацій» (hallucination) великої моделі ще не вирішена, і багато користувачів все ще важко повністю довіряти автоматично згенерованим резюме контенту. У цьому аспекті, якщо вбудувати велику модель у браузер, насправді не потрібно здійснювати руйнівні зміни в браузері, достатньо поступово вирішувати питання точності та керованості моделі, і це покращення також продовжує реалізовуватися.
А справжнім фактором, що може спровокувати масштабну революцію у браузерах, є рівень взаємодії даних. У минулому люди виконували взаємодію, вводячи ключові слова — це межа, яку може зрозуміти браузер. А зараз користувачі все більше схиляються до використання цілих фрагментів природної мови для опису складних завдань, наприклад:
Ці дії, навіть для людей, потребують значної кількості часу для відвідування кількох веб-сайтів, збору та порівняння даних. Але ці агентні завдання поступово беруть на себе AI Agent.
Це також відповідає напрямку історичної еволюції: автоматизації та інтелектуалізації. Люди прагнуть звільнити свої руки, AI Agent обов'язково буде глибоко інтегрований у браузер. Майбутній браузер повинен бути спроектований для повної автоматизації, особливо з урахуванням:
Лише задовольняючи ці два вимоги, браузер може стати справжнім стабільним носієм для виконання завдань AI Agent.
Далі ми зосередимося на п'яти найактивніших проектах, включаючи Browser Use, Arc (The Browser Company), Perplexity, Brave та Donut. Ці проекти відповідно представляють майбутню еволюцію AI браузерів та їхній потенціал для нативної інтеграції у Web3 та крипто-сценах.
Використання браузера
Це саме є основною логікою, що стоїть за величезним фінансуванням Perplexity і Browser Use. Особливо Browser Use, це друга найбільш певна та зростаюча інноваційна можливість, що з'явилася в першій половині 2025 року.
Browser є справжнім семантичним шаром, основою якого є семантична розпізнавальна архітектура для наступного покоління браузерів.
Browser Use перетворює традиційне «DOM=дерево вузлів для людей» на «семантичне DOM=дерево інструкцій для LLM», дозволяючи агенту точно натискати, заповнювати та завантажувати без необхідності «переглядати координати точок». Цей маршрут замінює візуальне OCR або координатний Selenium на «структурований текст → виклик функцій», тому виконання проходить швидше, токенів витрачається менше, а помилок виникає менше. TechCrunch називає це «клеєм, який справді допомагає AI зрозуміти веб-сторінки», а 17 мільйонів доларів, зібраних у березні, є ставкою на цю основну інновацію.
HTML рендериться у стандартне дерево DOM; браузер потім створює дерево доступності, щоб надати екранним зчитувачам більш багаті «ролі» та «статуси».
Водночас, як тільки цей стандарт буде введено в W3C, це може значно вирішити проблеми вводу в браузерах. Ми використовуємо відкритий лист і випадок The Browser Company, щоб далі пояснити, чому ідея The Browser Company є помилковою.
ARC
Компанія Browser (Arc, материнська компанія ), у своєму відкритому листі повідомила, що браузер ARC перейде в стадію регулярного обслуговування, а команда зосередиться на повністю AI-орієнтованому браузері DIA. У листі також зазначається, що наразі не визначено конкретний шлях реалізації DIA. Водночас команда в листі висловила кілька прогнозів щодо майбутнього ринку браузерів. На основі цих прогнозів ми далі вважаємо, що для справжнього руйнування існуючої структури браузерів ключовим є внесення змін у виходи на стороні взаємодії.
Ось три прогнози команди ARC щодо майбутнього ринку браузерів.
По-перше, вважається, що веб-сторінки більше не є основним інтерфейсом взаємодії. Неможливо заперечити, що це складне судження, і саме тому ми з обережністю ставимося до висновків його засновника. На нашу думку, ця точка зору значно недооцінює роль браузера, і це якраз те ключове питання, яке було проігноровано під час дослідження шляху AI-браузера.
Великі моделі відзначаються відмінними показниками у захопленні намірів, наприклад, розуміння команди «допоможи мені забронювати авіаквиток». Проте вони все ще недостатні в здатності нести інформаційну щільність. Коли користувачу потрібен блокнот у стилі інформаційної панелі або терміналу Bloomberg, або візуальна дошка, подібна до Figma, нічого не може бути кращим за спеціалізовану веб-сторінку, налаштовану з точністю на рівні пікселів. Ергономічний дизайн кожного продукту — графіки, функція перетягування, гарячі клавіші — не є декоративними елементами, а скорочують когнітивний навантаження. Ці можливості не можуть бути реалізовані в простих діалогових взаємодіях. Наприклад, на Gate.com, якщо користувач хоче здійснити інвестиційні операції, покладатися лише на розмови з ШІ явно недостатньо, оскільки користувач має високу залежність від введення інформації, точності та структурованої подачі.
У команди RC є суттєвий перекіс у їхньому уявленні про шлях, а саме, що вони не змогли чітко розмежувати "взаємодію", яка складається з двох вимірів: введення та виходу. На стороні введення їхня точка зору в певних ситуаціях має певну раціональність, адже ШІ дійсно може підвищити ефективність інструкційної взаємодії; але на стороні виходу це судження явно дисбалансоване, ігноруючи центральну роль браузера в представленні інформації та персоналізації досвіду. Наприклад, Reddit має свій унікальний спосіб оформлення та інформаційної архітектури, тоді як AAVE має зовсім інший інтерфейс і структуру. Браузер, як платформа, що одночасно вміщує високопривідні дані і може універсально відображати різноманітні інтерфейси продуктів, має обмежену здатність до заміни на рівні введення, а на стороні виходу його складність та неможливість стандартизації ще більше ускладнюють його можливість бути зламаним. У порівнянні з цим, поточні AI браузери на ринку більше зосереджені на "висновках виходу": резюме веб-сторінок, витяг інформації, формування висновків, що поки що недостатньо для складання серйозної конкуренції з такими основними браузерами або системами пошуку, як Google, де частка ринку обмежується лише підсумком пошуку.
Отже, насправді, те, що може зрушити з місця Chrome з часткою ринку 66%, напевно, не буде «наступним Chrome». Щоб досягти цього руйнівного ефекту, потрібно кардинально переосмислити режим рендерингу браузера, щоб він міг адаптуватися до вимог взаємодії в епоху, коли провідну роль відіграє AI Agent, особливо в архітектурному дизайні з боку введення. Саме тому ми більше підтримуємо технічний шлях, обраний Browser Use — його акцент робиться на структурних змінах у базових механізмах браузера. Як тільки будь-яка система реалізує «атомізацію» або «модульність», її програмованість та комбінованість, що виникають внаслідок цього, матиме величезний руйнівний потенціал, і саме в цьому напрямку в даний час рухається Browser Use.
Отже, функціонування AI Agent все ще сильно залежить від наявності браузера. Браузер не тільки є основним місцем зберігання складних персоналізованих даних, але й універсальним інтерфейсом для різноманітних додатків, тому в майбутньому він продовжить бути основним входом для взаємодії. Оскільки AI Agent глибоко інтегрується в браузер для виконання фіксованих завдань, він буде взаємодіяти з конкретними додатками, звертаючись до даних користувача, тобто в основному впливаючи на сторону введення. Для цього існуюча модель рендерингу браузера повинна бути інноваційною, щоб забезпечити максимальну сумісність і адаптацію до AI Agent, що дозволить більш ефективно захоплювати додатки.
Збентеження
Perplexity — це AI пошукова система, відома своєю системою рекомендацій, з останньою оцінкою, що досягла 14 мільярдів доларів, що майже в 5 разів більше, ніж 3 мільярди доларів у червні 2024 року. Середня кількість оброблених пошукових запитів за місяць перевищує 400 мільйонів, у вересні 2024 року оброблено близько 250 мільйонів запитів, обсяг запитів користувачів зріс у 8 разів в річному вимірі, кількість активних користувачів на місяць перевищує 30 мільйонів.
Основною його особливістю є можливість в реальному часі підсумовувати сторінку, завдяки чому він має перевагу в отриманні миттєвої інформації. На початку цього року він почав розробку свого рідного браузера Comet. Perplexity описує незабаром запущений Comet як браузер, який не лише «показує» веб-сторінки, але й «мислить» веб-сторінки. Офіційно він заявляє, що глибоко інтегрує двигун відповідей Perplexity в браузері, що є джобсівським підходом «все-в-одному»: занурити завдання ШІ в основу браузера, а не створювати плагіни для бічної панелі. Використовувати прості відповіді з посиланнями замість традиційних «десяти синіх посилань», безпосередньо конкуруючи з Chrome.
Але все ще потрібно вирішити дві основні проблеми: висока вартість пошуку та низька рентабельність з боку маргінальних користувачів. Незважаючи на те, що Perplexity вже займає провідну позицію в сфері AI-пошуку, Google також оголосила про масштабну інтелектуальну перебудову свого основного продукту на конференції I/O 2025 року. Щодо перебудови браузера, Google представила новий досвід вкладок браузера під назвою AI Model, який інтегрує функції Overview, Deep Research та майбутній Agentic, а весь проект носить назву «Project Mariner».
Google активно займається перетворенням штучного інтелекту, тому лише поверхневе імітування функцій, таких як Overview, DeepResearch або Agentics, навряд чи становитиме справжню загрозу. Справжня можливість встановлення нового порядку в хаосі полягає в реконструкції архітектури браузера знизу вгору, глибокій інтеграції великих мовних моделей (LLM) в ядро браузера та досягненні фундаментальних змін у способах взаємодії.
Відважні
Brave є одним з найперших і найуспішніших браузерів у криптоіндустрії, побудованим на архітектурі Chromium, що дозволяє йому бути сумісним із плагінами з Google Store. Він залучає користувачів, спираючись на модель заробітку токенів через приватність та перегляд. Шлях розвитку Brave певною мірою демонструє його потенціал зростання. Проте з точки зору продукту, хоча приватність є важливою, її потреби все ще в основному зосереджені на певній групі користувачів, для більшості населення усвідомлення приватності поки що не стало основним фактором ухвалення рішень. Тому ймовірність того, що ця особливість зможе підривати існуючих гігантів, є досить низькою.
Станом на сьогодні, щомісячна активність користувачів Brave досягла 82,7 мільйона, а щоденна активність користувачів становить 35,6 мільйона, частка на ринку приблизно 1%–1,5%. Кількість користувачів демонструє постійне зростання: з 6 мільйонів у липні 2019 року до 25 мільйонів у січні 2021 року, до 57 мільйонів у січні 2023 року, і до понад 82 мільйони у лютому 2025 року, середньорічний темп зростання залишається на двозначному рівні. Середня щомісячна кількість пошукових запитів становить близько 1,34 мільярда, що приблизно становить 0,3% від Google.
Наступні етапи ітераційної дорожньої карти Brave.
Brave планує перейти на браузер AI, орієнтований на конфіденційність. Однак, обмежений браком даних користувачів, це призводить до низького рівня налаштування великих моделей, що, в свою чергу, ускладнює швидку та точну ітерацію продукту. У майбутню епоху Agentic Browser, Brave, можливо, зможе зберегти стабільну частку серед певної аудиторії, що зосереджена на конфіденційності, але навряд чи стане головним гравцем. Його AI асистент Leo більше схожий на плагін, який лише покращує функціональність на основі існуючих продуктів, має певні можливості підсумування контенту, але ще не має чіткої стратегії переходу на AI Agent, і нововведення в області взаємодії все ще недостатні.
Пончик
Нещодавно індустрія Crypto також зробила прогрес у сфері Agentic Browser. Стартап Donut отримав 7 мільйонів доларів фінансування на стадії Pre-seed, яке очолили Hongshan, HackVC та Bitkraft Ventures. Наразі проект все ще перебуває на стадії раннього концепту, а його бачення полягає в реалізації інтегрованої здатності «дослідження — прийняття рішень — крипто-нативне виконання» (Discovery, Decision-making, and Crypto-native Execution).
Основна суть цього напрямку полягає в поєднанні автоматизованих виконавчих шляхів, притаманних криптовалютам. Як передбачив a16z, в майбутньому агенти можуть замінити пошукові системи як основний вхідний потік, і підприємці більше не змагатимуться навколо алгоритмів ранжування Google, а змагатимуться за трафік та конверсії, забезпечені виконанням агентів. У галузі цей тренд вже називають «AEO» (Оптимізація Відповідей / Агента), або навіть «ATF» (Виконання Завдань Агента), що означає, що більше не оптимізують ранжування пошуку, а безпосередньо обслуговують інтелектуальні моделі, які можуть виконувати завдання, такі як оформлення замовлень, бронювання квитків, написання листів тощо.
для підприємців
По-перше, потрібно визнати: браузер сам по собі все ще є найбільшим не переробленим «загальним входом» у світі Інтернету. Глобальна кількість користувачів настільних комп'ютерів становить близько 2,1 мільярда, а користувачів мобільних пристроїв понад 4,3 мільярда; він є спільним носієм для введення даних, інтерактивної поведінки та зберігання персоналізованих відбитків пальців. Ця форма існує не через інерцію, а тому, що браузер природно має двосторонні властивості: він є як «входом для читання» даних, так і «виходом для запису» поведінки.
Отже, для підприємців справжнім потенціалом для порушення порядку є не оптимізація на рівні «виводу сторінок». Навіть якщо в новій вкладці вдасться реалізувати функцію огляду AI, схожу на Google, це за своєю суттю залишиться ітерацією на рівні плагінів браузера і не призведе до фундаментальних змін у парадигмі. Справжня точка прориву полягає в «стороні введення» — тобто в тому, як змусити AI Agent активно використовувати продукти підприємців для виконання конкретних завдань. Це стане ключем до того, чи зможуть майбутні продукти інтегруватися в екосистему Agent, отримувати трафік і розподіл вартості.
Пошукова ера - це "клік"; ера посередників - це "виклик".
Якщо ви підприємець, спробуйте переосмислити свій продукт як компонент API — — щоб агенти могли не лише «читати» його, а й «викликати» його. Це вимагає від вас розглянути три виміри з самого початку дизайну продукту:
Од. Стандартизація структури інтерфейсу: чи є ваш продукт «викликаним»?
Чи має продукт можливість бути викликаним інтелектуальним агентом, залежить від того, чи можна стандартизувати його інформаційну структуру та абстрагувати в чітку схему. Наприклад, чи можуть ключові операції, такі як реєстрація користувача, кнопка замовлення, подання коментарів, бути описані за допомогою семантичної структури DOM або відображення JSON? Чи надає система машину станів, щоб агент міг стабільно відтворювати процеси поведінки користувача? Чи підтримує взаємодія користувача на сторінці сценарії для відновлення? Чи має стабільний доступ до WebHook або API Endpoint?
Це саме є суттю успішного фінансування Browser Use — він перетворює браузер з плоского рендерингу HTML на дерево семантики, яке може бути викликане LLM. Для підприємців впровадження подібних дизайнерських концепцій у веб-продуктах є структурованою адаптацією до ери AI Agent.
Два, ідентичність та прохід: ти можеш допомогти Агенту «перейти через бар'єри довіри»?
AI агенту, щоб завершити транзакцію, викликати платіж або активи, потрібен певний надійний посередник — чи можеш ти ним стати? Браузер природно може читати локальне сховище, викликати гаманці, розпізнавати капчі, підключати двофакторну автентифікацію — саме тому він підходить для виконання краще, ніж великі моделі в хмарі. Особливо це стосується сценаріїв Web3: стандарти інтерфейсу для виклику активів на ланцюгу не є однорідними, і якщо агент не має "ідентичності" або "можливості підпису", він не зможе просунутися вперед.
Отже, для крипто-підприємців тут є дуже уявна прогалина: «MCP (Мультифункціональна платформа) світу блокчейн». Це може бути як універсальний рівень команд (що дозволяє агенту викликати Dapp), так і стандартизований набір контрактних інтерфейсів, або навіть щось на кшталт легкого гаманця + платформи ідентифікації, що працює локально.
Три, нове розуміння механізму трафіку: майбутнє - це не SEO, а AEO / ATF
Раніше ви повинні були боротися за прихильність алгоритмів Google; тепер вам потрібно бути вбудованим в ланцюг завдань AI Agent. Це означає, що продукт має мати чітку гранулярність завдань: не «сторінка», а ряд «викликаємих одиниць можливостей»; це означає, що вам потрібно почати оптимізацію агентів (AEO) або адаптацію планування завдань (ATF): наприклад, чи можна спростити процес реєстрації до структурованих кроків, чи можна отримати цінові дані через API, чи можна в реальному часі перевірити запаси;
Вам навіть потрібно почати адаптувати виклики різних LLM фреймворків — OpenAI та Claude мають різні уподобання щодо виклику функцій і використання інструментів. Chrome є терміналом до старого світу, а не входом у новий світ. Справжні підприємницькі проекти майбутнього не полягають у створенні нового браузера, а в тому, щоб змусити існуючі браузери служити агентам, будуючи міст між новим поколінням «інструкцій».
Якщо Web2 спирався на UI, щоб привернути увагу користувачів, то ера Web3 + AI Agent покладається на виклик ланцюга, щоб захопити наміри виконання агентів.