Почему говорят, что эпоха AI Agent приведет к третьей войне браузеров?

Question

Автор: Gate Ventures### турецких лир; ДОКТОРТретья война браузеров тихо разворачивается. Обратимся к истории: с Netscape и Microsoft IE в 90-х годах прошлого века, до Firefox с открытым исходным кодом и Google Chrome, борьба браузеров всегда была ярким проявлением контроля платформ и изменений технологических парадигм. Chrome завоевал господствующее положение благодаря скорости обновления и экосистеме, а Google сформировал замкнутый круг входа в информацию через структуру "двух олигархов" с поиском и браузером.Но сегодня эта структура начинает колебаться. Восход крупных языковых моделей (LLM) приводит к тому, что все больше пользователей выполняют задачи на страницах результатов поиска с «нулевыми кликами», что снижает традиционное поведение кликов на веб-страницах. В то же время слухи о том, что Apple намерена заменить поисковую систему по умолчанию в Safari, еще больше угрожают прибыльной базе материнской компании Alphabet ( Google, и рынок уже начинает проявлять беспокойство по поводу «ортодоксального поиска».Браузер сам по себе также сталкивается с переосмыслением своей роли. Он больше не просто инструмент для отображения веб-страниц, но и контейнер, объединяющий множество возможностей, таких как ввод данных, поведение пользователей, защита конфиденциальности и идентификация. Хотя ИИ-агенты мощны, для выполнения сложных взаимодействий на страницах, вызова локальных данных о пользователе и управления элементами веб-страниц все еще требуется полагаться на доверительные границы и функциональные песочницы браузера. Браузер превращается из пользовательского интерфейса в платформу системных вызовов для агентов.В этой статье мы исследуем, есть ли необходимость в существовании браузера, и при этом считаем, что действительно способно изменить текущую рыночную ситуацию в области браузеров, это не другой «лучший Chrome», а новая структура взаимодействия: не представление информации, а вызов задач. Будущие браузеры должны быть спроектированы для AI Agent — не только для чтения, но и для написания и выполнения. Проекты вроде Browser Use пытаются семантизировать структуру страниц, превращая визуальные интерфейсы в структурированный текст, который может вызываться LLM, что значительно снижает затраты на взаимодействие.На рынке основные проекты уже начали экспериментировать: Perplexity создает родной браузер Comet, используя ИИ для замены традиционных результатов поиска; Brave сочетает защиту конфиденциальности с локальным выводом, усиливая функции поиска и блокировки с помощью LLM; а проекты Crypto, такие как Donut, нацелены на новый вход для взаимодействия ИИ и цепочных активов. Общая черта этих проектов заключается в том, что они пытаются реконструировать входную часть браузера, а не улучшать его выходной уровень.Для предпринимателей возможности скрыты в треугольных отношениях между вводом, структурой и агентами. Браузер, как интерфейс для вызова мира будущими агентами, означает, что тот, кто сможет предложить структурированные, вызываемые и надежные «блоки возможностей», сможет стать частью нового поколения платформ. От SEO до AEO (Оптимизация движка агентов), от трафика страниц до вызова цепочки заданий, форма и дизайн продукта находятся в процессе реконструкции. Третья война браузеров происходит не на этапе «демонстрации», а на этапе «ввода»; исход сражения больше не зависит от того, кто привлекает внимание пользователей, а от того, кто завоевывает доверие агентов и получает доступ к вызову.) История развития браузеровВ начале 90-х годов, когда интернет еще не стал частью повседневной жизни, Netscape Navigator появился на свет, словно корабль, открывающий новый континент, предоставив миллионам пользователей доступ в цифровой мир. Этот браузер не был первым, но стал первым по-настоящему массовым продуктом, формирующим интернет-опыт. В то время люди впервые могли так легко просматривать веб-страницы через графический интерфейс, как будто весь мир внезапно стал доступным.Тем не менее, величие часто бывает кратковременным. Microsoft быстро осознала важность браузеров и приняла решение принудительно интегрировать Internet Explorer в операционную систему Windows, сделав его браузером по умолчанию. Эта стратегия стала настоящим «убийцей платформ», что привело к разрушению рыночного господства Netscape. Многие пользователи не выбирали IE активно, а принимали его, потому что он был установлен по умолчанию. Благодаря распространению через Windows, IE быстро стал лидером отрасли, а Netscape оказался на пути к упадку.В условиях кризиса инженеры Netscape выбрали радикальный и идеалистический путь — они открыли исходный код браузера и призвали сообщество к открытым исходным кодам. Это решение было похоже на «македонское отступление» в мире технологий, предвещая конец старой эпохи и восход новой силы. Этот код впоследствии стал основой проекта браузера Mozilla, который изначально назывался Phoenix (что означает «возрождение феникса»), но из-за проблем с товарным знаком несколько раз менял название, в конечном итоге став Firefox.Firefox не является простым клоном Netscape; он достиг значительных прорывов в таких областях, как пользовательский опыт, экосистема плагинов и безопасность. Его появление стало символом победы открытого кода и вдохнуло новую жизнь в целую отрасль. Некоторые описывают Firefox как «духовного наследника» Netscape, подобно тому, как Османская империя унаследовала отражение Византии. Эта метафора, хотя и преувеличена, имеет глубокий смысл.Но за несколько лет до официального выхода Firefox Microsoft уже выпустила шесть версий IE, благодаря преимуществу во времени и стратегии упаковки системы Firefox изначально оказалась в позиции догоняющего, что предопределило, что эта гонка не является честным соревнованием с равными стартовыми условиями.Тем временем, другой ранний игрок также незаметно появился на сцене. В 1994 году вышел браузер Opera, который пришел из Норвегии и изначально был экспериментальным проектом. Но начиная с версии 7.0 в 2003 году, он представил собственный движок Presto, первым поддержавшим CSS, адаптивную верстку, голосовое управление и кодировку Unicode, а также другие передовые технологии. Хотя количество пользователей было ограничено, с технической точки зрения он всегда опережал отрасль, став «любимцем гиков».В том же году Apple выпустила браузер Safari. Это было знаковое поворотное событие. В то время Microsoft вложила 150 миллионов долларов в почти обанкротившуюся Apple, чтобы поддержать видимость конкуренции и избежать антимонопольного расследования. Хотя поисковая система по умолчанию для Safari с самого начала была Google, эта история с Microsoft символизирует сложные и тонкие отношения между интернет-гигантами: сотрудничество и конкуренция всегда идут рука об руку.В 2007 году IE7 был выпущен вместе с Windows Vista, но отзывы рынка были посредственными. Напротив, Firefox, благодаря более быстрому темпу обновлений, более дружелюбной системе расширений и естественной привлекательности для разработчиков, постепенно увеличил свою долю на рынке до около 20%. Господство IE постепенно ослабевает, ветер перемен дует.Google использует другой подход. Хотя с 2001 года компания начала разрабатывать собственный браузер, ей потребовалось шесть лет, чтобы убедить CEO Эрика Шмидта одобрить этот проект. Chrome был представлен в 2008 году и разработан на основе проекта с открытым исходным кодом Chromium и движка WebKit, используемого Safari. Его прозвали «тяжеловесным» браузером, но благодаря глубоким знаниям Google в области размещения рекламы и брендинга, он быстро завоевал популярность.Ключевым оружием Chrome является не функционал, а частота обновлений версий (каждые шесть недель) и унифицированный опыт на всех платформах. В ноябре 2011 года Chrome впервые обогнал Firefox, его доля на рынке достигла 27%; через шесть месяцев он снова обогнал IE, завершив переход от претендента к доминирующему игроку.В то же время мобильный интернет в Китае также формирует свою экосистему. Браузер UC, принадлежащий Alibaba, быстро стал популярным в начале 2010-х годов, особенно на таких развивающихся рынках, как Индия, Индонезия и Китай, благодаря легкому дизайну, сжатию данных для экономии трафика и другим особенностям, что привлекло пользователей недорогих устройств. В 2015 году его доля на мировом рынке мобильных браузеров превысила 17%, а в Индии достигала 46%. Однако эта победа была недолговечной. С усилением правительством Индии безопасности китайских приложений, браузер UC был вынужден покинуть ключевой рынок и постепенно потерял былую славу.В 2020-х годах доминирование Chrome уже утвердилось, и доля рынка стабилизировалась примерно на уровне 65%. Стоит отметить, что поисковая система Google и браузер Chrome, хотя и принадлежат Alphabet, с точки зрения рынка представляют собой две независимые гегемонистские системы — первая контролирует около 90% входов в поиск по всему миру, а вторая управляет «первым окном» для большинства пользователей в сеть.Для того чтобы сохранить эту двойную монопольную структуру, Google не жалеет денег на инвестиции. В 2022 году Alphabet заплатила Apple около 20 миллиардов долларов только для того, чтобы Google оставался поисковой системой по умолчанию в Safari. Аналитики указывают, что эти расходы составляют 36% от доходов Google от поисковой рекламы, полученных от трафика Safari. Другими словами, Google платит «защиту» для своей крепости.Но ветер снова изменился. С ростом крупных языковых моделей (LLM) традиционные поисковые системы начали испытывать давление. В 2024 году доля рынка поиска Google упала с 93% до 89%, хотя он все еще доминирует, но трещины уже начали появляться. Еще более разрушительными являются слухи о том, что Apple может запустить собственную AI поисковую систему — если Safari изменит свою настройку на собственный поисковик, это не только изменит экосистему, но и может поколебать прибыль Alphabet. Реакция рынка была быстрой: акции Alphabet упали с 170 долларов до 140 долларов, что отражает не только панику инвесторов, но и глубокую тревогу по поводу будущего эпохи поиска.От Navigator до Chrome, от идеалов открытого кода до коммерциализации рекламы, от легковесных браузеров до AI поисковых помощников, борьба браузеров всегда была войной о технологиях, платформах, контенте и контроле. Поле боя постоянно перемещается, но суть никогда не меняется: кто контролирует вход, тот определяет будущее.В глазах венчурных капиталистов третья война браузеров постепенно разворачивается, опираясь на новые потребности людей в поисковых системах в эпоху LLM и ИИ. Ниже приведены данные о финансировании некоторых известных проектов в области AI браузеров.### Устаревшая архитектура современных браузеровГоворя о структуре браузера, классическая традиционная архитектура показана на рисунке ниже:**Клиент — Фронтенд вход**Запросите доставку к ближайшему Google Front End через HTTPS, выполните TLS-расшифровку, QoS-образец и географическую маршрутизацию. Если будет обнаружен аномальный трафик (DDoS, автоматический сбор), можно ограничить поток или установить вызов на этом уровне.**Понимание запроса**Frontend должен понимать значение слов, введенных пользователем, и для этого существуют три шага: нейронная проверка орфографии, исправляющая «recpie» на «recipe»; расширение синонимов, преобразующее «how to fix bike» в «repair bicycle». Анализ намерений, определение запроса как информационного, навигационного или торгового и распределение Vertical запросов.**Кандидат на отзыв**Технология запросов, используемая Google, называется: обратный индекс. В прямом индексе мы можем индексировать файл, имея ID. Однако пользователи не могут знать, какой номер содержимого они хотят среди сотен миллиардов файлов, поэтому используется традиционный обратный индекс для поиска файлов, содержащих соответствующие ключевые слова. Затем Google использует векторный индекс для обработки семантического поиска, то есть для поиска содержимого, схожего по смыслу с запросом. Он преобразует текст, изображения и другие материалы в высокоразмерные векторы (embedding) и выполняет поиск на основе сходства между этими векторами. Например, даже если пользователь ищет «как сделать тесто для пиццы», поисковая система может вернуть результаты, связанные с «руководством по приготовлению теста для пиццы», потому что они семантически схожи. После обработки обратного индекса и векторного индекса отбирается примерно сто тысяч веб-страниц.**Многоуровневая сортировка**Системы обычно фильтруют кандидаты на уровне ста тысяч страниц до примерно 1000 страниц с помощью тысяч легких характеристик, таких как BM25, TF-IDF, качество страниц и другие. Эти системы в целом называются рекомендательными движками. Они зависят от множества характеристик, генерируемых различными сущностями, включая поведение пользователей, свойства страниц, намерения запросов и контекстные сигналы. Например, Google учитывает историю пользователей, отзывы других пользователей, семантику страниц, значения запросов и другую информацию, а также контекстные факторы, такие как время (периоды дня, конкретные дни недели) и внешние события, такие как актуальные новости.**Глубокое обучение для основной сортировки**На первой стадии поиска Google использует такие технологии, как RankBrain и Neural Matching, чтобы понять семантику запросов и отобрать первоначально релевантные результаты из огромного объема документов. RankBrain — это система машинного обучения, введенная Google в 2015 году, предназначенная для лучшего понимания смысла пользовательских запросов, особенно тех, которые появляются впервые. Она преобразует запросы и документы в векторные представления и вычисляет их сходство, чтобы найти наиболее релевантные результаты. Например, для запроса «как сделать тесто для пиццы» RankBrain может распознать содержание, связанное с «основой для пиццы» или «приготовлением теста», даже если в документе нет полностью совпадающих ключевых слов.Neural Matching — это еще одна технология, представленная Google в 2018 году, предназначенная для более глубокого понимания семантических отношений между запросами и документами. Она использует модели нейронных сетей для захвата нечетких отношений между словами, что помогает Google лучше сопоставлять запросы и содержимое веб-страниц. Например, для запроса «Почему мой ноутбук издает громкий звук вентилятора» Neural Matching может понять, что пользователь, возможно, ищет информацию по устранению неполадок, связанным с перегревом, накоплением пыли или высоким использованием ЦП, даже если эти слова напрямую не встречаются в запросе.**Глубокая переработка: Применение модели BERT**После предварительного отбора соответствующих документов Google использует модель BERT (Bidirectional Encoder Representations from Transformers) для более тонкой сортировки этих документов, чтобы обеспечить отображение наиболее релевантных результатов в начале. BERT — это предобученная языковая модель на основе Transformer, способная понимать контекстное отношение слов в предложении. В поиске BERT используется для повторной сортировки предварительно найденных документов. Он совместно кодирует запрос и документы, вычисляя баллы релевантности между ними, что позволяет повторно сортировать документы. Например, для запроса «Парковка на склоне без бордюра» BERT может понять значение «без бордюра» и вернуть страницу с рекомендацией для водителей повернуть колеса к обочине, а не неправильно интерпретировать это как наличие бордюра. Для SEO-инженеров это означает необходимость точно изучить алгоритмы сортировки Google и алгоритмы рекомендаций машинного обучения для целевой оптимизации контента веб-страниц с целью получения более высокого ранжирования.Это типичный рабочий процесс поисковой системы Google. Однако в эпоху взрыва ИИ и больших данных у пользователей появились новые требования к взаимодействию с браузером.### Почему ИИ будет переопределять браузерыПрежде всего, нам нужно понять, почему такая форма, как браузер, все еще существует? Существует ли третья форма, кроме искусственных интеллектуальных агентов и браузеров?Мы считаем, что существование невозможно заменить. Почему искусственный интеллект может использовать браузер, но не может полностью заменить его? Потому что браузер является универсальной платформой, он не только вход для чтения данных, но и общий вход для ввода данных. В этом мире не может быть только ввода информации, также необходимо генерировать данные и взаимодействовать с веб-сайтами, поэтому браузеры, которые интегрируют персонализированную пользовательскую информацию, по-прежнему будут широко распространены.Мы захватываем этот момент: браузер как универсальный вход не только для чтения данных, пользователю часто нужно взаимодействовать с данными. Сам браузер является отличным местом для хранения отпечатков пользователей. Более сложные пользовательские действия и автоматизированные действия должны осуществляться через браузер. Браузер может хранить все отпечатки поведения пользователей, пропуска и другую конфиденциальную информацию, обеспечивая ненадежный вызов в процессе автоматизации. А действия, связанные с взаимодействием с данными, могут эволюционировать в:Пользователь → Вызов AI Agent → Браузер.Это означает, что единственной частью, которая может быть заменена, является направление, соответствующее тенденциям мирового развития — более интеллектуальному, более персонализированному и более автоматизированному. Безусловно, эту часть можно доверить AI Agent, но сам AI Agent совершенно не подходит для размещения персонализированного контента пользователей, поскольку он сталкивается с множеством проблем в области безопасности данных и удобства. Более конкретно:Браузер является местом хранения персонализированного контента:* Большинство крупных моделей размещаются в облаке, контекст сеанса зависит от сохранения на сервере, что затрудняет прямой доступ к локальным паролям, кошелькам, Cookie и другим конфиденциальным данным.* Все данные о просмотре и оплате передаются сторонним моделям, необходимо повторно получить разрешение пользователя; как Регламент ЕС о цифровых рынках (DMA), так и законы о конфиденциальности на уровне штата в США требуют минимизации передачи данных за границу.* Автоматическое заполнение кода двухфакторной аутентификации, использование камеры или применение GPU для WebGPU вывода должны выполняться в песочнице браузера.* Данные контекста сильно зависят от браузера, включая вкладки, Cookie, IndexedDB, кэш Service Worker, учетные данные Passkey и данные расширений, которые все хранятся в браузере.### Глубокие изменения в форме взаимодействияВернемся к изначальной теме, поведение пользователей в браузере можно грубо разделить на три формы: чтение данных, ввод данных, взаимодействие с данными. Большие модели искусственного интеллекта (LLM) уже глубоко изменили нашу эффективность и способы чтения данных; ранее поведение пользователей по поиску网页 на основе ключевых слов выглядело очень устаревшим и неэффективным.Эволюция поискового поведения пользователей — это получение резюмирующих ответов или переход на веб-страницы, что уже было предметом многочисленных исследований.В исследовании 2024 года, касающемся моделей поведения пользователей, показано, что в США из каждых 1 000 запросов в Google только 374 завершаются кликом по открытой странице. Иными словами, почти 63% относятся к поведению «ноль кликов». Пользователи привыкли получать информацию о погоде, курсах валют, карточках знаний и т.д. непосредственно со страниц результатов поиска.С точки зрения психологии пользователей, опрос 2023 года показал, что 44% респондентов считают, что обычные естественные результаты более надежны, чем выделенные фрагменты (featured snippet). Академические исследования также показали, что по спорным вопросам или в ситуациях, где нет единой правды, пользователи предпочитают страницы результатов с множеством ссылок на источники.То есть, действительно есть часть пользователей, которые не высоко доверяют AI-резюме, но также значительное количество пользователей уже изменило свое поведение на «нулевые клики». Поэтому AI-браузеру все еще необходимо исследовать подходящую форму взаимодействия — особенно в части чтения данных, поскольку текущая «проблема галлюцинаций» (hallucination) больших моделей все еще не устранена, и многим пользователям по-прежнему трудно полностью доверять автоматически сгенерированным содержательным резюме. В этом аспекте, если встроить большую модель в браузер, на самом деле не требуется революционных изменений в браузере, необходимо лишь постепенно решать вопросы точности и управляемости модели, и это улучшение также продолжается.А настоящей причиной, способной вызвать массовые изменения в браузерах, является уровень взаимодействия с данными. Раньше люди взаимодействовали, вводя ключевые слова — это был предел возможностей браузера. А теперь пользователи все больше склоняются к использованию целых предложений на естественном языке для описания сложных задач, таких как:* «Найти прямые авиабилеты из Нью-Йорка в Лос-Анджелес на определенный период»* «Найти билеты из Нью-Йорка в Шанхай, а затем в Лос-Анджелес»Эти действия, даже для человека, требуют много времени для доступа к нескольким сайтам, сбора и сравнения данных. Но эти Agentic Tasks (агентские задачи) постепенно переходят под контроль AI Agent.Это также соответствует направлению исторической эволюции: автоматизация и интеллектуализация. Люди стремятся освободить руки, AI Agent обязательно будет глубоко встроен в браузер. Будущие браузеры должны быть спроектированы для полной автоматизации, особенно с учетом:* Как совместить опыт чтения для человека с анализируемостью AI-агента,* Как на одной странице обслуживать как пользователей, так и модель агента.Только удовлетворяя этим двум требованиям, браузер сможет действительно стать стабильной платформой для выполнения задач AI Agent.В следующем мы сосредоточимся на пяти наиболее обсуждаемых проектах, включая Browser Use, Arc (The Browser Company), Perplexity, Brave и Donut. Эти проекты представляют собой будущие направления эволюции AI браузеров и их потенциальное органичное сочетание в сценариях Web3 и Crypto.#### **Использование браузера**Это как раз и есть основная логика, стоящая за получением огромного финансирования Perplexity и Browser Use. Особенно Browser Use является второй по степени уверенности и потенциалу роста инновационной возможностью, возникшей в первой половине 2025 года.Browser построил поистине семантический уровень, в центре которого лежит архитектура семантического распознавания для следующего поколения браузеров.Browser Use переопределяет традиционное «DOM = дерево узлов, видимое для человека» в «семантическое DOM = дерево инструкций, видимое для LLM», позволяя агенту точно кликать, заполнять и загружать без необходимости «смотреть на координаты». Этот маршрут заменяет визуальный OCR или координаты Selenium на «структурированный текст → вызов функции», поэтому выполнение происходит быстрее, экономит токены и вызывает меньше ошибок. TechCrunch называет это «клеевым слоем, который позволяет ИИ действительно понимать веб-страницы», а завершенный в марте раунд посевного финансирования на сумму 17 миллионов долларов делает ставку на эту базовую инновацию.HTML после рендеринга формирует стандартное дерево DOM; браузер затем выводит дерево доступности, предоставляя экранным читалкам более богатые «роли» и «статусные» метки.* Абстрагировать каждый интерактивный элемент (например, , и т.д.) в фрагменты JSON с метаданными, такими как роль, видимость, координаты, выполняемые действия и т.д.;* Преобразовать всю страницу в плоский «список семантических узлов», чтобы LLM мог прочитать его за один раз в системном запросе;* Получение высокоуровневых команд от LLM (например, click###node\_id=「btn-Checkout」() и их воспроизведение в настоящем браузере. Официальный блог называет этот процесс «превращением интерфейса сайта в структурированный текст, понятный LLM».Одновременно, как только этот стандарт будет введен в W3C, это сможет в значительной степени решить проблемы ввода в браузерах. Мы используем открытое письмо и случай The Browser Company, чтобы далее объяснить, почему идеи The Browser Company ошибочны.)# **ARC**Компания Browser ### Arc, материнская компания (, в своем открытом письме заявила, что браузер ARC перейдет в стадию регулярного обслуживания, а команда сосредоточит усилия на полностью AI-ориентированном браузере DIA. В письме также указано, что конкретный путь реализации DIA еще не определен. В то же время команда в письме представила несколько прогнозов для будущего рынка браузеров. Исходя из этих прогнозов, мы далее считаем, что для настоящего разрушения существующей структуры браузеров ключевым является изменение вывода на стороне взаимодействия.Вот три прогноза команды ARC о будущем рынка браузеров.Прежде всего, он считает, что веб-страницы больше не являются основным интерфейсом для взаимодействия. Это, безусловно, сложный вывод, и именно это является ключевым моментом, по которому мы сдерживаем свои оценки относительно его основателя. На наш взгляд, эта точка зрения значительно недооценивает роль браузера, и именно это является ключевой проблемой, которую он игнорирует, исследуя путь AI-браузера.Большие модели показывают отличные результаты в захвате намерений, например, в понимании таких команд, как «Помоги мне забронировать билет». Однако они все еще недостаточно эффективны в плане пропускной способности информации. Когда пользователю нужен блокнот в стиле панели инструментов или Bloomberg Terminal, или визуальная платформа, подобная Figma, ничто не может сравниться с преимуществами специализированной веб-страницы с точностью до пикселя. Эргономичный дизайн каждого продукта — графики, функции перетаскивания, горячие клавиши — не является декоративным налетом, а представляет собой сжатую доступность для восприятия. Эти возможности не могут быть обеспечены простым диалоговым взаимодействием. Например, на Gate.com, если пользователь хочет совершить инвестиционные операции, полагаться только на разговор с ИИ совершенно недостаточно, поскольку пользователь сильно зависит от ввода информации, точности и структурированного представления.У команды RC есть существенное отклонение в их представлении о путях, а именно, они не смогли четко различить, что «взаимодействие» состоит из двух измерений: ввода и вывода. С точки зрения ввода, их мнение в некоторых сценариях имеет определенную разумность, действительно, ИИ может повысить эффективность директивного взаимодействия; однако с точки зрения вывода этот вывод явно несбалансирован, игнорируя ключевую роль браузера в представлении информации и персонализированном опыте. Например, у Reddit есть свой уникальный способ компоновки и информационной архитектуры, тогда как у AAVE совершенно другой интерфейс и структура. Браузер как платформа, которая одновременно содержит высоко конфиденциальные данные и может универсально отображать разнообразные интерфейсы продуктов, изначально имеет ограниченные возможности замены на уровне ввода, а на уровне вывода его сложность и нестандартные характеристики еще больше усложняют его разрушение. В сравнении, текущие AI браузеры на рынке больше сосредоточены на уровне «выводов»: резюме веб-страниц, извлечение информации, формулирование выводов, что пока недостаточно для того, чтобы составить серьезную конкуренцию таким основным браузерам или системам поиска, как Google, а лишь делят долю рынка резюме поиска.**Поэтому настоящий конкурент с долей рынка 66% Chrome, очевидно, не будет «следующим Chrome». Для того чтобы достичь такого разрушительного изменения, необходимо коренным образом перестроить режим рендеринга браузера, чтобы он мог адаптироваться к потребностям взаимодействия в эпоху умных технологий, особенно в архитектурном дизайне на входной стороне. Именно поэтому мы больше доверяем технологическому пути, выбранному Browser Use — его внимание сосредоточено на структурной трансформации базовых механизмов браузера. Как только любая система достигает «атомизации» или «модульности», возникающая из этого программируемость и комбинируемость могут привести к разрушительному потенциалу, и именно в этом направлении сейчас движется Browser Use.**В заключение, работа AI Agent все еще сильно зависит от существования браузера. Браузер не только является основным местом хранения сложных персонализированных данных, но также универсальным интерфейсом рендеринга для разнообразных приложений, поэтому в будущем он продолжит быть основным входом для взаимодействия. Поскольку AI Agent глубоко интегрирован в браузер для выполнения фиксированных задач, он будет взаимодействовать с конкретными приложениями, вызывая пользовательские данные, то есть будет в основном действовать на стороне ввода. Для этого существующая модель рендеринга браузера нуждается в инновациях, чтобы достичь максимальной совместимости и адаптации к AI Agent, что позволит более эффективно захватывать приложения.)# **Переплетение**Perplexity — это AI поисковая система, известная своей рекомендательной системой, с последней оценкой в 14 миллиардов долларов, что почти в 5 раз больше, чем 3 миллиарда долларов в июне 2024 года. Она обрабатывает более 400 миллионов поисковых запросов в месяц, в сентябре 2024 года было обработано около 250 миллионов запросов, а количество запросов пользователей увеличилось в 8 раз по сравнению с прошлым годом, количество активных пользователей в месяц превышает 30 миллионов.Основная особенность заключается в том, что он может в реальном времени подводить итоги страницы и занимает преимущество в получении мгновенной информации. В начале этого года он начал разрабатывать свой собственный нативный браузер Comet. Perplexity описывает предстоящий Comet как браузер, который не только «показывает» веб-страницы, но и «размышляет» о них. Официально заявлено, что он будет глубоко интегрирован с движком ответов Perplexity внутри браузера, что соответствует «всеобъемлющему» подходу Стива Джобса: углубить AI-задачи в нижний уровень браузера, а не создавать боковые плагины. Вместо традиционных «десяти синих ссылок» использовать лаконичные ответы с цитированием, чтобы непосредственно конкурировать с Chrome.Но ей все еще необходимо решить две ключевые проблемы: высокие затраты на поиск и низкие маржинальные прибыли от пользователей. Хотя Perplexity уже занимает лидирующие позиции в области AI-поиска, Google также объявила о масштабной интеллектуальной переработке своих основных продуктов на конференции I/O 2025. В рамках переработки браузера Google представила новый опыт вкладки браузера под названием AI Model, который интегрирует функции Overview, Deep Research и будущие функции Agentic, а весь проект называется «Project Mariner». Google активно занимается преобразованием AI, поэтому просто полагаться на поверхностное имитирование функций, такие как Overview, DeepResearch или Agentics, сложно действительно угрожать этому. Настоящая возможность установить новый порядок в хаосе заключается в глубоком переработке архитектуры браузера, внедрении больших языковых моделей (LLM) в ядро браузера и осуществлении кардинальных изменений в способах взаимодействия.#### **Храбрый**Brave является одним из первых и самых успешных браузеров в индустрии Crypto, основанным на архитектуре Chromium, что позволяет ему быть совместимым с плагинами из Google Store. Он привлекает пользователей за счет модели, основанной на конфиденциальности и заработке Tokens во время серфинга. Путь развития Brave в определенной степени демонстрирует его потенциал роста. Однако с точки зрения продукта, конфиденциальность, безусловно, важна, но ее потребность все еще сосредоточена в основном на определенной группе пользователей, и для широкой аудитории осведомленность о конфиденциальности пока не стала основным фактором принятия решений. Таким образом, вероятность того, что эта особенность сможет изменить существующих гигантов, довольно низка.На сегодняшний день количество активных пользователей Brave в месяц достигло 82,7 миллиона, а количество активных пользователей в день составило 35,6 миллиона, доля рынка составляет около 1%–1,5%. Численность пользователей постоянно растет: с 6 миллионов в июле 2019 года до 25 миллионов в январе 2021 года, 57 миллионов в январе 2023 года и более 82 миллионов к февралю 2025 года, среднегодовой темп роста все еще остается двузначным. Среднее количество поисковых запросов в месяц составляет около 1,34 миллиарда, что составляет около 0,3% от Google.Вот итеративная дорожная карта Brave.Brave планирует обновление до AI браузера с приоритетом на конфиденциальность. Однако, из-за ограниченного получения данных пользователей, уровень кастомизации большого модели оказывается низким, что, в свою очередь, затрудняет быструю и точную итерацию продукта. В предстоящую эпоху Agentic Browser Brave, возможно, сохранит стабильную долю среди определенной группы пользователей, ориентированных на конфиденциальность, но вряд ли станет основным игроком. Его AI помощник Leo больше похож на внешнее дополнение, которое лишь усиливает функциональность на основе существующего продукта, обладая определенной способностью к подведению итогов содержания, но пока не имеет четкой стратегии полного перехода к AI Agent, инновации на уровне взаимодействия все еще недостаточны.#### **Пончик**В последнее время индустрия Crypto также добилась успехов в области Agentic Browser. Стартап Donut получил финансирование в размере 7 миллионов долларов на предварительном этапе от Hongshan, HackVC и Bitkraft Ventures. В настоящее время проект все еще находится на стадии ранних концепций, и его видение заключается в реализации интегрированной способности «Исследование — Принятие решений — Крипто-нативное выполнение».Суть этого направления заключается в сочетании автоматизированных путей выполнения, присущих криптовалютам. Как предсказал a16z, в будущем агенты могут заменить поисковые системы в качестве основных входных точек трафика, и предприниматели больше не будут конкурировать вокруг алгоритмов ранжирования Google, а будут бороться за доступ и конверсионный трафик, который обеспечивается выполнением агентами. В отрасли уже назвали эту тенденцию «AEO» (Оптимизация Ответов / Двигатель Агентов), или даже более далеко идущей «ATF» (Выполнение Задач Агентами), то есть больше не оптимизация поискового ранжирования, а прямое обслуживание интеллектуальными моделями, которые могут выполнять для пользователей такие задачи, как размещение заказов, бронирование билетов, написание писем и т.д.### для предпринимателейПрежде всего, необходимо признать: браузер сам по себе остается крупнейшим не реконструированным «главным входом» в мир интернета. По оценкам, в мире насчитывается около 2,1 миллиарда пользователей настольных ПК и более 4,3 миллиарда пользователей мобильных устройств, он является общим носителем для ввода данных, взаимодействия и хранения персонализированных отпечатков. Эта форма существует не из-за инерции, а потому что браузер естественным образом обладает двусторонними свойствами: он является как «входом для чтения» данных, так и «выходом для записи» действий.Таким образом, для предпринимателей настоящим разрушительным потенциалом не является оптимизация на уровне «вывода страниц». Даже если удастся реализовать функции аналогичные AI-обзору Google в новой вкладке, это по сути остается итерацией на уровне браузерных плагинов и не представляет собой коренную трансформацию парадигмы. Настоящим прорывом является «сторона ввода» — то есть как заставить AI-агента активно обращаться к продуктам предпринимателя для выполнения конкретных задач. Это станет ключевым фактором в том, смогут ли будущие продукты интегрироваться в экосистему агентов и получать трафик и распределение ценности.Эпоха поиска拼「点击」; Эпоха агентов拼「调用」。Если вы предприниматель, подумайте о том, чтобы переосмыслить ваш продукт как компонент API — — чтобы интеллект не только мог «понимать» его, но и «вызывать» его. Это требует, чтобы вы с самого начала проектирования продукта учитывали три измерения:**Один, стандартизация структуры интерфейса: ваш продукт «вызываемый»?**Способность продукта быть вызванным агентом зависит от того, может ли его информационная структура быть стандартизирована и абстрагирована в четко определенную схему. Например, могут ли такие ключевые операции, как регистрация пользователя, кнопка заказа, отправка комментариев, быть описаны с помощью семантической структуры DOM или сопоставления JSON? Предоставляет ли система конечный автомат, позволяющий агенту стабильно воспроизводить процесс пользовательского поведения? Поддерживает ли взаимодействие пользователя на странице скриптовое восстановление? Есть ли стабильный доступ к WebHook или API Endpoint?Это и есть основная причина успешного финансирования Browser Use — он преобразует браузер из плоской рендеринговой HTML в семантическое дерево, которое может быть вызвано LLM. Для предпринимателей внедрение подобной дизайнерской концепции в веб-продуктах — это структурированная адаптация к эпохе ИИ-агентов.**Два. Идентификация и проход: можешь помочь Агенту «преодолеть барьеры доверия»?**AI-агенту для завершения сделок, вызова платежей или активов требуется какой-то надежный промежуточный уровень — можешь ли ты им стать? Браузер естественным образом может читать локальное хранилище, вызывать кошелек, распознавать CAPTCHA и подключаться к двухфакторной аутентификации, что и является причиной, по которой он лучше подходит для выполнения задач, чем облачные большие модели. Особенно это актуально в сценах Web3: стандарты интерфейсов для вызова активов на цепи не унифицированы, и агент, не имея «идентичности» или «подписной способности», будет в затруднительном положении.Таким образом, для крипто-предпринимателей здесь есть очень многообещающая белая зона: «MCP (Multi Capability Platform) в мире блокчейна». Это может быть как универсальный уровень команд (позволяющий агенту вызывать Dapp), так и набор стандартизированных интерфейсов контрактов, а также некий легковесный кошелек + платформу идентификации, работающую локально.**Три. Переосмысление механизма流量: будущее - это не SEO, а AEO / ATF**Ранее вам нужно было завоевывать расположение алгоритмов Google; теперь вы должны быть встроены в цепочку задач AI Agent. Это означает, что продукт должен иметь четкую гранулярность задач: это не «страница», а цепочка «вызываемых единиц возможностей»; это означает, что вам нужно начать оптимизацию Agent (AEO) или адаптацию планирования задач (ATF): например, можно ли упростить процесс регистрации до структурированных шагов, можно ли получать цены через интерфейс, можно ли проверять запасы в реальном времени;Вы даже должны начать адаптировать синтаксис вызова под разные LLM фреймы — предпочтения OpenAI и Claude по вызову функций и использованию инструментов не совпадают. Chrome является терминалом к старому миру, а не входом в новый мир. Настоящие перспективные стартапы — это не создание нового браузера, а служение существующим браузерам для Агентов и создание моста для нового поколения «потока команд».* Вам нужно построить «синтаксис интерфейса» для вашего мира, который будет вызываться Агентом;* Вы должны стремиться стать звеном в цепочке доверия интеллектуальных агентов;* То, что вы собираетесь построить, — это «API замок» в следующем поисковом режиме.Если Web2 захватывает внимание пользователей за счет UI, то эпоха Web3 + AI Agent заключается в том, что захватывает намерение выполнения Агентов за счет вызова цепочки.