Деконструкція AI-рамки: від розумних агентів до дослідження децентралізації
Вступ
Розвиток траси AI Agent вражає своєю швидкістю. З моменту, коли "термінал істини" запустив бум агентів, наратив про поєднання AI та криптовалют практично щотижня зазнає нових змін. Нещодавно ринок переключив увагу на "каркасні" проекти, що домінують у технічному наративі. Цей підрозділ за лічені тижні породив кілька чорних коней з капіталізацією понад мільярд або навіть понад десять мільярдів.
Цей тип проектів породив нову модель випуску активів — випуск монет на основі репозиторію коду GitHub, а також агенти, розроблені на основі цієї моделі, можуть випускати токени знову. Ця модель "фреймворк в основі, агент зверху", хоча зовні схожа на платформи випуску активів, насправді є спеціальною інфраструктурною моделлю епохи ШІ. У цій статті ми почнемо з огляду фреймворку і дослідимо глибокий вплив AI фреймворків на сферу криптовалют.
Один. Що таке рамка?
AI фреймворк - це набір інтегрованих попередньо створених модулів, бібліотек та інструментів, що є базовим інструментом або платформою для розробки, який спрощує процес створення складних AI моделей. Його можна розглядати як операційну систему ери AI, таку як настільні Windows, Linux або мобільні iOS та Android. Кожен фреймворк має свої особливості, розробники можуть вільно вибирати відповідно до своїх потреб.
Хоча "AI-рамка" є новим поняттям у сфері криптовалют, її історія розвитку триває вже майже 14 років. У традиційній сфері штучного інтелекту вже існує безліч зрілих рамок, таких як TensorFlow від Google, PyTorch від Meta тощо.
Фреймові проекти, що виникають у сфері криптовалют, в основному розроблені для задоволення великого попиту на агентів, викликаного бумом ШІ, і поступово розширюються на інші сегменти, формуючи різні підгалузі фреймів ШІ. Нижче наведено кілька основних фреймів.
1.1 Еліза
Eliza є багатагруповою моделлю, спеціально призначеною для створення, розгортання та управління автономними AI агентами. Розроблена на базі TypeScript, має хорошу сумісність та можливості інтеграції API.
Eliza в основному орієнтована на соціальні медіа, підтримує інтеграцію з багатьма платформами, включаючи Discord, X/Twitter, Telegram тощо. У обробці медіа-контенту підтримується аналіз PDF-документів, витяг змісту з посилань, транскрипція аудіо, обробка відео, аналіз зображень та інші функції.
Eliza наразі підтримує чотири основні випадки використання:
Додатки класу AI помічник
Роль соціальних медіа
Знання працівники
Інтерактивні ролі
У підтримці моделей Eliza може використовувати відкриті моделі для локальної інференції, а також підтримує використання хмарних сервісів інференції через API.
1.2 Г.А.М.Е
G.A.M.E ( Генеративна Автономна Багатомодальна Система ) є автоматизованою системою генерації та управління багатомодальним ІІ-фреймом, запущеною Virtual, яка в основному орієнтована на дизайн інтелектуальних NPC у іграх. Основна особливість цього фрейму полягає в тому, що навіть користувачі без програмістських знань можуть ним користуватися, просто змінюючи параметри для участі у дизайні Агентів.
Основний дизайн G.A.M.E використовує модульну архітектуру, в якій кілька підсистем працюють спільно, включаючи інтерфейс підказок Agent, підсистему сприйняття, двигун стратегічного планування, світовий контекст, модуль обробки діалогу та інші компоненти.
Робочий процес цієї рамки: розробник запускає Агент через інтерфейс підказок, підсистема сприйняття отримує ввід і передає його до двигуна стратегічного планування. Двигун стратегічного планування використовує різні системи та інформацію для розробки та виконання плану дій. Модуль навчання постійно контролює результати дій Агента і відповідно коригує поведінку.
Окрім ігрової сфери, G.A.M.E фреймворк також підходить для сценаріїв метасвіту, вже кілька проєктів використовують цей фреймворк для розробки.
1.3 Ріг
Rig є відкритим інструментом, написаним мовою Rust, призначеним для спрощення розробки застосунків великих мовних моделей (LLM). Він пропонує єдиний інтерфейс для роботи, що дозволяє розробникам легко взаємодіяти з кількома постачальниками LLM та векторними базами даних.
Основні характеристики Rig включають:
Уніфікований інтерфейс
Модульна архітектура
Типова безпека
Висока ефективність
Робочий процес Rig полягає в наступному: запит користувача спочатку проходить через "абстрактний рівень постачальника", а потім у ядерному рівні, де розумний агент викликає різні інструменти або запитує векторні сховища для отримання інформації. Нарешті, через механізми, такі як підсилене генерування запитів (RAG), система генерує точні та змістовні відповіді, які повертаються користувачу.
Rig підходить для створення систем вирішення проблем, інструментів пошуку документів, чат-ботів або віртуальних асистентів з контекстною обізнаністю, а також підтримує створення контенту.
1.4 ZerePy
ZerePy є відкритим фреймворком на базі Python, який має на меті спростити процес розгортання та управління AI Agent на платформі X (колишній Twitter). Він успадковує основні функції проекту Zerebro, але має більш модульний та розширюваний дизайн.
ZerePy надає інтерфейс командного рядка (CLI), що дозволяє користувачам керувати та контролювати розгорнутими AI Agent. Його основна архітектура заснована на модульному дизайні, який включає:
Інтеграція LLM
Інтеграція платформи X
Модульна система з'єднань
Система пам'яті (в розробці)
У порівнянні з проектом Eliza від a16z, ZerePy більше зосереджується на спрощенні процесу розгортання AI Agent на конкретних соціальних платформах (X), орієнтуючись на практичне застосування.
Два, Копія екосистеми BTC
Шляхи розвитку AI Agent мають багато спільного з нещодавньою екосистемою BTC. Розвиток екосистеми BTC можна узагальнити як: BRC20 - конкуренція між кількома протоколами - BTC L2 - BTCFi з ядром на Babylon. А AI Agent розвивається швидше на основі зрілого традиційного стеку технологій AI, його шлях можна узагальнити як: конкуренція між GOAT/ACT - соціальними агентами та аналітичними AI агентами.
Незважаючи на подібності, траса AI Agent навряд чи стане однорідною та бульбашковою, як екосистема BTC. Проекти AI-фреймворку пропонують нові підходи до розвитку інфраструктури, більше нагадуючи майбутні публічні блокчейни, тоді як Agent схожий на майбутні Dapp.
У сучасній екосистемі криптовалют у нас є тисячі публічних блокчейнів та десятки тисяч Dapp. Загальні блокчейни включають BTC, Ethereum та різні гетерогенні ланцюги, а прикладні ланцюги є ще більш різноманітними. У майбутньому суперечки можуть перейти від боротьби EVM та гетерогенних ланцюгів до боротьби за рамки, ключове питання полягає в тому, як реалізувати Децентралізацію або "ланцюговість", а також у значенні розробки цих проектів на блокчейні.
Три, яке значення має запис у блокчейн?
Блокчейн, коли поєднується з чимось, завжди стикається з однією ключовою проблемою: чи є це поєднання сенсом? Оглядаючи успішний досвід DeFi, його переваги полягають у забезпеченні вищої доступності, кращої ефективності та нижчих витрат, а також у безпечності, що не вимагає довіри до централізації. Виходячи з цієї ідеї, ланцюгове впровадження AI Agent може мати такі кілька причин:
Знизити витрати на використання, підвищити доступність та вибір, щоб звичайні користувачі також могли брати участь у "оренді права" AI.
Надання безпечного рішення на основі блокчейну, яке відповідає вимогам безпеки під час взаємодії Агента з реальним або віртуальним світом.
Створення унікальної фінансової моделі на основі блокчейн, яка дозволяє звичайним користувачам брати участь в автоматичному маркет-мейкінгу або інвестувати в ресурси, необхідні для агентів, такі як обчислювальна потужність, маркування даних тощо.
Реалізація прозорого, відстежуваного процесу міркування може бути більш привабливою, ніж агентні браузери, які пропонують традиційні інтернет-гіганти.
Чотири, нові можливості креативної економіки
Фреймові проекти в майбутньому можуть запропонувати можливості для підприємництва, подібні до GPT Store. Хоча наразі випуск агентів через фрейми залишається складним для звичайних користувачів, спрощення процесу створення агентів та надання фреймів для складних комбінацій функцій, ймовірно, займе перевагу в майбутньому. Це створить більш цікаву креативну економіку Web3, ніж GPT Store.
На відміну від поточного GPT Store, який в основному контролюється традиційними компаніями Web2, AI креативна економіка в сфері Web3 може бути більш справедливою та впровадити спільноту економіку для вдосконалення агентів. Це надасть звичайним людям можливості для участі, а майбутні AI Meme проекти можуть бути більш розумними та цікавими, ніж існуючі агенти.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Деконструкція AI-рамки: від інтелектуальних агентів до децентралізованої майбутньої концепції
Деконструкція AI-рамки: від розумних агентів до дослідження децентралізації
Вступ
Розвиток траси AI Agent вражає своєю швидкістю. З моменту, коли "термінал істини" запустив бум агентів, наратив про поєднання AI та криптовалют практично щотижня зазнає нових змін. Нещодавно ринок переключив увагу на "каркасні" проекти, що домінують у технічному наративі. Цей підрозділ за лічені тижні породив кілька чорних коней з капіталізацією понад мільярд або навіть понад десять мільярдів.
Цей тип проектів породив нову модель випуску активів — випуск монет на основі репозиторію коду GitHub, а також агенти, розроблені на основі цієї моделі, можуть випускати токени знову. Ця модель "фреймворк в основі, агент зверху", хоча зовні схожа на платформи випуску активів, насправді є спеціальною інфраструктурною моделлю епохи ШІ. У цій статті ми почнемо з огляду фреймворку і дослідимо глибокий вплив AI фреймворків на сферу криптовалют.
Один. Що таке рамка?
AI фреймворк - це набір інтегрованих попередньо створених модулів, бібліотек та інструментів, що є базовим інструментом або платформою для розробки, який спрощує процес створення складних AI моделей. Його можна розглядати як операційну систему ери AI, таку як настільні Windows, Linux або мобільні iOS та Android. Кожен фреймворк має свої особливості, розробники можуть вільно вибирати відповідно до своїх потреб.
Хоча "AI-рамка" є новим поняттям у сфері криптовалют, її історія розвитку триває вже майже 14 років. У традиційній сфері штучного інтелекту вже існує безліч зрілих рамок, таких як TensorFlow від Google, PyTorch від Meta тощо.
Фреймові проекти, що виникають у сфері криптовалют, в основному розроблені для задоволення великого попиту на агентів, викликаного бумом ШІ, і поступово розширюються на інші сегменти, формуючи різні підгалузі фреймів ШІ. Нижче наведено кілька основних фреймів.
1.1 Еліза
Eliza є багатагруповою моделлю, спеціально призначеною для створення, розгортання та управління автономними AI агентами. Розроблена на базі TypeScript, має хорошу сумісність та можливості інтеграції API.
Eliza в основному орієнтована на соціальні медіа, підтримує інтеграцію з багатьма платформами, включаючи Discord, X/Twitter, Telegram тощо. У обробці медіа-контенту підтримується аналіз PDF-документів, витяг змісту з посилань, транскрипція аудіо, обробка відео, аналіз зображень та інші функції.
Eliza наразі підтримує чотири основні випадки використання:
У підтримці моделей Eliza може використовувати відкриті моделі для локальної інференції, а також підтримує використання хмарних сервісів інференції через API.
1.2 Г.А.М.Е
G.A.M.E ( Генеративна Автономна Багатомодальна Система ) є автоматизованою системою генерації та управління багатомодальним ІІ-фреймом, запущеною Virtual, яка в основному орієнтована на дизайн інтелектуальних NPC у іграх. Основна особливість цього фрейму полягає в тому, що навіть користувачі без програмістських знань можуть ним користуватися, просто змінюючи параметри для участі у дизайні Агентів.
Основний дизайн G.A.M.E використовує модульну архітектуру, в якій кілька підсистем працюють спільно, включаючи інтерфейс підказок Agent, підсистему сприйняття, двигун стратегічного планування, світовий контекст, модуль обробки діалогу та інші компоненти.
Робочий процес цієї рамки: розробник запускає Агент через інтерфейс підказок, підсистема сприйняття отримує ввід і передає його до двигуна стратегічного планування. Двигун стратегічного планування використовує різні системи та інформацію для розробки та виконання плану дій. Модуль навчання постійно контролює результати дій Агента і відповідно коригує поведінку.
Окрім ігрової сфери, G.A.M.E фреймворк також підходить для сценаріїв метасвіту, вже кілька проєктів використовують цей фреймворк для розробки.
1.3 Ріг
Rig є відкритим інструментом, написаним мовою Rust, призначеним для спрощення розробки застосунків великих мовних моделей (LLM). Він пропонує єдиний інтерфейс для роботи, що дозволяє розробникам легко взаємодіяти з кількома постачальниками LLM та векторними базами даних.
Основні характеристики Rig включають:
Робочий процес Rig полягає в наступному: запит користувача спочатку проходить через "абстрактний рівень постачальника", а потім у ядерному рівні, де розумний агент викликає різні інструменти або запитує векторні сховища для отримання інформації. Нарешті, через механізми, такі як підсилене генерування запитів (RAG), система генерує точні та змістовні відповіді, які повертаються користувачу.
Rig підходить для створення систем вирішення проблем, інструментів пошуку документів, чат-ботів або віртуальних асистентів з контекстною обізнаністю, а також підтримує створення контенту.
1.4 ZerePy
ZerePy є відкритим фреймворком на базі Python, який має на меті спростити процес розгортання та управління AI Agent на платформі X (колишній Twitter). Він успадковує основні функції проекту Zerebro, але має більш модульний та розширюваний дизайн.
ZerePy надає інтерфейс командного рядка (CLI), що дозволяє користувачам керувати та контролювати розгорнутими AI Agent. Його основна архітектура заснована на модульному дизайні, який включає:
У порівнянні з проектом Eliza від a16z, ZerePy більше зосереджується на спрощенні процесу розгортання AI Agent на конкретних соціальних платформах (X), орієнтуючись на практичне застосування.
Два, Копія екосистеми BTC
Шляхи розвитку AI Agent мають багато спільного з нещодавньою екосистемою BTC. Розвиток екосистеми BTC можна узагальнити як: BRC20 - конкуренція між кількома протоколами - BTC L2 - BTCFi з ядром на Babylon. А AI Agent розвивається швидше на основі зрілого традиційного стеку технологій AI, його шлях можна узагальнити як: конкуренція між GOAT/ACT - соціальними агентами та аналітичними AI агентами.
Незважаючи на подібності, траса AI Agent навряд чи стане однорідною та бульбашковою, як екосистема BTC. Проекти AI-фреймворку пропонують нові підходи до розвитку інфраструктури, більше нагадуючи майбутні публічні блокчейни, тоді як Agent схожий на майбутні Dapp.
У сучасній екосистемі криптовалют у нас є тисячі публічних блокчейнів та десятки тисяч Dapp. Загальні блокчейни включають BTC, Ethereum та різні гетерогенні ланцюги, а прикладні ланцюги є ще більш різноманітними. У майбутньому суперечки можуть перейти від боротьби EVM та гетерогенних ланцюгів до боротьби за рамки, ключове питання полягає в тому, як реалізувати Децентралізацію або "ланцюговість", а також у значенні розробки цих проектів на блокчейні.
Три, яке значення має запис у блокчейн?
Блокчейн, коли поєднується з чимось, завжди стикається з однією ключовою проблемою: чи є це поєднання сенсом? Оглядаючи успішний досвід DeFi, його переваги полягають у забезпеченні вищої доступності, кращої ефективності та нижчих витрат, а також у безпечності, що не вимагає довіри до централізації. Виходячи з цієї ідеї, ланцюгове впровадження AI Agent може мати такі кілька причин:
Знизити витрати на використання, підвищити доступність та вибір, щоб звичайні користувачі також могли брати участь у "оренді права" AI.
Надання безпечного рішення на основі блокчейну, яке відповідає вимогам безпеки під час взаємодії Агента з реальним або віртуальним світом.
Створення унікальної фінансової моделі на основі блокчейн, яка дозволяє звичайним користувачам брати участь в автоматичному маркет-мейкінгу або інвестувати в ресурси, необхідні для агентів, такі як обчислювальна потужність, маркування даних тощо.
Реалізація прозорого, відстежуваного процесу міркування може бути більш привабливою, ніж агентні браузери, які пропонують традиційні інтернет-гіганти.
Чотири, нові можливості креативної економіки
Фреймові проекти в майбутньому можуть запропонувати можливості для підприємництва, подібні до GPT Store. Хоча наразі випуск агентів через фрейми залишається складним для звичайних користувачів, спрощення процесу створення агентів та надання фреймів для складних комбінацій функцій, ймовірно, займе перевагу в майбутньому. Це створить більш цікаву креативну економіку Web3, ніж GPT Store.
На відміну від поточного GPT Store, який в основному контролюється традиційними компаніями Web2, AI креативна економіка в сфері Web3 може бути більш справедливою та впровадити спільноту економіку для вдосконалення агентів. Це надасть звичайним людям можливості для участі, а майбутні AI Meme проекти можуть бути більш розумними та цікавими, ніж існуючі агенти.