Разбор фреймворков искусственного интеллекта: от интеллектуальных агентов к исследованию децентрализации

Средний1/16/2025, 6:03:33 AM
Эта статья рассматривает тенденции развития и логику инвестирования в сфере AI Agent, с особым акцентом на детальном анализе проектов на основе фреймворков. Она представляет основные концепции и функциональности AI фреймворков, и демонстрирует их производительность и потенциал в различных сценариях применения через конкретные кейс-стади, такие как Eliza, G.A.M.E, Rig и ZerePy. Кроме того, с технических, рыночных и инвестиционных точек зрения, статья сравнивает сходства между AI Agents и экосистемой BTC, исследуя значимость приведения AI Agents на блокчейн и потенциальных инноваций, которые это может принести в будущем.

Введение

В предыдущих статьях мы часто обсуждали наши взгляды на текущее состояние AI Memes и будущее развитие AI Agents. Однако быстрое развитие повествования и эволюция трека AI Agent все еще оказались в какой-то степени подавляющими. За короткие два месяца с момента запуска «Truth Terminal» и начала Agent Summer, повествование о интеграции AI и криптовалюты развивалось практически еженедельно. Недавно внимание рынка начало переключаться на «фреймворк» проекты, которые в основном определяются технологическими повествованиями. Это узкое подполе уже породило несколько проектов-единорогов с рыночной капитализацией более миллиарда долларов за последние несколько недель. Эти проекты также привели к новой парадигме выпуска активов, где проекты выпускают токены на основе своих репозиториев кода GitHub, а Agents, построенные на этих фреймворках, также могут выпускать токены. В основе этой структуры у нас есть фреймворки, с Agents в качестве верхнего уровня. Это напоминает платформу выпуска активов, но на самом деле это уникальная инфраструктурная модель, появляющаяся в эпоху AI. Как нам следует относиться к этому новому тренду? Эта статья начнется с введения в фреймворки и предложит толкование того, что AI фреймворки означают для Crypto, объединяя эти идеи с нашими собственными размышлениями.

I. Что такое фреймворк?

По определению, фреймворк ИИ — это базовый инструмент разработки или платформа, которая интегрирует набор готовых модулей, библиотек и инструментов для упрощения процесса создания сложных моделей ИИ. Эти платформы обычно также включают функции для обработки данных, обучения моделей и составления прогнозов. Проще говоря, вы можете думать о фреймворке как об операционной системе для эпохи искусственного интеллекта, аналогичной настольным операционным системам, таким как Windows или Linux, или мобильным операционным системам, таким как iOS и Android. Каждый фреймворк имеет свои преимущества и недостатки, что позволяет разработчикам выбирать, исходя из своих конкретных потребностей.

Хотя термин "фреймворк искусственного интеллекта" все еще является относительно новым концептом в сфере криптовалют, его разработка началась почти 14 лет назад, начиная с Theano в 2010 году. В традиционном сообществе искусственного интеллекта и в академической и в промышленной сферах уже есть очень зрелые фреймворки на выбор, такие как TensorFlow от Google, PyTorch от Meta, PaddlePaddle от Baidu и MagicAnimate от ByteDance, каждый из которых имеет свои преимущества в различных сценариях.

Проекты фреймворка искусственного интеллекта, которые в настоящее время появляются в криптовалюте, основаны на спросе на большое количество агентов, возникающем в связи с бумом искусственного интеллекта, и эти проекты дальше разветвляются на другие направления в криптовалюте, в результате образуя различные фреймворки искусственного интеллекта для конкретных подобластей. Давайте рассмотрим некоторые из текущих основных фреймворков в отрасли, чтобы лучше проиллюстрировать этот момент.

1.1 Элиза

Во-первых, давайте рассмотрим Eliza, фреймворк, созданный ai16z. Это мультиагентный симуляционный фреймворк, разработанный для создания, развертывания и управления автономными искусственными интеллектуальными агентами. Разработанный с использованием TypeScript в качестве языка программирования, его преимущество заключается в лучшей совместимости и более простой интеграции API. Согласно официальной документации, Eliza в первую очередь предназначена для социальных медиа, предлагая поддержку многоплатформенной интеграции. Фреймворк предоставляет полнофункциональную интеграцию Discord, поддерживая голосовые каналы, автоматические учетные записи для X/Twitter, интеграцию Telegram и прямой доступ к API. В части обработки медиа-контента он поддерживает чтение и анализ PDF-документов, извлечение и суммирование ссылок, транскрипцию аудио, обработку видеоконтента, анализ изображений и сводки бесед.

Сценарии использования, поддерживаемые Eliza в настоящее время, включают следующие четыре категории:

  1. Приложения AI Assistant: агенты службы поддержки клиентов, администраторы сообщества, персональные ассистенты.
  2. Роли в социальных сетях: автоматические создатели контента, интерактивные боты, представители бренда.
  3. Работники знаний: исследовательские помощники, аналитики контента, обработчики документов.
  4. Интерактивные роли: персонажи, обучающие тьюторы, развлекательные боты.

Модели, поддерживаемые в настоящее время Элизой, следующие:

  1. Модели локального вывода с открытым исходным кодом: такие как Llama3, Qwen1.5, BERT.
  2. Облачная вывод через OpenAI API.
  3. Конфигурация по умолчанию как Nous Hermes Llama 3.1B.
  4. Интеграция с Claude для выполнения сложных запросов.

1.2 G.A.M.E

G.A.M.E (Generative Autonomous Multimodal Entities Framework) - это мультимодальная ИИ-платформа для автоматического создания и управления, запущенная компанией Virtual. Она в первую очередь предназначена для разработки интеллектуального дизайна NPC в играх. Одной из уникальных особенностей этой платформы является то, что она позволяет даже пользователям с низким или отсутствующим уровнем кодирования участвовать в проектировании Агентов, просто изменяя параметры через ее пробное интерфейс.

Что касается архитектуры проекта, G.A.M.E построен на модульном дизайне, где несколько подсистем работают в сотрудничестве. Подробная архитектура следующая:

  1. Интерфейс подсказок агента: Интерфейс для разработчиков для взаимодействия с ИИ-фреймворком. Через этот интерфейс разработчики могут инициировать сеанс и указать идентификаторы сеансов, идентификаторы агентов, идентификаторы пользователей и другие параметры.
  2. Подсистема восприятия: отвечает за прием входной информации, синтезирование ее и отправку в стратегический плановый двигатель. Она также обрабатывает ответы от модуля обработки диалога.
  3. Strategic Planning Engine: The core of the entire framework, divided into a high-level planner and low-level policy. The high-level planner is responsible for formulating long-term goals and plans, while the low-level policy translates these plans into specific actions.
  4. Контекст мира: содержит информацию об окружающей среде, состоянии мира и данных игры, помогая агентам понять свой текущий контекст.
  5. Модуль обработки диалога: Обрабатывает сообщения и ответы, генерируя диалоги или реакции в качестве выходных данных.
  6. Оператор кошелька на блокчейне: Вероятно, связан с применением технологии блокчейн, хотя конкретные функции неясны.
  7. Модуль обучения: Учится на основе обратной связи и обновляет базу знаний агента.
  8. Рабочая память: Хранит недавние действия, результаты и текущие планы, среди прочей краткосрочной информации.
  9. Процессор долгосрочной памяти: извлекает и ранжирует важную информацию о агенте и его рабочей памяти на основе таких факторов, как важность, свежесть и актуальность.
  10. Хранилище агента: Хранит цели, размышления, опыт и характеристики агента.
  11. Планировщик действий: Генерирует конкретные планы действий на основе стратегий низкого уровня.
  12. Исполнитель плана: выполняет планы действий, созданные планировщиком действий.

Workflow: Разработчики запускают агента через интерфейс агентского подтверждения, где подсистема восприятия получает входные данные и отправляет их в стратегический планировщик. С помощью системы памяти, контекста мира и репозитория агентов движок формулирует и выполняет план действий. Модуль обучения отслеживает действия агента и соответствующим образом корректирует его поведение.

Сценарии применения: Исходя из общей технической архитектуры, этот фреймворк сосредоточен на принятии решений, обратной связи, восприятии и индивидуальности Агентов в виртуальных средах. Помимо игр, этот фреймворк также применим в Метавселенной. Список ниже от Virtual показывает, что многие проекты уже приняли этот фреймворк для строительства.

1.3 Риг

Rig - это инструмент с открытым исходным кодом, написанный на языке Rust, специально разработанный для упрощения разработки приложений на основе больших языковых моделей (LLM). Он предоставляет единый интерфейс, который позволяет разработчикам легко взаимодействовать с несколькими поставщиками услуг LLM (такими как OpenAI и Anthropic) и различными векторными базами данных (например, MongoDB и Neo4j).

Основные особенности:

  • Единый интерфейс: Независимо от того, какой провайдер LLM или хранилище векторов используется, Rig предлагает единый метод доступа, что существенно упрощает интеграцию.
  • Модульная архитектура: Фреймворк использует модульный дизайн, который включает ключевые компоненты, такие как «Уровень абстракции поставщика», «Интерфейс хранения векторов» и «Система интеллектуальных агентов», обеспечивая гибкость и масштабируемость системы.
  • Безопасность типов: Используя возможности Rust, Rig достигает безопасности типов в операциях встраивания, обеспечивая качество кода и безопасность времени выполнения.
  • Высокая производительность: Система поддерживает асинхронное программирование, оптимизируя возможности параллельной обработки. Встроенные функции журналирования и мониторинга помогают в обслуживании и устранении неполадок.

Workflow: При входе пользователя в систему Rig запрос сначала проходит через «Уровень абстракции поставщика», который стандартизирует различия между различными поставщиками и обеспечивает последовательную обработку ошибок. В ядре слоя интеллектуальные агенты могут вызывать различные инструменты или запрашивать векторное хранилище для получения необходимой информации. Наконец, продвинутые механизмы, такие как Retrieval-Augmented Generation (RAG), объединяют извлечение документов и контекстное понимание для генерации точных и содержательных ответов перед их возвратом пользователю.

Применение: Rig подходит для создания систем, требующих быстрого и точного ответа на вопросы, создания эффективных инструментов поиска документов, разработки чат-ботов или виртуальных помощников, а также поддержки создания контента путем автоматического создания текста или других форм контента на основе существующих данных.

1.4 ZerePy

ZerePy - это открытая платформа на основе Python, разработанная для упрощения развертывания и управления искусственными интеллектуальными агентами на платформе X (ранее известной как Twitter). Она развилась из проекта Zerebro и унаследовала его основные функции, но была разработана более модульным и масштабируемым образом. Цель состоит в том, чтобы позволить разработчикам легко создавать персонализированных искусственных интеллектуальных агентов и внедрять различные задачи автоматизации и создания контента на платформе X.

ZerePy предоставляет интерфейс командной строки (CLI), что позволяет пользователям удобно управлять агентами ИИ, которые они развертывают. Его базовая архитектура является модульной, что позволяет разработчикам гибко интегрировать различные функциональные модули, такие как:

  • Интеграция LLM: ZerePy поддерживает большие языковые модели (LLM) от OpenAI и Anthropic, что позволяет разработчикам выбрать наиболее подходящую модель для своего приложения. Это позволяет агентам генерировать высококачественный текстовый контент.
  • Интеграция с платформой X: Фреймворк напрямую интегрируется с API X, позволяя агентам выполнять такие задачи, как публикация, ответ, лайк и ретвит.
  • Модульная система подключения: Эта система позволяет разработчикам легко добавлять поддержку других социальных платформ или услуг, расширяя функциональность фреймворка.
  • Система памяти (планы на будущее): Хотя в текущей версии она не полностью реализована, цель дизайна ZerePy включает интеграцию системы памяти, которая позволит агентам запоминать предыдущие взаимодействия и контекстуальную информацию для создания более связного и персонализированного контента.

В то время как ZerePy и проект Eliza от a16z стремятся строить и управлять AI-агентами, они отличаются архитектурой и акцентом. Eliza более ориентирована на мультиагентные симуляции и более широкое исследование искусственного интеллекта, в то время как ZerePy фокусируется на упрощении развертывания AI-агентов на конкретных социальных платформах (X), что делает его более ориентированным на приложения.

II. Реплика BTC экосистемы

С точки зрения пути развития, искусственные интеллект-агенты имеют много общего с экосистемой BTC с конца 2023 по начало 2024 года. Путь развития экосистемы BTC можно кратко описать следующим образом: конкуренция между много-протокольными проектами BRC20-Atomical/Rune и другими — BTC L2 — BTCFi, сосредоточенный вокруг Вавилона. В то же время искусственные интеллект-агенты развиваются быстрее на основе зрелых традиционных технологических решений искусственного интеллекта, и их общий путь развития отражает некоторые особенности экосистемы BTC. Я бы описал его следующим образом: GOAT/ACT — агенты типа социальных сетей — конкуренция фреймворков аналитических искусственных интеллект-агентов. С точки зрения тенденций, проекты инфраструктуры, сфокусированные на децентрализации и безопасности вокруг агентов, вероятно, также продолжат эту волну развития, став следующей доминирующей темой.

Итак, приведет ли этот трек, как экосистема BTC, к однородности и образованию пузырей? Я так не думаю. Во-первых, повествование об искусственном интеллекте не сводится к воссозданию истории цепочек смарт-контрактов. Во-вторых, независимо от того, являются ли эти существующие проекты фреймворков искусственного интеллекта технически сильными или все еще застряли на этапе презентации или просто копированием и вставкой, они по крайней мере предоставляют новый подход к развитию инфраструктуры. Многие статьи сравнивают фреймворки искусственного интеллекта с платформами выпуска активов, а агентов - сами активы. Однако, по сравнению с платформами запуска Memecoin и протоколами надписи, я лично считаю, что фреймворки искусственного интеллекта напоминают будущие общедоступные цепочки, а агенты напоминают будущие DApps.

В сегодняшнем крипто-пространстве у нас есть тысячи публичных цепей и десятки тысяч DApps. В мире универсальных цепей у нас есть BTC, Ethereum и различные гетерогенные цепи, а формы прикладных цепей более разнообразны, такие как игровые цепи, цепи хранения и цепи Dex. Публичные цепи и фреймворки искусственного интеллекта в своей природе довольно похожи, и DApps могут хорошо соответствовать агентам.

В эпоху криптовалют в искусственном интеллекте весьма вероятно, что пространство будет развиваться в этом направлении, и будущие дебаты сместятся от EVM против гетерогенных цепочек к дебатам о фреймворках. В настоящее время речь идет скорее о децентрализации, или о том, как ее «зацепить». Я верю, что будущие инфраструктурные проекты в области искусственного интеллекта будут развиваться вокруг этого фундамента. Еще один важный момент: какое значение имеет это в блокчейне?

III. Значимость On-Chain

Независимо от того, с чем объединяется блокчейн, он в конечном итоге сталкивается с одним критическим вопросом: имеет ли это смысл? В прошлогодней статье я критиковал GameFi за неправильные приоритеты, где развитие инфраструктуры было чрезмерно продвинутым, а в предыдущих статьях об искусственном интеллекте я выразил скептицизм относительно текущей практичности сочетания искусственного интеллекта с криптовалютой. В конце концов, мотивирующая сила для традиционных проектов все более ослабевает. Немногие традиционные проекты, которые прошлого года показали хорошие результаты с точки зрения цены токена, в основном были теми, которые могли соответствовать или превзойти силу цены.

Что может сделать искусственный интеллект для криптовалюты? Ранее я думал о таких случаях использования, как агенты искусственного интеллекта, выполняющие задачи от имени пользователей, Метавселенная и агенты в качестве сотрудников - относительно обыденные идеи, но с определенными требованиями. Однако эти требования не требуют полной ончейн реализации, и с точки зрения бизнес-логики они не могут образовать замкнутый цикл. Упомянутый в последней статье агент-браузер, который реализует намерения, может генерировать требования к разметке данных и вычислительной мощности для вывода, но эти два элемента все еще не тесно интегрированы, и с точки зрения вычислительной мощности централизованные вычисления все еще имеют преимущество.

Вернувшись к успеху DeFi, причина успеха DeFi заключается в том, что он обеспечивает большую доступность, лучшую эффективность, более низкие затраты и безопасность без доверия. Если мы рассмотрим эту структуру, я думаю, что может быть несколько причин, почему 'цепная' экономика агентов может иметь смысл:

  1. Снижение затрат: может ли цепочка агентов снизить затраты на использование, тем самым обеспечивая большую доступность и больший выбор для пользователей? Это в конечном итоге может позволить обычным пользователям участвовать в том, что традиционно было исключительной областью "аренды" искусственного интеллекта веб-гигантов технологий Web2.
  2. Безопасность: По самому простому определению, агент - это ИИ, который может взаимодействовать с виртуальным или реальным миром. Если агент может вмешиваться в реальный мир или даже в мой виртуальный кошелек, то безопасные решения на основе блокчейна могут стать необходимостью.
  3. Финансовая игра, специфичная для блокчейна: Могут ли агенты создавать уникальный набор финансовых механизмов на блокчейне? Например, в AMM (Автоматический маркет-мейкер), поставщики ликвидности (LP) позволяют обычным пользователям участвовать в автоматизированном маркет-мейкинге. Аналогично, если агентам требуется вычислительная мощность или разметка данных, пользователи могут инвестировать в эти протоколы в форме USDT, основываясь на их доверии к системе. Или агенты в различных сценариях применения могут формировать новые финансовые структуры.
  4. Межоперабельность DeFi: В настоящее время DeFi не обладает идеальной межоперабельностью, но агенты могут решить эту проблему, позволяя прозрачные, отслеживаемые процессы рассуждений и заполняя пробелы.

IV. Творчество?

Проекты фреймворка в будущем также будут предоставлять предпринимательские возможности, аналогичные GPT Store. Хотя запуск агента через фреймворк все еще сложен для обычных пользователей, я считаю, что упрощение процесса создания агента и предоставление более сложных комбинаций функций дадут таким фреймворкам конкурентное преимущество в будущем. Это может привести к созданию Web3-творческой экономики, которая будет намного интереснее, чем GPT Store.

В настоящее время GPT Store все еще более ориентирован на традиционные практические применения, и большинство популярных приложений создаются традиционными компаниями Web2. Кроме того, доход, генерируемый в основном, монополизируется создателями. Согласно официальному объяснению OpenAI, стратегия заключается в предоставлении финансовой поддержки выдающимся разработчикам в Соединенных Штатах, предлагая субсидии до определенной суммы.

С точки зрения спроса, Web3 все еще имеет много пробелов, и с экономической точки зрения он может сделать политику несправедливых гигантов Web2 более справедливой. Кроме того, мы естественным образом можем ввести сообщественные экономики для дальнейшего улучшения агентов. Творческая экономика вокруг агентов предоставит обычным людям возможность участия. В будущем AI мемы будут гораздо умнее и интереснее, чем агенты, выпущенные GOAT или Clanker.

О YBB

YBB - это фонд веб-3, посвященный выявлению проектов, определяющих веб-3, с целью создания лучшей онлайн-среды для всех жителей Интернета. Основанный группой приверженцев блокчейна, активно участвующих в этой отрасли с 2013 года, YBB всегда готов помочь проектам начальной стадии развития от 0 до 1. Мы ценим инновации, самодвиженческую страсть и продукты, ориентированные на пользователя, признавая потенциал криптовалют и блокчейн-приложений.

Веб-сайт | Twi: @YBBCapital

Отказ от ответственности:

  1. Эта статья печатается из [ YBB Capital]. Все авторские права принадлежат оригинальному автору [Исследователь YBB Capital Зик]. Если есть возражения по поводу этого переиздания, пожалуйста, свяжитесь с Gate Learnкоманда, и они обработают это незамедлительно.
  2. Отказ от ответственности: Взгляды и мнения, выраженные в этой статье, являются исключительно взглядами автора и не являются инвестиционным советом.
  3. Команда gate Learn перевела статью на другие языки. Копирование, распространение или плагиат переведенных статей запрещены, если не указано иное.

Разбор фреймворков искусственного интеллекта: от интеллектуальных агентов к исследованию децентрализации

Средний1/16/2025, 6:03:33 AM
Эта статья рассматривает тенденции развития и логику инвестирования в сфере AI Agent, с особым акцентом на детальном анализе проектов на основе фреймворков. Она представляет основные концепции и функциональности AI фреймворков, и демонстрирует их производительность и потенциал в различных сценариях применения через конкретные кейс-стади, такие как Eliza, G.A.M.E, Rig и ZerePy. Кроме того, с технических, рыночных и инвестиционных точек зрения, статья сравнивает сходства между AI Agents и экосистемой BTC, исследуя значимость приведения AI Agents на блокчейн и потенциальных инноваций, которые это может принести в будущем.

Введение

В предыдущих статьях мы часто обсуждали наши взгляды на текущее состояние AI Memes и будущее развитие AI Agents. Однако быстрое развитие повествования и эволюция трека AI Agent все еще оказались в какой-то степени подавляющими. За короткие два месяца с момента запуска «Truth Terminal» и начала Agent Summer, повествование о интеграции AI и криптовалюты развивалось практически еженедельно. Недавно внимание рынка начало переключаться на «фреймворк» проекты, которые в основном определяются технологическими повествованиями. Это узкое подполе уже породило несколько проектов-единорогов с рыночной капитализацией более миллиарда долларов за последние несколько недель. Эти проекты также привели к новой парадигме выпуска активов, где проекты выпускают токены на основе своих репозиториев кода GitHub, а Agents, построенные на этих фреймворках, также могут выпускать токены. В основе этой структуры у нас есть фреймворки, с Agents в качестве верхнего уровня. Это напоминает платформу выпуска активов, но на самом деле это уникальная инфраструктурная модель, появляющаяся в эпоху AI. Как нам следует относиться к этому новому тренду? Эта статья начнется с введения в фреймворки и предложит толкование того, что AI фреймворки означают для Crypto, объединяя эти идеи с нашими собственными размышлениями.

I. Что такое фреймворк?

По определению, фреймворк ИИ — это базовый инструмент разработки или платформа, которая интегрирует набор готовых модулей, библиотек и инструментов для упрощения процесса создания сложных моделей ИИ. Эти платформы обычно также включают функции для обработки данных, обучения моделей и составления прогнозов. Проще говоря, вы можете думать о фреймворке как об операционной системе для эпохи искусственного интеллекта, аналогичной настольным операционным системам, таким как Windows или Linux, или мобильным операционным системам, таким как iOS и Android. Каждый фреймворк имеет свои преимущества и недостатки, что позволяет разработчикам выбирать, исходя из своих конкретных потребностей.

Хотя термин "фреймворк искусственного интеллекта" все еще является относительно новым концептом в сфере криптовалют, его разработка началась почти 14 лет назад, начиная с Theano в 2010 году. В традиционном сообществе искусственного интеллекта и в академической и в промышленной сферах уже есть очень зрелые фреймворки на выбор, такие как TensorFlow от Google, PyTorch от Meta, PaddlePaddle от Baidu и MagicAnimate от ByteDance, каждый из которых имеет свои преимущества в различных сценариях.

Проекты фреймворка искусственного интеллекта, которые в настоящее время появляются в криптовалюте, основаны на спросе на большое количество агентов, возникающем в связи с бумом искусственного интеллекта, и эти проекты дальше разветвляются на другие направления в криптовалюте, в результате образуя различные фреймворки искусственного интеллекта для конкретных подобластей. Давайте рассмотрим некоторые из текущих основных фреймворков в отрасли, чтобы лучше проиллюстрировать этот момент.

1.1 Элиза

Во-первых, давайте рассмотрим Eliza, фреймворк, созданный ai16z. Это мультиагентный симуляционный фреймворк, разработанный для создания, развертывания и управления автономными искусственными интеллектуальными агентами. Разработанный с использованием TypeScript в качестве языка программирования, его преимущество заключается в лучшей совместимости и более простой интеграции API. Согласно официальной документации, Eliza в первую очередь предназначена для социальных медиа, предлагая поддержку многоплатформенной интеграции. Фреймворк предоставляет полнофункциональную интеграцию Discord, поддерживая голосовые каналы, автоматические учетные записи для X/Twitter, интеграцию Telegram и прямой доступ к API. В части обработки медиа-контента он поддерживает чтение и анализ PDF-документов, извлечение и суммирование ссылок, транскрипцию аудио, обработку видеоконтента, анализ изображений и сводки бесед.

Сценарии использования, поддерживаемые Eliza в настоящее время, включают следующие четыре категории:

  1. Приложения AI Assistant: агенты службы поддержки клиентов, администраторы сообщества, персональные ассистенты.
  2. Роли в социальных сетях: автоматические создатели контента, интерактивные боты, представители бренда.
  3. Работники знаний: исследовательские помощники, аналитики контента, обработчики документов.
  4. Интерактивные роли: персонажи, обучающие тьюторы, развлекательные боты.

Модели, поддерживаемые в настоящее время Элизой, следующие:

  1. Модели локального вывода с открытым исходным кодом: такие как Llama3, Qwen1.5, BERT.
  2. Облачная вывод через OpenAI API.
  3. Конфигурация по умолчанию как Nous Hermes Llama 3.1B.
  4. Интеграция с Claude для выполнения сложных запросов.

1.2 G.A.M.E

G.A.M.E (Generative Autonomous Multimodal Entities Framework) - это мультимодальная ИИ-платформа для автоматического создания и управления, запущенная компанией Virtual. Она в первую очередь предназначена для разработки интеллектуального дизайна NPC в играх. Одной из уникальных особенностей этой платформы является то, что она позволяет даже пользователям с низким или отсутствующим уровнем кодирования участвовать в проектировании Агентов, просто изменяя параметры через ее пробное интерфейс.

Что касается архитектуры проекта, G.A.M.E построен на модульном дизайне, где несколько подсистем работают в сотрудничестве. Подробная архитектура следующая:

  1. Интерфейс подсказок агента: Интерфейс для разработчиков для взаимодействия с ИИ-фреймворком. Через этот интерфейс разработчики могут инициировать сеанс и указать идентификаторы сеансов, идентификаторы агентов, идентификаторы пользователей и другие параметры.
  2. Подсистема восприятия: отвечает за прием входной информации, синтезирование ее и отправку в стратегический плановый двигатель. Она также обрабатывает ответы от модуля обработки диалога.
  3. Strategic Planning Engine: The core of the entire framework, divided into a high-level planner and low-level policy. The high-level planner is responsible for formulating long-term goals and plans, while the low-level policy translates these plans into specific actions.
  4. Контекст мира: содержит информацию об окружающей среде, состоянии мира и данных игры, помогая агентам понять свой текущий контекст.
  5. Модуль обработки диалога: Обрабатывает сообщения и ответы, генерируя диалоги или реакции в качестве выходных данных.
  6. Оператор кошелька на блокчейне: Вероятно, связан с применением технологии блокчейн, хотя конкретные функции неясны.
  7. Модуль обучения: Учится на основе обратной связи и обновляет базу знаний агента.
  8. Рабочая память: Хранит недавние действия, результаты и текущие планы, среди прочей краткосрочной информации.
  9. Процессор долгосрочной памяти: извлекает и ранжирует важную информацию о агенте и его рабочей памяти на основе таких факторов, как важность, свежесть и актуальность.
  10. Хранилище агента: Хранит цели, размышления, опыт и характеристики агента.
  11. Планировщик действий: Генерирует конкретные планы действий на основе стратегий низкого уровня.
  12. Исполнитель плана: выполняет планы действий, созданные планировщиком действий.

Workflow: Разработчики запускают агента через интерфейс агентского подтверждения, где подсистема восприятия получает входные данные и отправляет их в стратегический планировщик. С помощью системы памяти, контекста мира и репозитория агентов движок формулирует и выполняет план действий. Модуль обучения отслеживает действия агента и соответствующим образом корректирует его поведение.

Сценарии применения: Исходя из общей технической архитектуры, этот фреймворк сосредоточен на принятии решений, обратной связи, восприятии и индивидуальности Агентов в виртуальных средах. Помимо игр, этот фреймворк также применим в Метавселенной. Список ниже от Virtual показывает, что многие проекты уже приняли этот фреймворк для строительства.

1.3 Риг

Rig - это инструмент с открытым исходным кодом, написанный на языке Rust, специально разработанный для упрощения разработки приложений на основе больших языковых моделей (LLM). Он предоставляет единый интерфейс, который позволяет разработчикам легко взаимодействовать с несколькими поставщиками услуг LLM (такими как OpenAI и Anthropic) и различными векторными базами данных (например, MongoDB и Neo4j).

Основные особенности:

  • Единый интерфейс: Независимо от того, какой провайдер LLM или хранилище векторов используется, Rig предлагает единый метод доступа, что существенно упрощает интеграцию.
  • Модульная архитектура: Фреймворк использует модульный дизайн, который включает ключевые компоненты, такие как «Уровень абстракции поставщика», «Интерфейс хранения векторов» и «Система интеллектуальных агентов», обеспечивая гибкость и масштабируемость системы.
  • Безопасность типов: Используя возможности Rust, Rig достигает безопасности типов в операциях встраивания, обеспечивая качество кода и безопасность времени выполнения.
  • Высокая производительность: Система поддерживает асинхронное программирование, оптимизируя возможности параллельной обработки. Встроенные функции журналирования и мониторинга помогают в обслуживании и устранении неполадок.

Workflow: При входе пользователя в систему Rig запрос сначала проходит через «Уровень абстракции поставщика», который стандартизирует различия между различными поставщиками и обеспечивает последовательную обработку ошибок. В ядре слоя интеллектуальные агенты могут вызывать различные инструменты или запрашивать векторное хранилище для получения необходимой информации. Наконец, продвинутые механизмы, такие как Retrieval-Augmented Generation (RAG), объединяют извлечение документов и контекстное понимание для генерации точных и содержательных ответов перед их возвратом пользователю.

Применение: Rig подходит для создания систем, требующих быстрого и точного ответа на вопросы, создания эффективных инструментов поиска документов, разработки чат-ботов или виртуальных помощников, а также поддержки создания контента путем автоматического создания текста или других форм контента на основе существующих данных.

1.4 ZerePy

ZerePy - это открытая платформа на основе Python, разработанная для упрощения развертывания и управления искусственными интеллектуальными агентами на платформе X (ранее известной как Twitter). Она развилась из проекта Zerebro и унаследовала его основные функции, но была разработана более модульным и масштабируемым образом. Цель состоит в том, чтобы позволить разработчикам легко создавать персонализированных искусственных интеллектуальных агентов и внедрять различные задачи автоматизации и создания контента на платформе X.

ZerePy предоставляет интерфейс командной строки (CLI), что позволяет пользователям удобно управлять агентами ИИ, которые они развертывают. Его базовая архитектура является модульной, что позволяет разработчикам гибко интегрировать различные функциональные модули, такие как:

  • Интеграция LLM: ZerePy поддерживает большие языковые модели (LLM) от OpenAI и Anthropic, что позволяет разработчикам выбрать наиболее подходящую модель для своего приложения. Это позволяет агентам генерировать высококачественный текстовый контент.
  • Интеграция с платформой X: Фреймворк напрямую интегрируется с API X, позволяя агентам выполнять такие задачи, как публикация, ответ, лайк и ретвит.
  • Модульная система подключения: Эта система позволяет разработчикам легко добавлять поддержку других социальных платформ или услуг, расширяя функциональность фреймворка.
  • Система памяти (планы на будущее): Хотя в текущей версии она не полностью реализована, цель дизайна ZerePy включает интеграцию системы памяти, которая позволит агентам запоминать предыдущие взаимодействия и контекстуальную информацию для создания более связного и персонализированного контента.

В то время как ZerePy и проект Eliza от a16z стремятся строить и управлять AI-агентами, они отличаются архитектурой и акцентом. Eliza более ориентирована на мультиагентные симуляции и более широкое исследование искусственного интеллекта, в то время как ZerePy фокусируется на упрощении развертывания AI-агентов на конкретных социальных платформах (X), что делает его более ориентированным на приложения.

II. Реплика BTC экосистемы

С точки зрения пути развития, искусственные интеллект-агенты имеют много общего с экосистемой BTC с конца 2023 по начало 2024 года. Путь развития экосистемы BTC можно кратко описать следующим образом: конкуренция между много-протокольными проектами BRC20-Atomical/Rune и другими — BTC L2 — BTCFi, сосредоточенный вокруг Вавилона. В то же время искусственные интеллект-агенты развиваются быстрее на основе зрелых традиционных технологических решений искусственного интеллекта, и их общий путь развития отражает некоторые особенности экосистемы BTC. Я бы описал его следующим образом: GOAT/ACT — агенты типа социальных сетей — конкуренция фреймворков аналитических искусственных интеллект-агентов. С точки зрения тенденций, проекты инфраструктуры, сфокусированные на децентрализации и безопасности вокруг агентов, вероятно, также продолжат эту волну развития, став следующей доминирующей темой.

Итак, приведет ли этот трек, как экосистема BTC, к однородности и образованию пузырей? Я так не думаю. Во-первых, повествование об искусственном интеллекте не сводится к воссозданию истории цепочек смарт-контрактов. Во-вторых, независимо от того, являются ли эти существующие проекты фреймворков искусственного интеллекта технически сильными или все еще застряли на этапе презентации или просто копированием и вставкой, они по крайней мере предоставляют новый подход к развитию инфраструктуры. Многие статьи сравнивают фреймворки искусственного интеллекта с платформами выпуска активов, а агентов - сами активы. Однако, по сравнению с платформами запуска Memecoin и протоколами надписи, я лично считаю, что фреймворки искусственного интеллекта напоминают будущие общедоступные цепочки, а агенты напоминают будущие DApps.

В сегодняшнем крипто-пространстве у нас есть тысячи публичных цепей и десятки тысяч DApps. В мире универсальных цепей у нас есть BTC, Ethereum и различные гетерогенные цепи, а формы прикладных цепей более разнообразны, такие как игровые цепи, цепи хранения и цепи Dex. Публичные цепи и фреймворки искусственного интеллекта в своей природе довольно похожи, и DApps могут хорошо соответствовать агентам.

В эпоху криптовалют в искусственном интеллекте весьма вероятно, что пространство будет развиваться в этом направлении, и будущие дебаты сместятся от EVM против гетерогенных цепочек к дебатам о фреймворках. В настоящее время речь идет скорее о децентрализации, или о том, как ее «зацепить». Я верю, что будущие инфраструктурные проекты в области искусственного интеллекта будут развиваться вокруг этого фундамента. Еще один важный момент: какое значение имеет это в блокчейне?

III. Значимость On-Chain

Независимо от того, с чем объединяется блокчейн, он в конечном итоге сталкивается с одним критическим вопросом: имеет ли это смысл? В прошлогодней статье я критиковал GameFi за неправильные приоритеты, где развитие инфраструктуры было чрезмерно продвинутым, а в предыдущих статьях об искусственном интеллекте я выразил скептицизм относительно текущей практичности сочетания искусственного интеллекта с криптовалютой. В конце концов, мотивирующая сила для традиционных проектов все более ослабевает. Немногие традиционные проекты, которые прошлого года показали хорошие результаты с точки зрения цены токена, в основном были теми, которые могли соответствовать или превзойти силу цены.

Что может сделать искусственный интеллект для криптовалюты? Ранее я думал о таких случаях использования, как агенты искусственного интеллекта, выполняющие задачи от имени пользователей, Метавселенная и агенты в качестве сотрудников - относительно обыденные идеи, но с определенными требованиями. Однако эти требования не требуют полной ончейн реализации, и с точки зрения бизнес-логики они не могут образовать замкнутый цикл. Упомянутый в последней статье агент-браузер, который реализует намерения, может генерировать требования к разметке данных и вычислительной мощности для вывода, но эти два элемента все еще не тесно интегрированы, и с точки зрения вычислительной мощности централизованные вычисления все еще имеют преимущество.

Вернувшись к успеху DeFi, причина успеха DeFi заключается в том, что он обеспечивает большую доступность, лучшую эффективность, более низкие затраты и безопасность без доверия. Если мы рассмотрим эту структуру, я думаю, что может быть несколько причин, почему 'цепная' экономика агентов может иметь смысл:

  1. Снижение затрат: может ли цепочка агентов снизить затраты на использование, тем самым обеспечивая большую доступность и больший выбор для пользователей? Это в конечном итоге может позволить обычным пользователям участвовать в том, что традиционно было исключительной областью "аренды" искусственного интеллекта веб-гигантов технологий Web2.
  2. Безопасность: По самому простому определению, агент - это ИИ, который может взаимодействовать с виртуальным или реальным миром. Если агент может вмешиваться в реальный мир или даже в мой виртуальный кошелек, то безопасные решения на основе блокчейна могут стать необходимостью.
  3. Финансовая игра, специфичная для блокчейна: Могут ли агенты создавать уникальный набор финансовых механизмов на блокчейне? Например, в AMM (Автоматический маркет-мейкер), поставщики ликвидности (LP) позволяют обычным пользователям участвовать в автоматизированном маркет-мейкинге. Аналогично, если агентам требуется вычислительная мощность или разметка данных, пользователи могут инвестировать в эти протоколы в форме USDT, основываясь на их доверии к системе. Или агенты в различных сценариях применения могут формировать новые финансовые структуры.
  4. Межоперабельность DeFi: В настоящее время DeFi не обладает идеальной межоперабельностью, но агенты могут решить эту проблему, позволяя прозрачные, отслеживаемые процессы рассуждений и заполняя пробелы.

IV. Творчество?

Проекты фреймворка в будущем также будут предоставлять предпринимательские возможности, аналогичные GPT Store. Хотя запуск агента через фреймворк все еще сложен для обычных пользователей, я считаю, что упрощение процесса создания агента и предоставление более сложных комбинаций функций дадут таким фреймворкам конкурентное преимущество в будущем. Это может привести к созданию Web3-творческой экономики, которая будет намного интереснее, чем GPT Store.

В настоящее время GPT Store все еще более ориентирован на традиционные практические применения, и большинство популярных приложений создаются традиционными компаниями Web2. Кроме того, доход, генерируемый в основном, монополизируется создателями. Согласно официальному объяснению OpenAI, стратегия заключается в предоставлении финансовой поддержки выдающимся разработчикам в Соединенных Штатах, предлагая субсидии до определенной суммы.

С точки зрения спроса, Web3 все еще имеет много пробелов, и с экономической точки зрения он может сделать политику несправедливых гигантов Web2 более справедливой. Кроме того, мы естественным образом можем ввести сообщественные экономики для дальнейшего улучшения агентов. Творческая экономика вокруг агентов предоставит обычным людям возможность участия. В будущем AI мемы будут гораздо умнее и интереснее, чем агенты, выпущенные GOAT или Clanker.

О YBB

YBB - это фонд веб-3, посвященный выявлению проектов, определяющих веб-3, с целью создания лучшей онлайн-среды для всех жителей Интернета. Основанный группой приверженцев блокчейна, активно участвующих в этой отрасли с 2013 года, YBB всегда готов помочь проектам начальной стадии развития от 0 до 1. Мы ценим инновации, самодвиженческую страсть и продукты, ориентированные на пользователя, признавая потенциал криптовалют и блокчейн-приложений.

Веб-сайт | Twi: @YBBCapital

Отказ от ответственности:

  1. Эта статья печатается из [ YBB Capital]. Все авторские права принадлежат оригинальному автору [Исследователь YBB Capital Зик]. Если есть возражения по поводу этого переиздания, пожалуйста, свяжитесь с Gate Learnкоманда, и они обработают это незамедлительно.
  2. Отказ от ответственности: Взгляды и мнения, выраженные в этой статье, являются исключительно взглядами автора и не являются инвестиционным советом.
  3. Команда gate Learn перевела статью на другие языки. Копирование, распространение или плагиат переведенных статей запрещены, если не указано иное.
即刻開始交易
註冊並交易即可獲得
$100
和價值
$5500
理財體驗金獎勵!