Переслати початковий заголовок: Чи є фреймворк AI Agent останнім кубиком головоломки? Як тлумачити «двовимірність хвиль-частинок» фреймворків?
Фреймворк AI Agent, як ключовий елемент розвитку галузі, може мати подвійний потенціал як для впровадження технології, так і для дозрівання екосистеми. Деякі з найбільш обговорюваних фреймворків на ринку включають Eliza, Rig, Swarms і ZerePy. Ці фреймворки приваблюють розробників через свої репозиторії GitHub, створюючи репутацію. Завдяки випуску токенів через «бібліотеки» ці фреймворки, як і світло, втілюють як хвильові, так і частинкоподібні характеристики. Аналогічно, фреймворки Agent мають як серйозні зовнішні ефекти, так і риси Memecoin. У цій статті ми зосередимося на інтерпретації «корпускулярно-хвильового дуалізму» цих фреймворків і дослідимо, чому фреймворк Agent може бути останньою частиною головоломки.
З моменту з'яви GOAT, набуває все більшої уваги розповідь про Агента, подібну до потужного удару майстра бойових мистецтв - ліва рука представляє «Мемкоін», а права долоня втілює «надію на галузь», можливо, ви будете переможені одним з цих рухів. На практиці сценарії застосування AI Агентів не строго розмежовуються, а межі між платформами, фреймворками та конкретними застосуваннями розмиті. Однак, їх все ще можна приблизно класифікувати відповідно до вподобань щодо токенів або протоколів. Виходячи з вподобань розвитку токенів або протоколів, їх можна загалом класифікувати наступним чином:
При подальшому обговоренні структури агента можна побачити, що вона має значні зовнішні ефекти. На відміну від розробників великих публічних ланцюжків і протоколів, які можуть вибирати лише з різних мовних середовищ, загальний розмір спільноти розробників у галузі не показав відповідних темпів зростання ринкової капіталізації. Репозиторії GitHub — це місце, де розробники Web2 та Web3 досягають консенсусу. Створення спільноти розробників тут набагато привабливіше та впливовіше для розробників Web2, ніж будь-який пакет «plug-and-play», розроблений окремо за протоколом.
Чотири наведені в цій статті фреймворки є відкритими джерелами:
Наразі фреймворк Eliza широко використовується в різноманітних додатках агента і є найбільш популярним фреймворком. Розробка ZerePy не є високорозвиненою, і її розвиток в основному спрямований на X. Він ще не підтримує локальні LLM та інтегровану пам'ять. RIG має найвищу відносну складність розробки, але надає розробникам найбільшу свободу для досягнення оптимізації продуктивності. Swarms, окрім запуску команди mcs, ще не має інших варіантів використання. Однак, Swarms може інтегруватися з різними фреймворками, що надає значний потенціал.
Крім того, у вищезгаданій класифікації відокремлення механізму Agent від фреймворку може спричинити плутанину. Але я вважаю, що вони різні. По-перше, чому його називають двигуном? Аналогія з пошуковими системами в реальному житті відносно доречна. На відміну від гомогенізованих додатків Agent, продуктивність движка Agent знаходиться на більш високому рівні, але він повністю інкапсульований, а коригування вносяться через інтерфейси API, як чорний ящик. Користувачі можуть випробувати продуктивність движка Agent, розгалуживши його, але вони не можуть контролювати повну картину або свободу налаштування, як це можна зробити з базовим фреймворком. Рушій кожного користувача схожий на створення дзеркала на навченому агенті та взаємодію з цим дзеркалом. З іншого боку, фреймворк принципово розроблений для адаптації до ланцюжка, тому що, коли агент будує фреймворк агента, кінцевою метою є інтеграція з відповідним ланцюгом. Як визначити методи взаємодії з даними, як визначити методи валідації даних, як визначити розмір блоку, як збалансувати консенсус і продуктивність — це те, що фреймворк повинен враховувати. Що стосується движка, то йому потрібно лише тонко налаштувати модель і налаштувати взаємозв'язок між взаємодією даних і пам'яттю в одному напрямку. Продуктивність є єдиним стандартом оцінки, тоді як фреймворк цим не обмежується.
Життєвий цикл введення-виведення агента передбачає три частини. По-перше, базова модель визначає глибину і метод мислення. Потім здійснюється налаштування в пам'яті. Після того, як базова модель виробляє виведення, вона змінюється на основі пам'яті. Нарешті, операція виведення завершується на різних клієнтах.
Джерело: @SuhailKakar
Для підтвердження того, що агентська структура має «хвильово-частинкову дуальність», «хвиля» представляє характеристики «Мемкойна», які відображають культуру спільноти та активність розробника, підкреслюючи привабливість та здатність поширення Агента. «Частинка» представляє характеристики «очікування від галузі», які відображають базову продуктивність, фактичні випадки використання та технічну глибину. Я поясню це, поєднуючи два аспекти, використовуючи навчальні посібники з розробки трьох структур як приклади:
Джерело: @SuhailKakar
Джерело: @SuhailKakar
Джерело: @SuhailKakar
4. Встановіть персоналізацію агента
Джерело: @SuhailKakar
Фреймворк Eliza досить легко почати використовувати. Він базується на TypeScript, мові, з якою знайомі більшість розробників Web та Web3. Фреймворк простий і уникає надмірної абстракції, що дозволяє розробникам легко додавати потрібні функції. З кроку 3 ми бачимо, що Eliza підтримує багатоклієнтську інтеграцію і може бути розглянутий як збирач для багатоклієнтської інтеграції. Eliza підтримує платформи, такі як DC, TG та X, а також різні великі мовні моделі. Він дозволяє введення через вищезгадані соціальні медіа та виведення через моделі LLM, а також підтримує вбудоване управління пам'яттю, що дозволяє будь-якому розробнику з різними звичками швидко розгортати AI-агента.
Завдяки простоті фреймворку та багатству його інтерфейсів Eliza значно знижує поріг доступу та досягає відносно єдиного стандарту інтерфейсу.
1. Розгалуження репозиторію ZerePy
Джерело:https://replit.com/
Джерело:https://replit.com/
3. Встановити особистість агента
Джерело:https://replit.com/
На прикладі будівництва агента RAG (Retrieval-Augmented Generation)
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig (ARC) - це фреймворк для побудови систем штучного інтелекту на основі мови Rust для двигунів робочого процесу LLM. Він вирішує проблеми оптимізації продуктивності на нижньому рівні. Іншими словами, ARC - це 'інструментарій' для штучного інтелекту, який надає виклики штучного інтелекту та оптимізацію продуктивності, зберігання даних, обробку винятків та інші фонові служби підтримки.
Що хоче вирішити Rig - це проблема "виклику", щоб допомогти розробникам краще обирати LLM, краще оптимізувати слова-підказки, ефективніше управляти токенами, а також як керувати одночасною обробкою, управляти ресурсами, зменшувати затримку тощо. Його увага зосереджена на моделі штучного інтелекту LLM та тому, як "добре нею користуватися" при співпраці з системою штучного інтелекту.
Ригє відкритою бібліотекою Rust з високим рівнем складності розробки застосувань, що працюють на основі LLM, включаючи агентів RAG. Оскільки Rig є більш відкритим, він має вищі вимоги до розробників та більший рівень розуміння Rust та Agent. Описаний тут підручник є найбільш базовим процесом налаштування RAG Agent. RAG покращує LLM, поєднуючи його з зовнішнім отриманням знань. У інших ДЕМО на офіційному сайті можна побачити, що Rig має наступні характеристики:
Можна бачити, що порівняно з Елізою, Ріг надає розробникам додатковий простір для оптимізації продуктивності, що допомагає розробникам краще налагоджувати виклики та оптимізацію співпраці LLM та Агента. Ріг забезпечує продуктивність, побудовану на мові Rust, використовуючи безкоштовні абстракції та безпечні для пам'яті, високопродуктивні, низьколатентні операції LLM. Він може забезпечити більш багатий рівень свободи на підкладці.
Swarms має на меті забезпечити структуру оркестрації кількох агентів виробничого рівня корпоративного рівня. Офіційний сайт пропонує десятки робочих процесів і паралельних/послідовних архітектур для завдань Agent. Нижче наведено короткий вступ до невеликої їх частини.
Послідовний робочий процес
Джерело: https://docs.swarms.world
Послідовна архітектура Swarm обробляє завдання в лінійній послідовності. Кожен Агент завершує своє завдання перед передачею результатів наступному Агенту в ланцюгу. Ця архітектура забезпечує порядок обробки і корисна, коли завдання мають залежності.
Використання:
Ієрархічна архітектура:
Джерело:https://docs.swarms.world
Ця архітектура реалізує контроль зверху донизу, де Агент вищого рівня координує завдання між Агентами нижчого рівня. Агенти виконують завдання паралельно та повертають свої результати назад у цикл для остаточної агрегації. Це особливо корисно для завдань, які дуже паралельні.
Джерело: https://docs.swarms.world
Ця архітектура призначена для управління великими групами Агентів, які працюють одночасно. Вона може керувати тисячами Агентів, кожен з яких працює у власному потоці. Це ідеально підходить для нагляду за виведенням операцій великого масштабу Агентів.
Swarms - це не просто рамковий агент, але й сумісний зі згаданими раніше рамками Eliza, ZerePy та Rig. За допомогою модульного підходу він максимізує продуктивність агента на різних робочих процесах та архітектурах для вирішення відповідних проблем. Концепція та розробка Swarms, разом із розробницькою спільнотою, успішно розвиваються.
Загалом Eliza та ZerePy мають переваги в зручності використання та швидкому розвитку, тоді як Rig та Swarms більше підходять для професійних розробників чи корпоративних додатків, які потребують високої продуктивності та обробки великого масштабу.
Ось чому структура Agent має характеристику «галузевої надії». Фреймворки, згадані вище, все ще знаходяться на ранніх стадіях, і першочерговим завданням є отримання переваги першопрохідця та створення активної спільноти розробників. Продуктивність фреймворку та те, чи відстає він від популярних додатків Web2, не є першочерговими проблемами. Єдині фреймворки, які в кінцевому підсумку досягнуть успіху, — це ті, які можуть постійно залучати розробників, оскільки індустрія Web3 завжди повинна привертати увагу ринку. Незалежно від того, наскільки сильна продуктивність фреймворку або наскільки міцні його основи, якщо він складний у використанні і, таким чином, не приваблює користувачів, він буде контрпродуктивним. За умови, що сам фреймворк може залучити розробників, ті, хто має більш зрілу та повну модель економіки токенів, виділятимуться.
Характеристику "Memecoin" фреймворків Agent досить легко зрозуміти. Токени згаданих вище фреймворків не мають розумного дизайну економіки токенів, не мають варіантів використання або мають дуже обмежені варіанти, а також не мають валідованих бізнес-моделей. Ефективного жетонного маховика не існує. Фреймворки є просто фреймворками, і між фреймворком і токеном не було органічної інтеграції. Зростання ціни токенів, крім FOMO, мало що підтримує з точки зору фундаментальних показників, і йому не вистачає сильного рову для забезпечення стабільного та довгострокового зростання вартості. У той же час самі фреймворки все ще дещо сирі, і їх фактична вартість не відповідає їх поточній ринковій вартості, таким чином демонструючи сильні характеристики «Memecoin».
Варто зауважити, що «хвиляно-частинкова подвійність» рамок Агенту не є недоліком і не повинна грубо тлумачитися як рамки, які не є чистим Мемекоіном і не є рішенням наполовину без використання муніципальних випадків. Як я зазначив у попередній статті, легкі Агенти прикриті неоднозначним Мемекоіновим вуалью. Спільнотна культура і фундаменти більше не будуть суперечити, і поступово з'являється новий шлях розвитку активів. Незважаючи на початковий бульбашковий ефект і невизначеність, що оточує рамки Агента, їх потенціал приваблювати розробників і сприяти прийняттю додатків не повинен бути ігнорований. У майбутньому, рамки з добре розробленою моделлю токеномічної економіки і сильною екосистемою розробників можуть стати ключовими стовпами цього сектора.
Переслати початковий заголовок: Чи є фреймворк AI Agent останнім кубиком головоломки? Як тлумачити «двовимірність хвиль-частинок» фреймворків?
Фреймворк AI Agent, як ключовий елемент розвитку галузі, може мати подвійний потенціал як для впровадження технології, так і для дозрівання екосистеми. Деякі з найбільш обговорюваних фреймворків на ринку включають Eliza, Rig, Swarms і ZerePy. Ці фреймворки приваблюють розробників через свої репозиторії GitHub, створюючи репутацію. Завдяки випуску токенів через «бібліотеки» ці фреймворки, як і світло, втілюють як хвильові, так і частинкоподібні характеристики. Аналогічно, фреймворки Agent мають як серйозні зовнішні ефекти, так і риси Memecoin. У цій статті ми зосередимося на інтерпретації «корпускулярно-хвильового дуалізму» цих фреймворків і дослідимо, чому фреймворк Agent може бути останньою частиною головоломки.
З моменту з'яви GOAT, набуває все більшої уваги розповідь про Агента, подібну до потужного удару майстра бойових мистецтв - ліва рука представляє «Мемкоін», а права долоня втілює «надію на галузь», можливо, ви будете переможені одним з цих рухів. На практиці сценарії застосування AI Агентів не строго розмежовуються, а межі між платформами, фреймворками та конкретними застосуваннями розмиті. Однак, їх все ще можна приблизно класифікувати відповідно до вподобань щодо токенів або протоколів. Виходячи з вподобань розвитку токенів або протоколів, їх можна загалом класифікувати наступним чином:
При подальшому обговоренні структури агента можна побачити, що вона має значні зовнішні ефекти. На відміну від розробників великих публічних ланцюжків і протоколів, які можуть вибирати лише з різних мовних середовищ, загальний розмір спільноти розробників у галузі не показав відповідних темпів зростання ринкової капіталізації. Репозиторії GitHub — це місце, де розробники Web2 та Web3 досягають консенсусу. Створення спільноти розробників тут набагато привабливіше та впливовіше для розробників Web2, ніж будь-який пакет «plug-and-play», розроблений окремо за протоколом.
Чотири наведені в цій статті фреймворки є відкритими джерелами:
Наразі фреймворк Eliza широко використовується в різноманітних додатках агента і є найбільш популярним фреймворком. Розробка ZerePy не є високорозвиненою, і її розвиток в основному спрямований на X. Він ще не підтримує локальні LLM та інтегровану пам'ять. RIG має найвищу відносну складність розробки, але надає розробникам найбільшу свободу для досягнення оптимізації продуктивності. Swarms, окрім запуску команди mcs, ще не має інших варіантів використання. Однак, Swarms може інтегруватися з різними фреймворками, що надає значний потенціал.
Крім того, у вищезгаданій класифікації відокремлення механізму Agent від фреймворку може спричинити плутанину. Але я вважаю, що вони різні. По-перше, чому його називають двигуном? Аналогія з пошуковими системами в реальному житті відносно доречна. На відміну від гомогенізованих додатків Agent, продуктивність движка Agent знаходиться на більш високому рівні, але він повністю інкапсульований, а коригування вносяться через інтерфейси API, як чорний ящик. Користувачі можуть випробувати продуктивність движка Agent, розгалуживши його, але вони не можуть контролювати повну картину або свободу налаштування, як це можна зробити з базовим фреймворком. Рушій кожного користувача схожий на створення дзеркала на навченому агенті та взаємодію з цим дзеркалом. З іншого боку, фреймворк принципово розроблений для адаптації до ланцюжка, тому що, коли агент будує фреймворк агента, кінцевою метою є інтеграція з відповідним ланцюгом. Як визначити методи взаємодії з даними, як визначити методи валідації даних, як визначити розмір блоку, як збалансувати консенсус і продуктивність — це те, що фреймворк повинен враховувати. Що стосується движка, то йому потрібно лише тонко налаштувати модель і налаштувати взаємозв'язок між взаємодією даних і пам'яттю в одному напрямку. Продуктивність є єдиним стандартом оцінки, тоді як фреймворк цим не обмежується.
Життєвий цикл введення-виведення агента передбачає три частини. По-перше, базова модель визначає глибину і метод мислення. Потім здійснюється налаштування в пам'яті. Після того, як базова модель виробляє виведення, вона змінюється на основі пам'яті. Нарешті, операція виведення завершується на різних клієнтах.
Джерело: @SuhailKakar
Для підтвердження того, що агентська структура має «хвильово-частинкову дуальність», «хвиля» представляє характеристики «Мемкойна», які відображають культуру спільноти та активність розробника, підкреслюючи привабливість та здатність поширення Агента. «Частинка» представляє характеристики «очікування від галузі», які відображають базову продуктивність, фактичні випадки використання та технічну глибину. Я поясню це, поєднуючи два аспекти, використовуючи навчальні посібники з розробки трьох структур як приклади:
Джерело: @SuhailKakar
Джерело: @SuhailKakar
Джерело: @SuhailKakar
4. Встановіть персоналізацію агента
Джерело: @SuhailKakar
Фреймворк Eliza досить легко почати використовувати. Він базується на TypeScript, мові, з якою знайомі більшість розробників Web та Web3. Фреймворк простий і уникає надмірної абстракції, що дозволяє розробникам легко додавати потрібні функції. З кроку 3 ми бачимо, що Eliza підтримує багатоклієнтську інтеграцію і може бути розглянутий як збирач для багатоклієнтської інтеграції. Eliza підтримує платформи, такі як DC, TG та X, а також різні великі мовні моделі. Він дозволяє введення через вищезгадані соціальні медіа та виведення через моделі LLM, а також підтримує вбудоване управління пам'яттю, що дозволяє будь-якому розробнику з різними звичками швидко розгортати AI-агента.
Завдяки простоті фреймворку та багатству його інтерфейсів Eliza значно знижує поріг доступу та досягає відносно єдиного стандарту інтерфейсу.
1. Розгалуження репозиторію ZerePy
Джерело:https://replit.com/
Джерело:https://replit.com/
3. Встановити особистість агента
Джерело:https://replit.com/
На прикладі будівництва агента RAG (Retrieval-Augmented Generation)
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
джерело:https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422
Rig (ARC) - це фреймворк для побудови систем штучного інтелекту на основі мови Rust для двигунів робочого процесу LLM. Він вирішує проблеми оптимізації продуктивності на нижньому рівні. Іншими словами, ARC - це 'інструментарій' для штучного інтелекту, який надає виклики штучного інтелекту та оптимізацію продуктивності, зберігання даних, обробку винятків та інші фонові служби підтримки.
Що хоче вирішити Rig - це проблема "виклику", щоб допомогти розробникам краще обирати LLM, краще оптимізувати слова-підказки, ефективніше управляти токенами, а також як керувати одночасною обробкою, управляти ресурсами, зменшувати затримку тощо. Його увага зосереджена на моделі штучного інтелекту LLM та тому, як "добре нею користуватися" при співпраці з системою штучного інтелекту.
Ригє відкритою бібліотекою Rust з високим рівнем складності розробки застосувань, що працюють на основі LLM, включаючи агентів RAG. Оскільки Rig є більш відкритим, він має вищі вимоги до розробників та більший рівень розуміння Rust та Agent. Описаний тут підручник є найбільш базовим процесом налаштування RAG Agent. RAG покращує LLM, поєднуючи його з зовнішнім отриманням знань. У інших ДЕМО на офіційному сайті можна побачити, що Rig має наступні характеристики:
Можна бачити, що порівняно з Елізою, Ріг надає розробникам додатковий простір для оптимізації продуктивності, що допомагає розробникам краще налагоджувати виклики та оптимізацію співпраці LLM та Агента. Ріг забезпечує продуктивність, побудовану на мові Rust, використовуючи безкоштовні абстракції та безпечні для пам'яті, високопродуктивні, низьколатентні операції LLM. Він може забезпечити більш багатий рівень свободи на підкладці.
Swarms має на меті забезпечити структуру оркестрації кількох агентів виробничого рівня корпоративного рівня. Офіційний сайт пропонує десятки робочих процесів і паралельних/послідовних архітектур для завдань Agent. Нижче наведено короткий вступ до невеликої їх частини.
Послідовний робочий процес
Джерело: https://docs.swarms.world
Послідовна архітектура Swarm обробляє завдання в лінійній послідовності. Кожен Агент завершує своє завдання перед передачею результатів наступному Агенту в ланцюгу. Ця архітектура забезпечує порядок обробки і корисна, коли завдання мають залежності.
Використання:
Ієрархічна архітектура:
Джерело:https://docs.swarms.world
Ця архітектура реалізує контроль зверху донизу, де Агент вищого рівня координує завдання між Агентами нижчого рівня. Агенти виконують завдання паралельно та повертають свої результати назад у цикл для остаточної агрегації. Це особливо корисно для завдань, які дуже паралельні.
Джерело: https://docs.swarms.world
Ця архітектура призначена для управління великими групами Агентів, які працюють одночасно. Вона може керувати тисячами Агентів, кожен з яких працює у власному потоці. Це ідеально підходить для нагляду за виведенням операцій великого масштабу Агентів.
Swarms - це не просто рамковий агент, але й сумісний зі згаданими раніше рамками Eliza, ZerePy та Rig. За допомогою модульного підходу він максимізує продуктивність агента на різних робочих процесах та архітектурах для вирішення відповідних проблем. Концепція та розробка Swarms, разом із розробницькою спільнотою, успішно розвиваються.
Загалом Eliza та ZerePy мають переваги в зручності використання та швидкому розвитку, тоді як Rig та Swarms більше підходять для професійних розробників чи корпоративних додатків, які потребують високої продуктивності та обробки великого масштабу.
Ось чому структура Agent має характеристику «галузевої надії». Фреймворки, згадані вище, все ще знаходяться на ранніх стадіях, і першочерговим завданням є отримання переваги першопрохідця та створення активної спільноти розробників. Продуктивність фреймворку та те, чи відстає він від популярних додатків Web2, не є першочерговими проблемами. Єдині фреймворки, які в кінцевому підсумку досягнуть успіху, — це ті, які можуть постійно залучати розробників, оскільки індустрія Web3 завжди повинна привертати увагу ринку. Незалежно від того, наскільки сильна продуктивність фреймворку або наскільки міцні його основи, якщо він складний у використанні і, таким чином, не приваблює користувачів, він буде контрпродуктивним. За умови, що сам фреймворк може залучити розробників, ті, хто має більш зрілу та повну модель економіки токенів, виділятимуться.
Характеристику "Memecoin" фреймворків Agent досить легко зрозуміти. Токени згаданих вище фреймворків не мають розумного дизайну економіки токенів, не мають варіантів використання або мають дуже обмежені варіанти, а також не мають валідованих бізнес-моделей. Ефективного жетонного маховика не існує. Фреймворки є просто фреймворками, і між фреймворком і токеном не було органічної інтеграції. Зростання ціни токенів, крім FOMO, мало що підтримує з точки зору фундаментальних показників, і йому не вистачає сильного рову для забезпечення стабільного та довгострокового зростання вартості. У той же час самі фреймворки все ще дещо сирі, і їх фактична вартість не відповідає їх поточній ринковій вартості, таким чином демонструючи сильні характеристики «Memecoin».
Варто зауважити, що «хвиляно-частинкова подвійність» рамок Агенту не є недоліком і не повинна грубо тлумачитися як рамки, які не є чистим Мемекоіном і не є рішенням наполовину без використання муніципальних випадків. Як я зазначив у попередній статті, легкі Агенти прикриті неоднозначним Мемекоіновим вуалью. Спільнотна культура і фундаменти більше не будуть суперечити, і поступово з'являється новий шлях розвитку активів. Незважаючи на початковий бульбашковий ефект і невизначеність, що оточує рамки Агента, їх потенціал приваблювати розробників і сприяти прийняттю додатків не повинен бути ігнорований. У майбутньому, рамки з добре розробленою моделлю токеномічної економіки і сильною екосистемою розробників можуть стати ключовими стовпами цього сектора.