📢 #Gate观点任务# 第九十期精彩啟程!調研 Pell Network (PELL) 項目,在Gate.io動態發佈您的看法觀點,瓜分 $100 GT!
💰️ 選取10名優質發帖用戶,每人輕鬆贏取 $10 GT 獎勵,獲獎文章還將被標記為“精選”!
👉 參與方式:
調研$PELL項目,發表你對項目的見解。
帶上$PELL現貨交易鏈接:https://www.gate.io/trade/PELL_USDT
推廣$PELL Launchpool挖礦活動,質押$BTC、$PELL、$GT參與瓜分7,002,801 $PELL挖礦獎勵:https://www.gate.io/launchpool/PELL?pid=237
推廣$PELL上線狂歡活動,充值、交易、註冊享三重福利,參與瓜分$30,000 PELL獎勵:https://www.gate.io/announcements/article/43851
建議創作的主題方向:
🔹 什麼是 Pell Network?
🔹 Pell Network 在BTC再質押方面有什麼優勢?
🔹 $PELL 代幣經濟模型是如何運作的?
您可以選擇以上一個或多個方向發表看法,也可以跳出框架,分享主題以外的獨到見解。
注意:帖子不得包含除 #Gate观点任务# 和 #PELL# 之外的其他標籤,並確保你的帖子至少有 60 字,並獲得至少 3
AI代理框架之爭:Eliza、Rig、Daydreams誰更勝一籌
作者:Shlok Khemani、Oliver Jaros 來源:Decentralised.co 翻譯:善歐巴,金色財經
今天的文章是對代理框架的解釋,以及我們對它們發展程度的評估。這也是一個徵集提案的請求,目標是那些在互聯網貨幣軌道(加密)和代理的交叉領域工作的創始人。
過去一年,Decentralised.co 深入研究了加密和人工智能的交叉領域。我們甚至構建了一個被超過 70,000 人使用的產品,用於跟蹤人工智能代理和代理基礎設施。儘管最近幾周圍繞該領域的狂熱已經消退,但人工智能對技術和社會的影響是我們自互聯網以來從未見過的。如果加密貨幣將成為未來的金融軌道,正如我們預測的那樣,那麼它與人工智能的交織將是一個反覆出現的主題,而不是一次性的。
從這波浪潮中湧現出來的更有趣的項目類別之一是加密原生人工智能代理框架。它們是一個引人入勝的實驗,將區塊鏈的核心原則——無需許可的價值轉移、透明度和一致的激勵——帶入人工智能開發。它們的開源性質為我們提供了一個難得的機會,可以窺探其內部運作,不僅分析它們的承諾,還分析它們的實際工作方式。
在這篇文章中,我們首先剖析代理框架的實際含義以及它們的重要性。然後,我們解決一個顯而易見的問題:當像 LangChain 這樣的成熟選項存在時,為什麼我們需要加密原生框架?為此,我們分析了領先的加密原生框架及其在不同用例中的優勢和侷限性。最後,如果你正在構建一個人工智能代理,我們將幫助你決定哪個框架可能適合你的需求。或者,你是否應該使用框架進行構建。
讓我們深入探討。
抽象
想想我們的祖先是如何生活的。每個家庭都必須自己種植食物,製作自己的衣服,建造自己的住所。他們花費無數時間在基本的生存任務上,幾乎沒有時間做其他事情。即使在兩個世紀前,近 90% 的人都在農業領域工作。今天,我們從超市購買食物,住在專家建造的房屋中,穿著在遙遠工廠生產的衣服。曾經消耗幾代人努力的任務已經變成了簡單的交易。如今,全球只有 27% 的人口從事農業(發達國家降至 5% 以下)。
當我們開始掌握一項新技術時,熟悉的模式就會出現。我們首先了解基本原理——什麼有效,什麼無效,以及哪些模式不斷出現。一旦這些模式變得清晰,我們就將它們打包成更容易、更快、更可靠的抽象。這些抽象釋放了時間和資源,以應對更多樣化和有意義的挑戰。構建軟件也是如此。
以 Web 開發為例。在早期,開發者需要從頭開始編寫所有內容——處理 HTTP 請求、管理狀態和創建 UI——這些任務既複雜又耗時。隨後出現了像 React 這樣的框架,通過提供有用的抽象,極大地簡化了這些挑戰。移動開發也遵循了類似的路徑。最初,開發者需要深入的、特定於平臺的知識,直到 React Native 和 Flutter 等工具的出現,讓他們能夠一次編寫代碼並部署到任何地方。
機器學習中也出現了類似的抽象化模式。在 2000 年代初期,研究人員發現了 GPU 在 ML 工作負載中的潛力。起初,開發者不得不與圖形基元和像 OpenGL 的 GLSL 這樣的語言搏鬥——這些工具並非為通用計算而構建。2006 年,英偉達推出 CUDA,讓 GPU 編程變得更容易上手,並將 ML 訓練帶給更廣泛的開發者群體,一切都發生了改變。
隨著 ML 開發勢頭增強,出現了專門的框架來抽象 GPU 編程的複雜性。TensorFlow 和 PyTorch 讓開發者能夠專注於模型架構,而不是陷入底層 GPU 代碼或實現細節的泥潭。這加速了模型架構的迭代,以及我們在過去幾年中看到的 AI/ML 的快速進步。
我們現在看到人工智能代理也出現了類似的演變——一個能夠做出決策並採取行動以實現目標的軟件程序,就像人類助手或員工一樣。它使用大型語言模型作為其“大腦”,並可以利用不同的工具,如搜索網絡、進行 API 調用或訪問數據庫來完成任務。
要從頭開始構建一個代理,開發者必須編寫複雜的代碼來處理每個方面:代理如何思考問題,如何決定使用什麼工具以及何時使用,如何與這些工具交互,如何記住早期交互的上下文,以及如何將大型任務分解為可管理的步驟。每個模式都必須單獨解決,導致重複工作和結果不一致。
這就是人工智能代理框架的用武之地。正如 React 通過處理 UI 更新和狀態管理的棘手部分簡化了 Web 開發一樣,這些框架解決了構建人工智能代理中的常見挑戰。它們為我們發現的有效模式提供了現成的組件,例如如何構建代理的決策過程、集成不同的工具以及在多個交互中維護上下文。
使用框架,開發者可以專注於使其代理獨一無二的方面——其特定功能和用例——而不是重新構建這些基本組件。他們可以在幾天或幾周內創建複雜的人工智能代理,而不是幾個月,更輕鬆地嘗試不同的方法,並借鑑其他開發者和社區發現的最佳實踐。
為了更好地理解框架的重要性,考慮一個構建幫助醫生審查醫療報告的代理的開發者。如果沒有框架,他們需要從頭開始編寫所有代碼:處理電子郵件附件、從 PDF 中提取文本、以正確的格式將文本輸入 LLM、管理對話歷史以跟蹤已討論的內容,並確保代理做出適當的響應。對於並非其特定用例獨有的任務,這是大量複雜的代碼。
使用代理框架,許多這些構建塊都可以直接使用。該框架處理讀取電子郵件和 PDF,提供構建醫療知識提示的模式,管理對話流程,甚至有助於跟蹤多個交流中的重要細節。開發者可以專注於使其代理與眾不同的方面,例如微調醫療分析提示或添加針對診斷的特定安全檢查,而不是重新發明常見的模式。原本可能需要幾個月才能從頭構建的內容,現在可以在幾天內完成原型設計。
LangChain 已成為人工智能開發的瑞士軍刀,為構建基於 LLM 的應用程序提供了靈活的工具包。雖然嚴格來說不是代理框架,但它提供了構建大多數代理框架的基本構建塊,從用於排序 LLM 調用的鏈到用於維護上下文的內存系統。其廣泛的集成生態系統和豐富的文檔使其成為希望構建實用人工智能應用程序的開發者的首選起點。
然後是像 CrewAI 和 AutoGen 這樣的多智能體框架,它們使開發者能夠構建多個 AI 智能體協同工作的系統,每個代理都有其獨特的角色和能力。這些框架不是簡單地按順序執行任務,而是強調通過對話進行智能體協作,以共同解決問題。
例如,在分配一份研究報告時,一個代理可能會概述其結構,另一個代理可能會收集相關信息,第三個代理可能會對最終草稿進行評論和完善。這就像組建一個虛擬團隊,人工智能代理可以在其中討論、辯論並共同改進解決方案。以這種方式協同工作以實現高層次目標的多代理系統通常被稱為人工智能代理“集群”。
AutoGPT 雖然不是一個傳統的框架,但它開創了自主人工智能代理的概念。它展示了人工智能如何接受一個高層次的目標,將其分解為子任務,並在極少的人工輸入下獨立完成。儘管它存在侷限性,但 AutoGPT 引發了自主代理的創新浪潮,並影響了後續更結構化框架的設計。
但為什麼是加密?
所有這些背景最終將我們帶到了加密原生人工智能代理框架的興起。此時,你可能會想,當我們在 Web2 中擁有像 Langchain 和 CrewAI 這樣相對成熟的框架時,Web3 為什麼還需要自己的框架?當然,開發者可以使用這些現有的框架來構建他們想要的任何代理?鑑於該行業喜歡將 Web3 強加於任何和所有敘事,這種懷疑是合理的。
我們認為,Web3 特定代理框架的存在有三個充分的理由。
在鏈上運行的金融代理
我們認為,未來大部分金融交易都將在區塊鏈軌道上進行。這加速了對一類人工智能代理的需求,這類代理可以解析鏈上數據、執行區塊鏈交易以及跨多個協議和網絡管理數字資產。從可以檢測套利機會的自動化交易機器人,到執行收益策略的投資組合經理,這些代理都依賴於區塊鏈功能在其核心工作流程中的深度集成。
傳統的 Web2 框架不提供用於這些任務的原生組件。您必須拼湊第三方庫來與智能合約交互、解析原始鏈上事件並處理私鑰管理 - 從而引入了複雜性和潛在漏洞。相反,專用的 Web3 框架可以開箱即用地處理這些功能,使開發人員能夠專注於其代理的邏輯和策略,而不是與低級區塊鏈管道搏鬥。
原生協調和激勵
區塊鏈不僅僅涉及數字貨幣。它們提供了一個全球性的、信任最小化的記錄系統,內置的金融工具可以增強多代理協調。開發人員可以使用鏈上原語(如質押、託管和激勵池)來協調多個 AI 代理的利益,而不是依賴鏈下聲譽或孤立的數據庫。
想象一下一群代理協作完成一項複雜任務(例如,為訓練新模型而進行數據標記)。每個代理的表現都可以在鏈上跟蹤,並根據貢獻自動分配獎勵。基於區塊鏈的系統的透明度和不變性允許公平的報酬、更強大的聲譽跟蹤和實時發展的激勵方案。
加密原生框架可以明確地嵌入這些功能,讓開發人員使用智能合約設計激勵結構,而無需在每次需要代理信任或支付給另一個代理時重新設計輪子。
早期市場的新機遇
雖然像 LangChain 這樣的框架已經具有了思想共享和網絡效應,但人工智能代理領域仍處於起步階段。目前尚不清楚這些系統的最終狀態會是什麼樣子,而且沒有一種方法能夠鎖定市場。
加密經濟學激勵為框架的構建、管理和貨幣化方式開闢了新的可能性,這些可能性無法完全映射到傳統的 SaaS 或 Web2 經濟學上。在這個早期階段的實驗可以為框架本身解鎖新的貨幣化策略,而不僅僅是構建在框架之上的代理。
競爭者
標準
為了評估每個框架的實力,我們站在想要構建 AI 代理的開發人員的角度。他們會關心什麼?我們認為將評估分為三個主要類別很有用:核心、功能和開發人員體驗。
您可以將框架的核心視為構建所有其他代理的基礎。如果核心薄弱、緩慢或不不斷髮展,則使用該框架創建的代理將受到同樣的限制。可以根據以下標準評估核心:
除了核心功能之外,框架的實際效用在很大程度上取決於其功能和集成。工具極大地擴展了代理的實際功能。僅具有 LLM 訪問權限的代理可以參與對話,但授予其訪問 Web 瀏覽器的權限,它就可以檢索實時信息。將其連接到您的日曆 API,它就可以安排會議。每個新工具都會成倍地增加代理的功能。從開發人員的角度來看,工具數量越多,可選性和實驗範圍就越大。
我們從三個維度評估加密原生框架的功能:
最後,即使是最強大的框架也只能與開發人員的體驗一樣好。一個框架可以擁有一流的功能,但如果開發人員難以有效地使用它,它就永遠不會被廣泛採用。
結果
下表總結了每個框架在我們剛剛定義的參數中的表現(排名 1-5)。
雖然討論每個數據點背後的原因超出了本文的範圍,但以下是每個框架給我們留下的一些突出印象。
Eliza 是迄今為止此列表中最成熟的框架。鑑於 Eliza 框架已成為加密生態系統在最近的代理浪潮中接觸人工智能的謝林點,它突出的一個特點是其支持的特性和集成數量之多。
由於其產生的知名度,每個區塊鏈和開發工具都爭先恐後地將其自身集成到該框架中(目前它擁有近 100 個集成!)。同時,Eliza 也吸引了比大多數框架更多的開發者活動。Eliza 至少在短期內受益於一些非常清晰的網絡效應。該框架採用 TypeScript 編寫,這是一種成熟的語言,既被初學者又被經驗豐富的開發者使用,這進一步推動了它的發展。
Eliza 還因其為開發者使用該框架而提供的豐富的教育內容和教程而脫穎而出。
我們已經看到了使用 Eliza 框架的一系列代理,包括 Spore、Eliza(代理)和 Pillzumi。Eliza 框架的新版本預計將在未來幾周內發佈。
Rig 的方法與 Eliza 的方法根本不同。它以擁有強大、輕量級和高性能的核心而脫穎而出。它支持各種推理模式,包括提示鏈(順序應用提示)、編排(協調多個代理)、條件邏輯和並行性(併發執行操作)。
然而,Rig 本身並沒有那麼豐富的集成。相反,它採用了一種不同的方法,團隊稱之為“Arc 握手”。在這裡,Arc 團隊與 Web2 和 Web3 中不同的高質量團隊合作,以擴展 Rig 的功能。其中一些合作包括與 Soulgraph 合作開發代理個性,以及與 Listen 和 Solana Agent Kit 合作開發區塊鏈功能。
儘管如此,Rig 有兩個缺點。首先,它是用 Rust 編寫的,雖然性能極佳,但相對較少的開發者熟悉它。其次,我們只在實際應用中看到了有限數量的 Rig 驅動的代理(AskJimmy 是一個例外),這使得評估真正的開發者採用情況變得困難。
在開始 Daydreams 之前,創始人 lordOfAFew 是 Eliza 框架的主要貢獻者。這讓他接觸到了該框架的增長,更重要的是,接觸到了一些缺點。Daydreams 與其他框架的不同之處在於,它專注于思維鏈推理,以幫助代理實現長期目標。這意味著,當給定一個高層次和複雜的目標時,代理會進行多步驟推理,提出各種行動,根據它們是否有助於實現目標來接受或丟棄它們,並繼續這個過程以取得進展。這使得使用 Daydreams 創建的代理真正具有自主性。
創始人在構建遊戲項目方面的背景影響了這種方法。遊戲,特別是鏈上游戲,是訓練代理和測試其能力的理想溫床。毫不奇怪,Daydreams 代理的一些早期用例是在像 Pistols、Istarai 和 PonziLand 這樣的遊戲中。
該框架還具有強大的多代理協作和編排工作流實現。
與 Daydreams 類似,Pippin 也是框架遊戲中的後來者。我們在這篇文章中詳細介紹了它的發佈。Yohei 的願景的核心是讓代理成為一個“數字存在”,通過訪問正確的工具,可以智能和自主地運行。這個願景體現在 Pippin 簡單而優雅的核心中。只需幾行代碼,就可以創建一個複雜的代理,它可以自主運行,甚至可以為自己編寫代碼。
該框架的缺點是,它甚至缺乏像支持向量嵌入和 RAG 工作流這樣的基本功能。它還鼓勵開發者使用第三方庫 Composio 進行大多數集成。與迄今為止討論的其他框架相比,它根本不夠成熟。
使用 Pippin 構建的一些代理包括 Ditto 和 Telemafia。
Zerepy 具有相對簡單的核心實現。它有效地從一組配置的任務中選擇一個任務,並在需要時執行它。然而,它缺乏像目標驅動或思維鏈規劃這樣的複雜推理模式。
雖然它支持對多個 LLM 進行推理調用,但它缺乏任何嵌入或 RAG 實現。它也缺乏任何用於記憶或多代理協調的原語。
這種核心功能和集成的缺乏反映在 Zerepy 的採用情況上。我們還沒有看到任何使用該框架的實際代理上線。
使用框架進行構建
如果所有這些聽起來都很技術性和理論性,我們不會責怪你。一個更簡單的問題是“我可以使用這些框架構建什麼樣的代理,而不必自己編寫一堆代碼?”。
為了在實踐中評估這些框架,我們確定了開發人員經常想要構建的五種常見代理類型。它們代表了不同的複雜程度,並測試了每個框架功能的各個方面。
我們為每個框架針對每種代理類型給出了滿分 5 分的評分。以下是它們的表現:
開源指標
在評估這些框架時,大多數分析都非常重視 GitHub 指標,如stars和fork。在這裡,我們將快速介紹這些指標是什麼,以及它們在多大程度上表明框架的質量。
星標充當最明顯的受歡迎程度信號。它們本質上是開發者給予他們認為有趣或想要跟蹤的項目的書籤。雖然高星標數表明了廣泛的認知和興趣,但它可能會產生誤導。項目有時會通過營銷而不是技術價值來積累星標。將星標視為社會證明,而不是質量衡量標準。
Fork 數告訴你多少開發者創建了自己的代碼庫副本以在其基礎上構建。更多的 fork 通常表明開發者正在積極使用和擴展該項目。也就是說,許多 fork 最終被放棄,因此原始 fork 數需要上下文。
貢獻者數量揭示了有多少不同的開發者實際向該項目提交了代碼。這通常比星標或 fork 更有意義。健康的常規貢獻者數量表明該項目有一個活躍的社區在維護和改進它。
我們更進一步,設計了自己的指標——貢獻者分數。我們評估每個開發者的公開歷史,包括他們過去對其他項目的貢獻、活動頻率和他們帳戶的受歡迎程度,為每個貢獻者分配一個分數。然後,我們對一個項目的所有貢獻者進行平均,並根據他們做出的貢獻數量進行加權。
這些數字對我們的框架意味著什麼?
在大多數情況下,星標的數量可以忽略不計。它們不是採用情況的有意義指標。這裡的例外是 Eliza,它一度成為 GitHub 上所有項目中排名第一的趨勢存儲庫,這與其成為所有加密人工智能的謝林點相符。此外,像 0xCygaar 這樣的知名開發者也為該項目做出了貢獻。這也反映在貢獻者的數量上——比其他項目多 10 倍——Eliza 吸引了貢獻者。
除此之外,Daydreams 對我們來說很有趣,僅僅是因為它吸引了高質量的開發者。作為一個在炒作高峰後推出的後來者,它沒有受益於 Eliza 的網絡效應。
下一步是什麼?
如果你是一名開發者,我們希望我們至少為你選擇構建哪個框架(如果你需要的話)提供了一個起點。除此之外,你仍然必須努力測試每個框架的核心推理和集成是否適合你的用例。這是無法避免的。
從觀察者的角度來看,重要的是要記住,所有這些人工智能代理框架都不到三個月大。(是的,感覺更長。)在此期間,它們從極度炒作變成了被稱為“空中樓閣”。這就是技術的本質。儘管存在這種波動性,我們相信這個領域是加密領域一個有趣且持久的新實驗。
接下來重要的是這些框架如何在技術和貨幣化方面成熟。
就技術而言,框架可以為自己創造的最大優勢是使代理能夠無縫地在鏈上交互。這是開發者選擇加密原生框架而不是通用框架的首要原因。此外,代理和代理構建技術是全球的前沿技術問題,每天都有新的發展。框架還必須不斷髮展和適應這些進展。
框架如何實現貨幣化更有趣。在這些初期,創建一個受 Virtuals 啟發的啟動平臺是項目的唾手可得的果實。但我們認為這裡有很多實驗空間。我們正走向一個擁有數百萬個代理的未來,它們專門從事各種可以想象到的細分領域。幫助它們有效協調的工具可以從交易費用中捕獲巨大的價值。作為構建者的門戶,框架當然最適合捕獲這些價值。
同時,框架的貨幣化也偽裝成開源項目貨幣化和獎勵貢獻者的問題,這些貢獻者歷來從事免費、吃力不討好的工作。如果一個團隊能夠破解如何創建一個可持續的開源經濟,同時保持其基本精神的代碼,其影響將遠遠超出代理框架。
這些是我們希望在未來幾個月內探索的主題。