AIフレームワークの解体:知能エージェントから分散化の探求まで

中級1/16/2025, 6:03:33 AM
この記事は、AIエージェント分野の開発トレンドと投資ロジックについて詳しく掘り下げ、フレームワークベースのプロジェクトを詳細に分析することに焦点を当てています。AIフレームワークの基本的な概念と機能を紹介し、Eliza、G.A.M.E、Rig、およびZerePyなどの具体的な事例研究を通じて、さまざまなアプリケーションシナリオでのパフォーマンスとポテンシャルを実証しています。さらに、技術、市場、投資の観点から、本記事はAIエージェントとBTCエコシステムの類似点を比較し、AIエージェントをブロックチェーン上に持ち込むことの意義とこれによってもたらされる将来の革新の可能性を探っています。

紹介

以前の記事では、AIミームの現状とAIエージェントの将来の開発に関する見解を頻繁に議論してきました。しかし、AIエージェントトラックの急速な物語の展開と進化は、まだやや圧倒的です。「Truth Terminal」のローンチとAgent Summerの始まりからわずか2か月の間に、AIと暗号の統合の物語はほぼ毎週進化してきました。最近、市場の関心は、主に技術的な物語によって推進される「フレームワーク」プロジェクトに移り始めています。このニッチな分野は、過去数週間で時価総額が10億ドルを超えるユニコーンプロジェクトをすでにいくつか生み出しています。また、これらのプロジェクトは、プロジェクトがGitHubコードリポジトリに基づいてトークンを発行し、これらのフレームワーク上に構築されたエージェントもトークンを発行できるという、アセット発行の新しいパラダイムにもつながりました。この構造の中核となるのは、エージェントを上のレイヤーとするフレームワークです。これは資産発行プラットフォームに似ていますが、実際にはAI時代に出現したユニークなインフラモデルです。この新たな潮流をどう捉えるべきか。この記事では、フレームワークの紹介から始まり、AIフレームワークが暗号資産にとって何を意味するのかを解釈し、これらの洞察を私たち自身の考察と組み合わせます。

I. フレームワークとは何ですか?

定義上、AIフレームワークは、複雑なAIモデルを構築するプロセスを簡略化するために事前に構築されたモジュール、ライブラリ、ツールを統合する基盤の開発ツールまたはプラットフォームです。これらのフレームワークには通常、データの処理、モデルのトレーニング、予測の実行を行うための機能も含まれています。単純に言えば、フレームワークはAI時代のオペレーティングシステムと考えることができます。WindowsやLinuxのようなデスクトップオペレーティングシステムやiOSやAndroidのようなモバイルオペレーティングシステムと同様です。各フレームワークにはそれぞれ利点と欠点があり、開発者は独自のニーズに基づいて選択することができます。

「AIフレームワーク」という用語は、まだ比較的新しいコンセプトですが、その開発は実際には2010年のTheanoから始まり、約14年の歴史があります。従来のAIコミュニティでは、GoogleのTensorFlow、MetaのPyTorch、BaiduのPaddlePaddle、ByteDanceのMagicAnimateなど、学術界と産業界の両方で非常に成熟したフレームワークが既に選択肢として存在しており、それぞれが異なるシナリオで利点を持っています。

暗号通貨で現在台頭しているAIフレームワークプロジェクトは、AIブームから生じた多数のエージェントの需要に基づいており、これらはさらに他のトラックに分岐し、最終的には特定のサブフィールド向けのさまざまなAIフレームワークを形成しています。業界で現在主流のフレームワークのいくつかを探って、このポイントをよりよく説明しましょう。

1.1 エリザ

まず、ai16zによって作成されたフレームワークであるElizaを考えてみましょう。これは、自律型AIエージェントを作成、展開、管理するために設計されたマルチエージェントシミュレーションフレームワークです。プログラミング言語としてTypeScriptを使用して開発されており、その利点はより良い互換性とより簡単なAPI統合にあります。公式のドキュメントによると、Elizaは主にソーシャルメディア向けに設計されており、マルチプラットフォーム統合をサポートしています。このフレームワークは、フル機能のDiscord統合を提供し、音声チャンネルをサポートし、X/Twitter用の自動化されたアカウント、Telegram統合、および直接APIアクセスをサポートしています。メディアコンテンツ処理に関しては、PDFドキュメントの読み取りと分析、リンクの抽出と要約、オーディオの転記、ビデオコンテンツの処理、画像解析、および会話の要約をサポートしています。

Elizaが現在サポートしているユースケースは、次の4つのカテゴリに分類されます:

  1. AIアシスタントアプリケーション:カスタマーサポートエージェント、コミュニティ管理者、個人アシスタント。
  2. ソーシャルメディアの役割:自動コンテンツクリエーター、インタラクティブボット、ブランド代表者。
  3. 知識労働者:研究アシスタント、コンテンツアナリスト、文書処理者。
  4. インタラクティブな役割:役割を演じるキャラクター、教育的なチューター、エンターテインメントボット。

Elizaが現在サポートしているモデルは次のとおりです:

  1. オープンソースのローカル推論モデル:Llama3、Qwen1.5、BERTなど。
  2. OpenAI APIを使用したクラウド推論。
  3. Nous Hermes Llama 3.1Bのデフォルト設定。
  4. 複雑なクエリに対するClaudeとの統合。

1.2 G.A.M.E

G.A.M.E(Generative Autonomous Multimodal Entities Framework)は、Virtualが開発した自動生成と管理のためのマルチモーダルAIフレームワークです。主にゲーム内でのインテリジェントなNPCデザインに使用されます。このフレームワークの特徴の一つは、低コードまたはノーコードのユーザーでも、トライアルインターフェースを通じてパラメータを簡単に変更することでエージェントのデザインに参加できることです。

プロジェクトアーキテクチャに関しては、G.A.M.Eは複数のサブシステムが協調して動作するモジュラーデザインで構築されています。詳細なアーキテクチャは以下の通りです:

  1. エージェントプロンプトインターフェース:開発者がAIフレームワークと対話するためのインターフェース。このインターフェースを通じて、開発者はセッションを開始し、セッションID、エージェントID、ユーザーID、およびその他のパラメータを指定することができます。
  2. パーセプションサブシステム:入力情報を受け取り、合成し、戦略計画エンジンに送信する責任を持ちます。また、対話処理モジュールからの応答も処理します。
  3. 戦略計画エンジン:全体のフレームワークの中核であり、高レベルのプランナーと低レベルのポリシーに分かれています。高レベルのプランナーは長期的な目標と計画を策定する責任があり、低レベルのポリシーはこれらの計画を具体的な行動に翻訳します。
  4. ワールドコンテキスト:環境情報、世界の状況、およびゲームの状態データを含み、エージェントが現在のコンテキストを理解するのに役立ちます。
  5. ダイアログ処理モジュール:メッセージと応答を処理し、ダイアログやリアクションを出力します。
  6. オンチェーンウォレットオペレーター:ブロックチェーン技術アプリケーションに関連している可能性がありますが、具体的な機能は不明です。
  7. 学習モジュール:フィードバックから学習し、エージェントの知識ベースを更新します。
  8. 作業メモリ:最近のアクション、結果、現在の計画など、他の短期情報を保存します。
  9. Long-Term Memory Processor: エージェントとその作業メモリについての重要な情報を抽出し、重要性、最近性、関連性などの要素に基づいてランク付けします。
  10. エージェントリポジトリ:エージェントの目標、反省、経験、および特性を保存します。
  11. アクションプランナー:低レベル戦略に基づいて具体的なアクションプランを生成します。
  12. プラン実行者:アクションプランナーによって生成されたアクションプランを実行します。

ワークフロー:開発者はエージェントのプロンプトインターフェースを介してエージェントを開始します。パーセプションサブシステムは入力を受け取り、それを戦略計画エンジンに送信します。エンジンはメモリシステム、ワールドコンテキスト、エージェントリポジトリの助けを借りて行動計画を策定し、実行します。学習モジュールはエージェントの行動を監視し、その行動を適応させます。

応用シナリオ:全体の技術的なアーキテクチャから見ると、このフレームワークは仮想環境のエージェントの意思決定、フィードバック、知覚、および個性に焦点を当てています。ゲームに加えて、このフレームワークはメタバースにも適用可能です。Virtualの以下のリストでは、すでに多くのプロジェクトがこのフレームワークを採用しています。

1.3 リグ

Rigは、Rustで書かれたオープンソースのツールで、特に大規模言語モデル(LLM)アプリケーションの開発を簡素化することを目的としています。これは、開発者が複数のLLMサービスプロバイダー(OpenAIやAnthropicなど)やさまざまなベクトルデータベース(MongoDBやNeo4jなど)と簡単にやり取りできる統一されたインターフェースを提供します。

主な特徴:

  • 統合インターフェース:どのLLMプロバイダーまたはベクトルストレージを使用しているかに関係なく、Rigは一貫したアクセス方法を提供し、統合作業の複雑さを大幅に減らします。
  • モジュラーアーキテクチャ:フレームワークはモジュラーデザインを採用しており、プロバイダー抽象化レイヤー、ベクトルストレージインターフェイス、インテリジェントエージェントシステムなどの主要コンポーネントを含み、システムの柔軟性と拡張性を確保します。
  • Type Safety:Rustの機能を活用して、Rigは型安全な埋め込み操作を実現し、コードの品質とランタイムのセキュリティを確保します。
  • 高いパフォーマンス:システムは非同期プログラミングをサポートし、並行処理能力を最適化します。組み込みのログ記録および監視機能は、メンテナンスとトラブルシューティングをサポートします。

ワークフロー:ユーザーがRigシステムに入力すると、まずリクエストは「プロバイダー抽象化レイヤー」を通過します。これにより、さまざまなプロバイダー間の違いが標準化され、一貫したエラーハンドリングが行われます。コアレイヤーでは、インテリジェントエージェントが異なるツールを呼び出したり、ベクトルストレージをクエリしたりして必要な情報を取得します。最後に、ドキュメントの検索と文脈理解を組み合わせた機能である「Retrieval-Augmented Generation(RAG)」などの高度なメカニズムが、正確で意味のある応答を生成してユーザーに返します。

ユースケース:Rigは、高速かつ正確な質問応答が必要なシステムの構築に適しており、効率的なドキュメント検索ツールの作成、コンテキストに敏感なチャットボットや仮想アシスタントの開発、さらには既存のデータパターンに基づいてテキストや他の形式のコンテンツを自動生成してコンテンツ作成をサポートします。

1.4 ZerePy

ZerePyは、Pythonに基づいたオープンソースフレームワークであり、X(旧Twitter)プラットフォーム上でのAIエージェントの展開と管理を簡素化することを目的として設計されています。それはZerebroプロジェクトから進化し、そのコア機能を継承しているが、よりモジュラーかつスケーラブルな形で設計されています。目標は、開発者が簡単にパーソナライズされたAIエージェントを作成し、X上でさまざまな自動化タスクとコンテンツ作成を実装できるようにすることです。

ZerePyは、ユーザーが展開するAIエージェントを管理および制御するために便利なコマンドラインインターフェース(CLI)を提供します。そのコアアーキテクチャはモジュラーであり、開発者が異なる機能モジュール(例:)を柔軟に統合できます。

  • LLM統合:ZerePyは、OpenAIおよびAnthropicの大規模な言語モデル(LLM)をサポートしており、開発者がアプリケーションに最適なモデルを選択することができます。これにより、エージェントは高品質なテキストコンテンツを生成することができます。
  • Xプラットフォーム統合:フレームワークはXのAPIと直接連携し、エージェントが投稿、返信、いいね、リツイートなどのタスクを実行できるようにします。
  • モジュラーコネクションシステム:このシステムを使用すると、開発者は他のソーシャルプラットフォームやサービスのサポートを簡単に追加し、フレームワークの機能を拡張できます。
  • メモリシステム(将来の計画):現在のバージョンでは完全には実装されていませんが、ZerePyの設計目標には、エージェントが以前のインタラクションとコンテキスト情報を記憶して、より一貫性のあるパーソナライズされたコンテンツを生成できるようにするメモリシステムの統合が含まれています。

ZerePyとa16zのElizaプロジェクトは、AIエージェントの構築と管理を目指していますが、アーキテクチャと焦点は異なります。Elizaはより多様なエージェントシミュレーションと広範なAI研究に重点を置いていますが、ZerePyは特定のソーシャルプラットフォーム(X)でのAIエージェントの展開を簡素化することに焦点を当てており、よりアプリケーション指向です。

II. BTCエコシステムのレプリカ

開発の経路において、AIエージェントは2023年末から2024年初頭のBTCエコシステムと多くの類似点を共有しています。BTCエコシステムの開発の軌跡は、BRC20-Atomical/Runeおよび他のマルチプロトコルの競争、BTC L2、バビロンを中心としたBTCFiに集約されます。一方、AIエージェントは成熟した伝統的なAI技術スタックの基盤の上でより急速に発展しており、全体的な開発の経路はいくつかの点でBTCエコシステムと類似しています。私は次のように要約します。GOAT/ACT - ソーシャルタイプのエージェント - 分析型AIエージェントフレームワークの競争。トレンドの観点から見ると、エージェントに焦点を当てた分散化とセキュリティに関するインフラプロジェクトもこのフレームワークの波を引き続き伴い、次の主要なテーマとなるでしょう。

それでは、BTCエコシステムと同様に、このトラックは均質化とバブル化につながるのでしょうか?私はそうは思いません。まず、AIエージェントの物語は、スマートコントラクトチェーンの歴史を再現することではありません。第二に、これらの既存のAIフレームワークプロジェクトが技術的に強力であるか、PPTの段階に詰まっているか、単なるCtrl+CとCtrl+Vかどうかは別としても、少なくとも新しいインフラストラクチャの開発アプローチを提供しています。多くの記事がAIフレームワークを資産発行プラットフォームに、エージェントを資産に例えています。しかし、Memecoin LaunchpadsやInscriptionプロトコルと比較して、私は個人的にはAIフレームワークが将来のパブリックチェーンに似ており、エージェントが将来のDAppsに似ていると考えています。

現在の暗号スペースでは、数千のパブリックチェーンと数万のDAppsが存在しています。汎用チェーンでは、BTC、Ethereum、さまざまな異種チェーンなどがありますが、アプリケーションチェーンの形式はさらに多様で、ゲームチェーン、ストレージチェーン、Dexチェーンなどがあります。パブリックチェーンとAIフレームワークは性質が非常に似ており、DAppsはエージェントによく対応することができます。

暗号通貨時代において、この方向性でスペースが進化する可能性が非常に高いです。将来の議論は、EVMと異種チェーンの対決からフレームワークの議論に移るでしょう。現在の問題は、分散化、つまり「チェーン化」する方法です。私は、将来のAIインフラプロジェクトがこの基盤を中心に開発されると信じています。もう一つ重要なポイントは、ブロックチェーン上でこれを行うことの意義です。

III. オンチェーンの重要性

ブロックチェーンが何と組み合わされるにせよ、最終的には「意味があるのか」という重要な問題に直面します。昨年の記事では、インフラ整備が進みすぎているGameFiの優先順位の見当違いを批判し、AIに関する以前の記事では、AIと暗号を組み合わせることの現在の実用性について懐疑的な見方を示しました。結局のところ、従来のプロジェクトの物語の原動力はますます弱まっています。昨年、トークン価格の面で好調だったいくつかの伝統的なプロジェクトは、一般的に価格の強さに匹敵するか、それを超えることができるものでした。

AIが暗号通貨に何ができるのか?以前は、ユーザーの代わりにAIエージェントがタスクを実行したり、メタバースやエージェントを従業員として考えたりするといったユースケースを考えていました。これらの需要は完全にオンチェーンである必要はなく、ビジネスロジックの観点からはクローズドループを形成することはできません。前の記事で言及されたエージェントブラウザは、意図を実装したものであり、データラベリングや推論計算能力の需要を生成することができますが、これらの2つの要素はまだ緊密に統合されておらず、計算能力の面では、集中型のコンピューティングが依然として優位を占めています。

DeFiの成功を再評価すると、DeFiが伝統的な金融の一部を切り取ることができた理由は、よりアクセスしやすく、効率的でコストが低く、信頼性のあるセキュリティを提供しているからです。このフレームワークを考慮すると、エージェントの「チェーン化」が意味を持つ理由がいくつかあると思います。

  1. コスト削減:エージェントチェーン化によって使用コストを下げることができ、それによりユーザーにとってより多くの選択肢とアクセシビリティが実現される可能性がありますか?これにより、従来Web2テックジャイアントのAI「レンタル」が独占的な領域であったものに一般ユーザーが参加することができるようになる可能性があります。
  2. セキュリティ:最も単純な定義によれば、エージェントとは、仮想世界または現実世界とやりとりできるAIです。エージェントが現実世界や私の仮想ウォレットに介入できる場合、ブロックチェーンに基づくセキュリティソリューションが必要になる可能性があります。
  3. ブロックチェーン固有の金融プレイ:エージェントはブロックチェーン上で独自の金融メカニズムを作成できますか?例えば、AMM(自動マーケットメーカー)では、流動性提供者(LP)が一般ユーザーが自動的にマーケットメイキングに参加することを可能にします。同様に、エージェントがコンピューティングパワーやデータラベリングを必要とする場合、ユーザーはシステムへの信頼に基づいてUSDTの形でこれらのプロトコルに投資することができます。また、異なるアプリケーションシナリオのエージェントは、新しい金融構造を形成することができます。
  4. DeFiインタープロパビリティ: DeFiは現在完全なインタープロバビリティを欠いていますが、エージェントは透明で追跡可能な推論プロセスを可能にすることで、この問題に対処できるかもしれません。

IV. Creativity?

将来のフレームワークプロジェクトは、GPTストアに類似した起業の機会を提供するようになるでしょう。フレームワークを介してエージェントを立ち上げることは、まだ一般ユーザーにとっては複雑ですが、エージェント構築プロセスを簡素化し、より複雑な機能の組み合わせを提供することで、将来的にはこのようなフレームワークに競争上の優位性をもたらすと信じています。これにより、GPTストアよりもはるかに興味深いWeb3の創造的経済が生まれる可能性があります。

現在、GPTストアはまだ伝統的な実用的な用途に向けられており、最も人気のあるアプリのほとんどは伝統的なWeb2企業によって作成されています。さらに、生み出された収入の大部分は、作成者によって大部分が独占されています。OpenAIの公式説明によると、この戦略は単純に優れた開発者に財政支援を提供し、アメリカ合衆国の優れた開発者に補助金を提供することです。

需要の観点から見ると、Web3にはまだ埋めるべき多くのギャップがあり、経済システムの観点からは、Web2の巨大企業の不公平な政策をより公正にすることができます。また、私たちは自然にコミュニティ経済を導入してエージェントをさらに改善することができます。エージェントを中心とした創造的な経済は、一般の人々に参加の機会を提供します。将来、AIメームはGOATやClankerが発行するエージェントよりもはるかに賢く、面白くなるでしょう。

YBBについて

YBBは、すべてのインターネット利用者のためにより良いオンライン環境を作り出すことを目指して、Web3を定義するプロジェクトを特定するためのWeb3ファンドです。2013年以来、この業界に積極的に参加してきたブロックチェーンの信者たちによって設立されたYBBは、常に早期のプロジェクトが0から1へ進化するのを手助けすることを目指しています。私たちは革新、自己駆動の情熱、およびユーザー志向の製品を重視しており、同時に暗号通貨とブロックチェーンのアプリケーションの可能性を認識しています。

ウェブサイト | Twi: @YBBCapital

免責事項:

  1. この記事は[から転載されましたYBBキャピタル]. すべての著作権は元の著者に帰属します。[YBB Capitalの研究者Zeke]. If there are objections to this reprint, please contact the Gate Learnチームにお任せいただければ、迅速に対応いたします。
  2. 責任の免責事項:この記事で表現されている見解や意見は、著者個人によるものであり、投資アドバイスを意味するものではありません。
  3. Gate Learnチームは記事を他の言語に翻訳しました。翻訳された記事のコピー、配布、または盗作は、特に言及されていない限り禁止されています。

AIフレームワークの解体:知能エージェントから分散化の探求まで

中級1/16/2025, 6:03:33 AM
この記事は、AIエージェント分野の開発トレンドと投資ロジックについて詳しく掘り下げ、フレームワークベースのプロジェクトを詳細に分析することに焦点を当てています。AIフレームワークの基本的な概念と機能を紹介し、Eliza、G.A.M.E、Rig、およびZerePyなどの具体的な事例研究を通じて、さまざまなアプリケーションシナリオでのパフォーマンスとポテンシャルを実証しています。さらに、技術、市場、投資の観点から、本記事はAIエージェントとBTCエコシステムの類似点を比較し、AIエージェントをブロックチェーン上に持ち込むことの意義とこれによってもたらされる将来の革新の可能性を探っています。

紹介

以前の記事では、AIミームの現状とAIエージェントの将来の開発に関する見解を頻繁に議論してきました。しかし、AIエージェントトラックの急速な物語の展開と進化は、まだやや圧倒的です。「Truth Terminal」のローンチとAgent Summerの始まりからわずか2か月の間に、AIと暗号の統合の物語はほぼ毎週進化してきました。最近、市場の関心は、主に技術的な物語によって推進される「フレームワーク」プロジェクトに移り始めています。このニッチな分野は、過去数週間で時価総額が10億ドルを超えるユニコーンプロジェクトをすでにいくつか生み出しています。また、これらのプロジェクトは、プロジェクトがGitHubコードリポジトリに基づいてトークンを発行し、これらのフレームワーク上に構築されたエージェントもトークンを発行できるという、アセット発行の新しいパラダイムにもつながりました。この構造の中核となるのは、エージェントを上のレイヤーとするフレームワークです。これは資産発行プラットフォームに似ていますが、実際にはAI時代に出現したユニークなインフラモデルです。この新たな潮流をどう捉えるべきか。この記事では、フレームワークの紹介から始まり、AIフレームワークが暗号資産にとって何を意味するのかを解釈し、これらの洞察を私たち自身の考察と組み合わせます。

I. フレームワークとは何ですか?

定義上、AIフレームワークは、複雑なAIモデルを構築するプロセスを簡略化するために事前に構築されたモジュール、ライブラリ、ツールを統合する基盤の開発ツールまたはプラットフォームです。これらのフレームワークには通常、データの処理、モデルのトレーニング、予測の実行を行うための機能も含まれています。単純に言えば、フレームワークはAI時代のオペレーティングシステムと考えることができます。WindowsやLinuxのようなデスクトップオペレーティングシステムやiOSやAndroidのようなモバイルオペレーティングシステムと同様です。各フレームワークにはそれぞれ利点と欠点があり、開発者は独自のニーズに基づいて選択することができます。

「AIフレームワーク」という用語は、まだ比較的新しいコンセプトですが、その開発は実際には2010年のTheanoから始まり、約14年の歴史があります。従来のAIコミュニティでは、GoogleのTensorFlow、MetaのPyTorch、BaiduのPaddlePaddle、ByteDanceのMagicAnimateなど、学術界と産業界の両方で非常に成熟したフレームワークが既に選択肢として存在しており、それぞれが異なるシナリオで利点を持っています。

暗号通貨で現在台頭しているAIフレームワークプロジェクトは、AIブームから生じた多数のエージェントの需要に基づいており、これらはさらに他のトラックに分岐し、最終的には特定のサブフィールド向けのさまざまなAIフレームワークを形成しています。業界で現在主流のフレームワークのいくつかを探って、このポイントをよりよく説明しましょう。

1.1 エリザ

まず、ai16zによって作成されたフレームワークであるElizaを考えてみましょう。これは、自律型AIエージェントを作成、展開、管理するために設計されたマルチエージェントシミュレーションフレームワークです。プログラミング言語としてTypeScriptを使用して開発されており、その利点はより良い互換性とより簡単なAPI統合にあります。公式のドキュメントによると、Elizaは主にソーシャルメディア向けに設計されており、マルチプラットフォーム統合をサポートしています。このフレームワークは、フル機能のDiscord統合を提供し、音声チャンネルをサポートし、X/Twitter用の自動化されたアカウント、Telegram統合、および直接APIアクセスをサポートしています。メディアコンテンツ処理に関しては、PDFドキュメントの読み取りと分析、リンクの抽出と要約、オーディオの転記、ビデオコンテンツの処理、画像解析、および会話の要約をサポートしています。

Elizaが現在サポートしているユースケースは、次の4つのカテゴリに分類されます:

  1. AIアシスタントアプリケーション:カスタマーサポートエージェント、コミュニティ管理者、個人アシスタント。
  2. ソーシャルメディアの役割:自動コンテンツクリエーター、インタラクティブボット、ブランド代表者。
  3. 知識労働者:研究アシスタント、コンテンツアナリスト、文書処理者。
  4. インタラクティブな役割:役割を演じるキャラクター、教育的なチューター、エンターテインメントボット。

Elizaが現在サポートしているモデルは次のとおりです:

  1. オープンソースのローカル推論モデル:Llama3、Qwen1.5、BERTなど。
  2. OpenAI APIを使用したクラウド推論。
  3. Nous Hermes Llama 3.1Bのデフォルト設定。
  4. 複雑なクエリに対するClaudeとの統合。

1.2 G.A.M.E

G.A.M.E(Generative Autonomous Multimodal Entities Framework)は、Virtualが開発した自動生成と管理のためのマルチモーダルAIフレームワークです。主にゲーム内でのインテリジェントなNPCデザインに使用されます。このフレームワークの特徴の一つは、低コードまたはノーコードのユーザーでも、トライアルインターフェースを通じてパラメータを簡単に変更することでエージェントのデザインに参加できることです。

プロジェクトアーキテクチャに関しては、G.A.M.Eは複数のサブシステムが協調して動作するモジュラーデザインで構築されています。詳細なアーキテクチャは以下の通りです:

  1. エージェントプロンプトインターフェース:開発者がAIフレームワークと対話するためのインターフェース。このインターフェースを通じて、開発者はセッションを開始し、セッションID、エージェントID、ユーザーID、およびその他のパラメータを指定することができます。
  2. パーセプションサブシステム:入力情報を受け取り、合成し、戦略計画エンジンに送信する責任を持ちます。また、対話処理モジュールからの応答も処理します。
  3. 戦略計画エンジン:全体のフレームワークの中核であり、高レベルのプランナーと低レベルのポリシーに分かれています。高レベルのプランナーは長期的な目標と計画を策定する責任があり、低レベルのポリシーはこれらの計画を具体的な行動に翻訳します。
  4. ワールドコンテキスト:環境情報、世界の状況、およびゲームの状態データを含み、エージェントが現在のコンテキストを理解するのに役立ちます。
  5. ダイアログ処理モジュール:メッセージと応答を処理し、ダイアログやリアクションを出力します。
  6. オンチェーンウォレットオペレーター:ブロックチェーン技術アプリケーションに関連している可能性がありますが、具体的な機能は不明です。
  7. 学習モジュール:フィードバックから学習し、エージェントの知識ベースを更新します。
  8. 作業メモリ:最近のアクション、結果、現在の計画など、他の短期情報を保存します。
  9. Long-Term Memory Processor: エージェントとその作業メモリについての重要な情報を抽出し、重要性、最近性、関連性などの要素に基づいてランク付けします。
  10. エージェントリポジトリ:エージェントの目標、反省、経験、および特性を保存します。
  11. アクションプランナー:低レベル戦略に基づいて具体的なアクションプランを生成します。
  12. プラン実行者:アクションプランナーによって生成されたアクションプランを実行します。

ワークフロー:開発者はエージェントのプロンプトインターフェースを介してエージェントを開始します。パーセプションサブシステムは入力を受け取り、それを戦略計画エンジンに送信します。エンジンはメモリシステム、ワールドコンテキスト、エージェントリポジトリの助けを借りて行動計画を策定し、実行します。学習モジュールはエージェントの行動を監視し、その行動を適応させます。

応用シナリオ:全体の技術的なアーキテクチャから見ると、このフレームワークは仮想環境のエージェントの意思決定、フィードバック、知覚、および個性に焦点を当てています。ゲームに加えて、このフレームワークはメタバースにも適用可能です。Virtualの以下のリストでは、すでに多くのプロジェクトがこのフレームワークを採用しています。

1.3 リグ

Rigは、Rustで書かれたオープンソースのツールで、特に大規模言語モデル(LLM)アプリケーションの開発を簡素化することを目的としています。これは、開発者が複数のLLMサービスプロバイダー(OpenAIやAnthropicなど)やさまざまなベクトルデータベース(MongoDBやNeo4jなど)と簡単にやり取りできる統一されたインターフェースを提供します。

主な特徴:

  • 統合インターフェース:どのLLMプロバイダーまたはベクトルストレージを使用しているかに関係なく、Rigは一貫したアクセス方法を提供し、統合作業の複雑さを大幅に減らします。
  • モジュラーアーキテクチャ:フレームワークはモジュラーデザインを採用しており、プロバイダー抽象化レイヤー、ベクトルストレージインターフェイス、インテリジェントエージェントシステムなどの主要コンポーネントを含み、システムの柔軟性と拡張性を確保します。
  • Type Safety:Rustの機能を活用して、Rigは型安全な埋め込み操作を実現し、コードの品質とランタイムのセキュリティを確保します。
  • 高いパフォーマンス:システムは非同期プログラミングをサポートし、並行処理能力を最適化します。組み込みのログ記録および監視機能は、メンテナンスとトラブルシューティングをサポートします。

ワークフロー:ユーザーがRigシステムに入力すると、まずリクエストは「プロバイダー抽象化レイヤー」を通過します。これにより、さまざまなプロバイダー間の違いが標準化され、一貫したエラーハンドリングが行われます。コアレイヤーでは、インテリジェントエージェントが異なるツールを呼び出したり、ベクトルストレージをクエリしたりして必要な情報を取得します。最後に、ドキュメントの検索と文脈理解を組み合わせた機能である「Retrieval-Augmented Generation(RAG)」などの高度なメカニズムが、正確で意味のある応答を生成してユーザーに返します。

ユースケース:Rigは、高速かつ正確な質問応答が必要なシステムの構築に適しており、効率的なドキュメント検索ツールの作成、コンテキストに敏感なチャットボットや仮想アシスタントの開発、さらには既存のデータパターンに基づいてテキストや他の形式のコンテンツを自動生成してコンテンツ作成をサポートします。

1.4 ZerePy

ZerePyは、Pythonに基づいたオープンソースフレームワークであり、X(旧Twitter)プラットフォーム上でのAIエージェントの展開と管理を簡素化することを目的として設計されています。それはZerebroプロジェクトから進化し、そのコア機能を継承しているが、よりモジュラーかつスケーラブルな形で設計されています。目標は、開発者が簡単にパーソナライズされたAIエージェントを作成し、X上でさまざまな自動化タスクとコンテンツ作成を実装できるようにすることです。

ZerePyは、ユーザーが展開するAIエージェントを管理および制御するために便利なコマンドラインインターフェース(CLI)を提供します。そのコアアーキテクチャはモジュラーであり、開発者が異なる機能モジュール(例:)を柔軟に統合できます。

  • LLM統合:ZerePyは、OpenAIおよびAnthropicの大規模な言語モデル(LLM)をサポートしており、開発者がアプリケーションに最適なモデルを選択することができます。これにより、エージェントは高品質なテキストコンテンツを生成することができます。
  • Xプラットフォーム統合:フレームワークはXのAPIと直接連携し、エージェントが投稿、返信、いいね、リツイートなどのタスクを実行できるようにします。
  • モジュラーコネクションシステム:このシステムを使用すると、開発者は他のソーシャルプラットフォームやサービスのサポートを簡単に追加し、フレームワークの機能を拡張できます。
  • メモリシステム(将来の計画):現在のバージョンでは完全には実装されていませんが、ZerePyの設計目標には、エージェントが以前のインタラクションとコンテキスト情報を記憶して、より一貫性のあるパーソナライズされたコンテンツを生成できるようにするメモリシステムの統合が含まれています。

ZerePyとa16zのElizaプロジェクトは、AIエージェントの構築と管理を目指していますが、アーキテクチャと焦点は異なります。Elizaはより多様なエージェントシミュレーションと広範なAI研究に重点を置いていますが、ZerePyは特定のソーシャルプラットフォーム(X)でのAIエージェントの展開を簡素化することに焦点を当てており、よりアプリケーション指向です。

II. BTCエコシステムのレプリカ

開発の経路において、AIエージェントは2023年末から2024年初頭のBTCエコシステムと多くの類似点を共有しています。BTCエコシステムの開発の軌跡は、BRC20-Atomical/Runeおよび他のマルチプロトコルの競争、BTC L2、バビロンを中心としたBTCFiに集約されます。一方、AIエージェントは成熟した伝統的なAI技術スタックの基盤の上でより急速に発展しており、全体的な開発の経路はいくつかの点でBTCエコシステムと類似しています。私は次のように要約します。GOAT/ACT - ソーシャルタイプのエージェント - 分析型AIエージェントフレームワークの競争。トレンドの観点から見ると、エージェントに焦点を当てた分散化とセキュリティに関するインフラプロジェクトもこのフレームワークの波を引き続き伴い、次の主要なテーマとなるでしょう。

それでは、BTCエコシステムと同様に、このトラックは均質化とバブル化につながるのでしょうか?私はそうは思いません。まず、AIエージェントの物語は、スマートコントラクトチェーンの歴史を再現することではありません。第二に、これらの既存のAIフレームワークプロジェクトが技術的に強力であるか、PPTの段階に詰まっているか、単なるCtrl+CとCtrl+Vかどうかは別としても、少なくとも新しいインフラストラクチャの開発アプローチを提供しています。多くの記事がAIフレームワークを資産発行プラットフォームに、エージェントを資産に例えています。しかし、Memecoin LaunchpadsやInscriptionプロトコルと比較して、私は個人的にはAIフレームワークが将来のパブリックチェーンに似ており、エージェントが将来のDAppsに似ていると考えています。

現在の暗号スペースでは、数千のパブリックチェーンと数万のDAppsが存在しています。汎用チェーンでは、BTC、Ethereum、さまざまな異種チェーンなどがありますが、アプリケーションチェーンの形式はさらに多様で、ゲームチェーン、ストレージチェーン、Dexチェーンなどがあります。パブリックチェーンとAIフレームワークは性質が非常に似ており、DAppsはエージェントによく対応することができます。

暗号通貨時代において、この方向性でスペースが進化する可能性が非常に高いです。将来の議論は、EVMと異種チェーンの対決からフレームワークの議論に移るでしょう。現在の問題は、分散化、つまり「チェーン化」する方法です。私は、将来のAIインフラプロジェクトがこの基盤を中心に開発されると信じています。もう一つ重要なポイントは、ブロックチェーン上でこれを行うことの意義です。

III. オンチェーンの重要性

ブロックチェーンが何と組み合わされるにせよ、最終的には「意味があるのか」という重要な問題に直面します。昨年の記事では、インフラ整備が進みすぎているGameFiの優先順位の見当違いを批判し、AIに関する以前の記事では、AIと暗号を組み合わせることの現在の実用性について懐疑的な見方を示しました。結局のところ、従来のプロジェクトの物語の原動力はますます弱まっています。昨年、トークン価格の面で好調だったいくつかの伝統的なプロジェクトは、一般的に価格の強さに匹敵するか、それを超えることができるものでした。

AIが暗号通貨に何ができるのか?以前は、ユーザーの代わりにAIエージェントがタスクを実行したり、メタバースやエージェントを従業員として考えたりするといったユースケースを考えていました。これらの需要は完全にオンチェーンである必要はなく、ビジネスロジックの観点からはクローズドループを形成することはできません。前の記事で言及されたエージェントブラウザは、意図を実装したものであり、データラベリングや推論計算能力の需要を生成することができますが、これらの2つの要素はまだ緊密に統合されておらず、計算能力の面では、集中型のコンピューティングが依然として優位を占めています。

DeFiの成功を再評価すると、DeFiが伝統的な金融の一部を切り取ることができた理由は、よりアクセスしやすく、効率的でコストが低く、信頼性のあるセキュリティを提供しているからです。このフレームワークを考慮すると、エージェントの「チェーン化」が意味を持つ理由がいくつかあると思います。

  1. コスト削減:エージェントチェーン化によって使用コストを下げることができ、それによりユーザーにとってより多くの選択肢とアクセシビリティが実現される可能性がありますか?これにより、従来Web2テックジャイアントのAI「レンタル」が独占的な領域であったものに一般ユーザーが参加することができるようになる可能性があります。
  2. セキュリティ:最も単純な定義によれば、エージェントとは、仮想世界または現実世界とやりとりできるAIです。エージェントが現実世界や私の仮想ウォレットに介入できる場合、ブロックチェーンに基づくセキュリティソリューションが必要になる可能性があります。
  3. ブロックチェーン固有の金融プレイ:エージェントはブロックチェーン上で独自の金融メカニズムを作成できますか?例えば、AMM(自動マーケットメーカー)では、流動性提供者(LP)が一般ユーザーが自動的にマーケットメイキングに参加することを可能にします。同様に、エージェントがコンピューティングパワーやデータラベリングを必要とする場合、ユーザーはシステムへの信頼に基づいてUSDTの形でこれらのプロトコルに投資することができます。また、異なるアプリケーションシナリオのエージェントは、新しい金融構造を形成することができます。
  4. DeFiインタープロパビリティ: DeFiは現在完全なインタープロバビリティを欠いていますが、エージェントは透明で追跡可能な推論プロセスを可能にすることで、この問題に対処できるかもしれません。

IV. Creativity?

将来のフレームワークプロジェクトは、GPTストアに類似した起業の機会を提供するようになるでしょう。フレームワークを介してエージェントを立ち上げることは、まだ一般ユーザーにとっては複雑ですが、エージェント構築プロセスを簡素化し、より複雑な機能の組み合わせを提供することで、将来的にはこのようなフレームワークに競争上の優位性をもたらすと信じています。これにより、GPTストアよりもはるかに興味深いWeb3の創造的経済が生まれる可能性があります。

現在、GPTストアはまだ伝統的な実用的な用途に向けられており、最も人気のあるアプリのほとんどは伝統的なWeb2企業によって作成されています。さらに、生み出された収入の大部分は、作成者によって大部分が独占されています。OpenAIの公式説明によると、この戦略は単純に優れた開発者に財政支援を提供し、アメリカ合衆国の優れた開発者に補助金を提供することです。

需要の観点から見ると、Web3にはまだ埋めるべき多くのギャップがあり、経済システムの観点からは、Web2の巨大企業の不公平な政策をより公正にすることができます。また、私たちは自然にコミュニティ経済を導入してエージェントをさらに改善することができます。エージェントを中心とした創造的な経済は、一般の人々に参加の機会を提供します。将来、AIメームはGOATやClankerが発行するエージェントよりもはるかに賢く、面白くなるでしょう。

YBBについて

YBBは、すべてのインターネット利用者のためにより良いオンライン環境を作り出すことを目指して、Web3を定義するプロジェクトを特定するためのWeb3ファンドです。2013年以来、この業界に積極的に参加してきたブロックチェーンの信者たちによって設立されたYBBは、常に早期のプロジェクトが0から1へ進化するのを手助けすることを目指しています。私たちは革新、自己駆動の情熱、およびユーザー志向の製品を重視しており、同時に暗号通貨とブロックチェーンのアプリケーションの可能性を認識しています。

ウェブサイト | Twi: @YBBCapital

免責事項:

  1. この記事は[から転載されましたYBBキャピタル]. すべての著作権は元の著者に帰属します。[YBB Capitalの研究者Zeke]. If there are objections to this reprint, please contact the Gate Learnチームにお任せいただければ、迅速に対応いたします。
  2. 責任の免責事項:この記事で表現されている見解や意見は、著者個人によるものであり、投資アドバイスを意味するものではありません。
  3. Gate Learnチームは記事を他の言語に翻訳しました。翻訳された記事のコピー、配布、または盗作は、特に言及されていない限り禁止されています。
Начните торговать сейчас
Зарегистрируйтесь сейчас и получите ваучер на
$100
!