عمل فني لا يتم إكماله أبدًا، فقط يتم التخلي عنه.
الجميع يتحدث عن وكلاء الذكاء الاصطناعي، ولكن ما يقصدونه ليس نفس الشيء، مما يؤدي إلى فهم مختلف لوكلاء الذكاء الاصطناعي من وجهة نظرنا وجهة نظر الجمهور وجهة نظر ممارسي الذكاء الاصطناعي.
منذ وقت طويل، كتبت أن مجال العملات الرقمية هو وهم الذكاء الاصطناعيمنذ ذلك الحين، بقي اختلاط Crypto و AI علاقة حب من جانب واحد. نادراً ما يذكر الممارسون في مجال AI Web3 أو blockchain، في حين أن عشاق Crypto مولعون بشدة بـ AI. بعد شهادتهم على الظاهرة التي يمكن فيها تحويل إطارات AI Agent إلى عملات مميزة، من غير المؤكد ما إذا كان هذا يمكن أن يجلب الممارسين في مجال AI إلى عالمنا.
الذكاء الاصطناعي هو وكيل مجال العملات الرقمية. هذا هو أفضل تعليق من منظور العملات الرقمية لعرض اندفاع الذكاء الاصطناعي الحالي. الحماس المتصل بالعملات الرقمية للذكاء الاصطناعي مختلف عن الصناعات الأخرى. نحن نأمل بشكل خاص في دمج إصدار وتشغيل الأصول المالية معه.
يحتوي الوكيل الذكي على الأقل ثلاثة مصادر في جوهره. تعتبر AGI (الذكاء العام الاصطناعي) التابعة لشركة OpenAI هذه خطوة مهمة، حيث تحول هذا المصطلح إلى كلمة حديثة شائعة خارج الدوائر التقنية. ومع ذلك، في جوهره، ليس الوكيل مفهومًا جديدًا. حتى مع تمكين الذكاء الاصطناعي، من الصعب القول إنها اتجاه تكنولوجي ثوري.
المصدر الأول هو وكيل الذكاء الاصطناعي كما هو معروض في OpenAI. يمكن اعتبار وكيل الذكاء الاصطناعي مثل المستوى L3 في القيادة الذاتية بوصفه يمتلك بعض القدرات المتقدمة للمساعدة ولكنه لا يستطيع بعد الآن استبدال الإنسان بشكل كامل.
تعليق الصورة: مرحلة AGI من تخطيط OpenAI
مصدر الصورة: https://www.bloomberg.com/
المصدر الثاني هو ، كما يوحي الاسم ، وكيل الذكاء الاصطناعي ، وهو وكيل مدعوم من الذكاء الاصطناعي. مفهوم آليات الوكالة والتفويض ليس جديدا في مجال الحوسبة. ومع ذلك ، في ظل رؤية OpenAI ، سيصبح الوكيل مرحلة L3 بعد نماذج المحادثة (مثل ChatGPT) ونماذج التفكير (مثل برامج الروبوت المختلفة). الميزة الرئيسية لهذه المرحلة هي القدرة على "أداء سلوكيات معينة بشكل مستقل" ، أو كما يعرفها مؤسس LangChain هاريسون تشيس: "وكيل الذكاء الاصطناعي هو نظام يستخدم LLM (نموذج اللغة الكبيرة) لاتخاذ قرارات تدفق التحكم في البرنامج." \
هنا حيث يصبح الأمر مثيرًا للإهتمام. قبل ظهور LLMs، كان الوكيل ينفذ بشكل أساسي عمليات التشغيل التلقائية التي يضعها البشر. على سبيل المثال، عند تصميم أداة جلب البيانات، يقوم المبرمجون بتحديد User-Agent لمحاكاة تفاصيل مثل إصدار المتصفح ونظام التشغيل المستخدم من قبل المستخدمين الحقيقيين. إذا استخدم وكيل ذكاء اصطناعي لمحاكاة سلوك الإنسان بشكل أكثر دقة، فقد يؤدي ذلك إلى إنشاء إطار عمل لجلب البيانات يعتمد على وكيل ذكاء اصطناعي، مما يجعل الأداة "تشبه البشر أكثر".
في مثل هذه التحولات، يجب أن تدمج مقدمة وكلاء الذكاء الاصطناعي مع السيناريوهات القائمة، حيث نادراً ما توجد مجالات جديدة تمامًا. حتى قدرات إكمال الشفرة وإنشاء الشفرة في أدوات مثل Curosr و Github Copilot ليست سوى تحسينات وظيفية ضمن إطار بروتوكول خادم اللغة (LSP)، مع العديد من الأمثلة على هذا التطور:
للتوضيح، في تفاعل الإنسان والحاسوب، جمع بين واجهة المستخدم الرسومية والمتصفحات في ويب 1.0 حقق حقاً السماح للجمهور باستخدام الحواسيب دون حواجز، ممثلة بالجمع بين نظام التشغيل ويندوز ومتصفح إنترنت إكسبلورر. أصبحت واجهات برمجة التطبيقات (APIs) المعيار الرئيسي للتحويل والتجريد البياناتي وراء الإنترنت، وخلال عصر ويب 2.0، ظهرت متصفحات مثل كروم، مع تحول إلى الهواتف المحمولة يغير عادات استخدام الإنترنت للناس. تغطي التطبيقات الفائقة مثل وي شات والمنصات الفائقة كل جانب من جوانب حياة الناس الآن.
المصدر الثالث هو مفهوم 'النية' في مجال العملات الرقمية، الذي أدى إلى زيادة الاهتمام بوجود وكلاء الذكاء الاصطناعي. ومع ذلك، يجب ملاحظة أن هذا لا ينطبق إلا داخل مجال العملات الرقمية. من البرامج النصية لبيتكوين ذات الوظائف المحدودة إلى عقود إثريوم الذكية، فقد تم استخدام مفهوم الوكيل نفسه على نطاق واسع. ومن ثم، فإن الظهور اللاحق لجسور السلسلة المتقاطعة، والتجريدات السلسلة، وحسابات EOA (Externally Owned Accounts) إلى محافظ AA (Account Abstraction) هي تمديدات طبيعية لهذا التفكير. ولذلك، عندما يقوم وكلاء الذكاء الاصطناعي بـ 'غزو' المجال العملات الرقمية، فإنه ليس من المستغرب أن يؤديوا بشكل طبيعي إلى سيناريوهات DeFi.
هنا ينشأ الالتباس حول مفهوم عميل الذكاء الاصطناعي. في سياق Crypto ، ما نحاول بالفعل تحقيقه هو عميل "إدارة مالية آلية ، إنشاء ميمات آليًا". ومع ذلك ، بموجب تعريف OpenAI ، سيتطلب سيناريو خطير مثل هذا L4 أو L5 لتنفيذه حقًا. وفي الوقت نفسه ، يقوم الجمهور بتجربة إنشاء الرمز التلقائي أو المساعدة في الكتابة والملخصات المدعومة بالذكاء الاصطناعي ، والتي لا تتطابق مع المستوى الذي نسعى إليه.
عندما نفهم ما نريد حقًا ، يمكننا التركيز على المنطق التنظيمي لوكلاء الذكاء الاصطناعي. ستتبع التفاصيل التقنية ، حيث يتعلق مفهوم وكيل الذكاء الاصطناعي في النهاية بإزالة الحواجز عن تبني التكنولوجيا بمقياس كبير ، تمامًا مثل كيف غير المتصفحات صناعة أجهزة الكمبيوتر الشخصية. سيكون تركيزنا على نقطتين: فحص وكلاء الذكاء الاصطناعي من منظور التفاعل بين الإنسان والكمبيوتر ، وفهم الاختلافات والارتباطات بين وكلاء الذكاء الاصطناعي و LLMs ، والتي ستؤدي بنا إلى الجزء الثالث: ما الذي ستتركه في النهاية مزيج من Crypto ووكلاء الذكاء الاصطناعي.
قبل نماذج التفاعل بين الإنسان والحاسوب للمحادثة مثل ChatGPT ، كانت الأشكال الأساسية للتفاعل بين الإنسان والحاسوب هي واجهة المستخدم الرسومية (واجهة المستخدم الرسومية) و CLI (واجهة سطر الأوامر). تطورت عقلية واجهة المستخدم الرسومية إلى أشكال محددة مختلفة مثل المتصفحات والتطبيقات ، بينما شهد الجمع بين CLI و Shell تغييرا طفيفا.
ولكن هذا مجرد "الواجهة الأمامية" للتفاعل بين الإنسان والكمبيوتر. مع تطور الإنترنت، زيادة حجم البيانات وتنوعها أدى إلى المزيد من التفاعلات "الخلفية" بين البيانات والتطبيقات. تعتمد هاتان الجوانبان على بعضهما البعض - حتى الإجراءات البسيطة لتصفح الويب تتطلب فعلياً التعاون بينهما.
إذا ما اعتُبِرَ تفاعل الإنسان مع المتصفحات والتطبيقات نقطة الدخول للمستخدم، فإن الروابط والانتقالات بين واجهات برمجة التطبيقات تدعم العمل الفعلي للإنترنت. وهذا، في الواقع، جزء من الوكيل أيضًا. لا يحتاج المستخدمون العاديون إلى فهم مصطلحات مثل سطر الأوامر وواجهات برمجة التطبيقات لتحقيق أهدافهم.
والأمر نفسه صحيح بالنسبة للـ LLMs. الآن، يمكن للمستخدمين الذهاب أكثر من ذلك - ليس هناك حاجة للبحث بعد الآن. يمكن وصف العملية بالكامل في الخطوات التالية:
يمكن العثور على أن أكبر تحدٍ في هذه العملية هو Google، لأن المستخدمين لا يحتاجون إلى فتح محرك البحث، ولكن نوافذ الحوار المشابهة لـ GPT متنوعة، ومدخلات المرور تتغير بصمت. ولهذا السبب يعتقد بعض الناس أن هذا الـ LLM يحدث ثورة في حياة محركات البحث.
إذن، ما هو دور وكيل الذكاء الاصطناعي في هذه العملية؟
باختصار، الوكيل الذكي هو تمديد متخصص لـ LLM.
الـ LLMs الحالية ليست AGI (الذكاء الاصطناعي العام) وبعيدة عن منظم OpenAI المقترح. إن قدراتهم محدودة بشكل كبير. على سبيل المثال، فإن LLMs عرضة للهلوسة إذا تم تغذية الكثير من مدخلات المستخدم عليها. ويعود السبب الرئيسي لذلك إلى آلية التدريب. على سبيل المثال، إذا قمت بإخبار GPT مرارًا وتكرارًا بأن 1+1=3، فهناك احتمالية أن تجيب 4 عندما يتم سؤالها عن 1+1+1=؟.
يحدث هذا لأن تعليقات GPT تعتمد بالكامل على إدخال المستخدم. إذا لم يكن النموذج متصلاً بالإنترنت ، فمن الممكن أن يتم تعديل عمله بواسطة إدخالاتك ، مما يؤدي إلى نموذج يعرف فقط أن 1 + 1 = 3. ومع ذلك ، إذا سمح للنموذج بالاتصال بالإنترنت ، فإن آلية التعليقات الخاصة به تصبح أكثر تنوعًا ، حيث يؤكد الغالبية العظمى من البيانات عبر الإنترنت أن 1 + 1 = 2.
الآن، ماذا لو كان علينا استخدام LLMs محليًا ونرغب في تجنب مثل هذه المشاكل؟
إحدى الحلول البسيطة هي استخدام اثنين من نصوص اللغة الطبيعية الطويلة الذاكرة في نفس الوقت، مما يتطلب منهم التحقق المتبادل من إجابات بعضهم البعض لتقليل احتمالية الأخطاء. إذا لم يكن هذا كافيا، يمكن أن يكون النهج الآخر تضمين مشاركة مستخدمين اثنين في عملية واحدة - أحدهما يطرح الأسئلة والآخر يحسنها - لجعل اللغة أكثر دقة ومنطقية.
بالطبع، فإن الاتصال بالإنترنت لا يقضي تمامًا على المشاكل. على سبيل المثال، إذا استخرجت نظام اللغة الطبيعية الإجابات من مصادر غير موثوقة، فإن الحالة قد تتدهور. ومع ذلك، يقلل تجنب مثل هذه البيانات من كمية المعلومات المتاحة. ويمكن تقسيم البيانات القائمة، وإعادة تجميعها، أو حتى استخدامها لإنشاء بيانات جديدة بناءً على مجموعات بيانات أقدم لجعل الردود أكثر موثوقية. هذا النهج هو أساسًا مفهوم RAG (استرجاع المولد) في فهم اللغة الطبيعية.
يحتاج البشر والآلات إلى فهم بعضهم البعض. عندما تتعاون وتتفاعل العديد من LLMs ، فإننا نستفيد بشكل أساسي من النموذج التشغيلي لوكلاء الذكاء الاصطناعي. هذه بمثابة وكلاء بشريين ، والوصول إلى موارد أخرى ، بما في ذلك النماذج الكبيرة وغيرها من الوكلاء.
يؤدي هذا إلى الارتباط بين LLMs ووكلاء الذكاء الاصطناعي:
تعد LLMs تجميعات من المعرفة التي يتفاعل البشر معها عبر واجهات الدردشة. ومع ذلك ، في الواقع ، يمكن ضغط سير العمل المحدد إلى برامج أصغر أو روبوتات أو مجموعات من التعليمات. يتم تعريف هذه باسم الوكلاء.
يبقى وكلاء الذكاء الاصطناعي جزءًا من الأدوات اللغوية القانونية (LLMs) ولكن يجب ألا يتم تساويها معها. إن السمة المميزة لوكلاء الذكاء الاصطناعي تكمن في التركيز على التعاون مع البرامج الخارجية وأدوات اللغة القانونية والوكلاء الأخرين. ولهذا السبب ، يلخص الناس في كثير من الأحيان وكلاء الذكاء الاصطناعي على أنها LLM + API.
لتوضيح ذلك في سير العمل LLM ، دعنا نأخذ مثالًا على استدعاء واجهة برمجة التطبيقات من خلال وكيل AI:
هل تتذكر تطور تفاعل الإنسان مع الحاسوب؟ متصفحات الويب، واجهات برمجة التطبيقات، وعناصر أخرى من الويب 1.0 والويب 2.0 لا تزال موجودة، ولكن لم يعد المستخدمون بحاجة للتفاعل معها مباشرة. بدلاً من ذلك، يمكنهم ببساطة التفاعل مع وكلاء الذكاء الاصطناعي. يمكن إجراء مكالمات واجهات برمجة التطبيقات والعمليات ذات الصلة بشكل محادثة. يمكن لهذه الخدمات تضمين أي نوع من البيانات، سواء كانت محلية أو عبر الإنترنت، أو من تطبيقات خارجية، طالما أن الواجهات مفتوحة والمستخدمون لديهم الصلاحيات اللازمة للوصول إليها.
سير عمل وكيل الذكاء الاصطناعي الكامل، كما هو موضح أعلاه، يعامل LLM إما كمكون منفصل من وكيل الذكاء الاصطناعي أو كعملية فرعية في سير عمل واحد. بغض النظر عما إذا كانت قسمة العملية مختلفة، فإن الهدف دائمًا هو خدمة احتياجات المستخدمين. من وجهة نظر التفاعل بين الإنسان والكمبيوتر، يمكن أن يشعر المستخدمون حتى بأنهم يتحدثون مع أنفسهم. فقط تحتاج إلى التعبير بشكل كامل عن أفكارك، وسيقوم وكيل الذكاء الاصطناعي / LLM / وكيل الذكاء الاصطناعي بتخمين احتياجاتك مرارًا وتكرارًا. من خلال دمج آليات التغذية الراجعة وضمان أن يتذكر LLM السياق الحالي، يتجنب وكيل الذكاء الاصطناعي فقدان مسار مهامه.
في الختام، يعتبر وكلاء الذكاء الاصطناعي إبداعات أكثر تخصيصا وإنسانية، مما يفصلها عن السكربتات التقليدية وأدوات الأتمتة. إنهم يتصرفون مثل المساعدين الشخصيين، مراعين احتياجات المستخدم الفعلية. ومع ذلك، من المهم ملاحظة أن هذا التخصيص ما زال يعتمد على الاستدلال الاحتمالي. وكيل الذكاء الاصطناعي المستوى L3 لا يمتلك فهمًا وقدرات التعبير على مستوى الإنسان، مما يجعل اندماجه مع واجهات برمجة التطبيقات الخارجية خطيرًا بشكل جوهري.
القدرة على تحقيق الربح من إطارات الذكاء الاصطناعي هي واحدة من الأسباب الرئيسية التي تجعلني مهتمًا بالعملات الرقمية. في تراكيب التكنولوجيا التقليدية للذكاء الاصطناعي ، لا تعتبر الأطر ذات أهمية خاصة ، على الأقل ليس بالمقارنة مع البيانات وقوة الحوسبة. نادراً ما يبدأ تحقيق الربح من المنتجات الذكاء الاصطناعي بالإطار ، حيث أن معظم خوارزميات الذكاء الاصطناعي وإطارات النماذج هي متاحة كشفت. ما يبقى حصريًا هو العناصر الحساسة مثل البيانات.
في الأساس، إطارات الذكاء الاصطناعي أو النماذج هي حاويات ومجموعات من الخوارزميات، تمامًا مثل وعاء لطهي البط. ومع ذلك، فإن جودة البط وإتقان عملية الطهي هما ما يحددان حقًا النكهة. في النظرية، ينبغي أن يكون المنتج المعروض للبيع هو البط، ولكن يبدو أن زبائن الويب3 يفضلون شراء الوعاء مع التخلص من البط.
السبب في ذلك ليس معقدًا. يقوم معظم منتجات Web3 AI على إطارات وخوارزميات ومنتجات AI موجودة مسبقًا ، مخصصة لأغراضهم. في الواقع ، لا تختلف المبادئ التقنية وراء إطارات AI المختلفة في المجال الرقمي بشكل كبير. نظرًا لعدم تفرد التكنولوجيا نفسها ، يتحول الاهتمام إلى التمييز بين العلامات التجارية وسيناريوهات التطبيق والتمييزات السطحية الأخرى. ونتيجة لذلك ، حتى الإجراءات البسيطة على إطار الذكاء الاصطناعي تصبح أساسًا لدعم العديد من الرموز المميزة المختلفة ، مما يؤدي إلى فقاعة إطار العمل في النظم البيئية لوكلاء AI الرقمية.
نظرًا لعدم الحاجة إلى الاستثمار بشكل كبير في بيانات التدريب أو الخوارزميات، يصبح تمييز الأطر بالاسم أمرًا حاسمًا بشكل خاص. حتى الأطر الميسورة مثل DeepSeek V3 تتطلب تكاليف كبيرة من حيث طاقة وحدة معالجة الرسومات والكهرباء والجهد.
في الواقع، هذا يتماشى مع اتجاه Web3 الحديث: منصات إصدار الرموز غالبًا ما تكون أكثر قيمة من الرموز أنفسها. تمثل مشاريع مثل Pump.Fun و Hyperliquid هذا بشكل جيد. في الأصل، كان من المفترض أن تمثل الوكالات التطبيقات والأصول، ولكن الأطر الصادرة للوكلاء أصبحت الآن أهم السلع.
هذا يعكس شكلاً من أشكال ربط القيمة. نظرًا لعدم وجود تفاوت بين الوكلاء ، تصبح الأطر الخاصة بإصدار الوكلاء أكثر استقرارًا وتخلق تأثيرًا لامتصاص القيمة لإصدار الأصول. يعتبر هذا الإصدار 1.0 من التكامل بين العملات الرقمية ووكلاء الذكاء الاصطناعي.
النسخة 2.0 الآن تظهر، كما يُبيّنه اندماج العملات الرقمية ووكلاء الذكاء الاصطناعي. بينما قد يكون مفهوم DeFAI قد أثير بواسطة الضجة السوقية، إلا أن نظرة أعمق على الاتجاهات التالية تشير إلى خلاف ذلك:
Dentro de este telón de fondo de transformación DeFi, la IA está remodelando la lógica fundamental de DeFi. Anteriormente, la lógica central de DeFi era verificar la viabilidad de contratos inteligentes. Ahora, los Agentes de IA están alterando la lógica de fabricación de DeFi. Ya no es necesario entender DeFi para crear productos DeFi. Esto representa un paso más allá de la abstracción de cadenas, proporcionando un empoderamiento fundamental más profundo.
العصر الذي يمكن للجميع فيه أن يكون مبرمجًا على الأفق. يمكن توظيف الحسابات المعقدة للعملاء الموجهين بواسطة واجهات برمجة التطبيقات وراء وكلاء الذكاء الاصطناعي، مما يسمح للأفراد بالتركيز فقط على أفكارهم. يمكن تحويل اللغة الطبيعية بكفاءة إلى منطق البرمجة.
هذه المقالة لا تذكر أي رموز أو أطر عمل Crypto AI Agent، حيث أن Cookie.Fun قامت بالفعل بعمل ممتاز - منصة لتجميع معلومات AI Agent واكتشاف الرموز، تليها أطر عمل AI Agent، وأخيرًا ظهور واختفاء مؤقت لرموز Agent. مواصلة سرد مثل هذه المعلومات هنا لن تكون ذات قيمة.
ومع ذلك، من خلال الملاحظات خلال هذه الفترة، لا يزال السوق يفتقر إلى مناقشة معنوية حول ما تشير عملاء Crypto AI في نهاية المطاف إليه. لا يمكننا الاستمرار في التركيز على المشيرات؛ الجوهر يكمن في التغيرات التي تحدث على مستوى الذاكرة.
من الجميل جداً أن القدرة المتطورة باستمرار على تحويل مختلف الأصول إلى أشكال مرمزة هي التي تجعل مجال العملات الرقمية مثيرة للإعجاب جداً.
عمل فني لا يتم إكماله أبدًا، فقط يتم التخلي عنه.
الجميع يتحدث عن وكلاء الذكاء الاصطناعي، ولكن ما يقصدونه ليس نفس الشيء، مما يؤدي إلى فهم مختلف لوكلاء الذكاء الاصطناعي من وجهة نظرنا وجهة نظر الجمهور وجهة نظر ممارسي الذكاء الاصطناعي.
منذ وقت طويل، كتبت أن مجال العملات الرقمية هو وهم الذكاء الاصطناعيمنذ ذلك الحين، بقي اختلاط Crypto و AI علاقة حب من جانب واحد. نادراً ما يذكر الممارسون في مجال AI Web3 أو blockchain، في حين أن عشاق Crypto مولعون بشدة بـ AI. بعد شهادتهم على الظاهرة التي يمكن فيها تحويل إطارات AI Agent إلى عملات مميزة، من غير المؤكد ما إذا كان هذا يمكن أن يجلب الممارسين في مجال AI إلى عالمنا.
الذكاء الاصطناعي هو وكيل مجال العملات الرقمية. هذا هو أفضل تعليق من منظور العملات الرقمية لعرض اندفاع الذكاء الاصطناعي الحالي. الحماس المتصل بالعملات الرقمية للذكاء الاصطناعي مختلف عن الصناعات الأخرى. نحن نأمل بشكل خاص في دمج إصدار وتشغيل الأصول المالية معه.
يحتوي الوكيل الذكي على الأقل ثلاثة مصادر في جوهره. تعتبر AGI (الذكاء العام الاصطناعي) التابعة لشركة OpenAI هذه خطوة مهمة، حيث تحول هذا المصطلح إلى كلمة حديثة شائعة خارج الدوائر التقنية. ومع ذلك، في جوهره، ليس الوكيل مفهومًا جديدًا. حتى مع تمكين الذكاء الاصطناعي، من الصعب القول إنها اتجاه تكنولوجي ثوري.
المصدر الأول هو وكيل الذكاء الاصطناعي كما هو معروض في OpenAI. يمكن اعتبار وكيل الذكاء الاصطناعي مثل المستوى L3 في القيادة الذاتية بوصفه يمتلك بعض القدرات المتقدمة للمساعدة ولكنه لا يستطيع بعد الآن استبدال الإنسان بشكل كامل.
تعليق الصورة: مرحلة AGI من تخطيط OpenAI
مصدر الصورة: https://www.bloomberg.com/
المصدر الثاني هو ، كما يوحي الاسم ، وكيل الذكاء الاصطناعي ، وهو وكيل مدعوم من الذكاء الاصطناعي. مفهوم آليات الوكالة والتفويض ليس جديدا في مجال الحوسبة. ومع ذلك ، في ظل رؤية OpenAI ، سيصبح الوكيل مرحلة L3 بعد نماذج المحادثة (مثل ChatGPT) ونماذج التفكير (مثل برامج الروبوت المختلفة). الميزة الرئيسية لهذه المرحلة هي القدرة على "أداء سلوكيات معينة بشكل مستقل" ، أو كما يعرفها مؤسس LangChain هاريسون تشيس: "وكيل الذكاء الاصطناعي هو نظام يستخدم LLM (نموذج اللغة الكبيرة) لاتخاذ قرارات تدفق التحكم في البرنامج." \
هنا حيث يصبح الأمر مثيرًا للإهتمام. قبل ظهور LLMs، كان الوكيل ينفذ بشكل أساسي عمليات التشغيل التلقائية التي يضعها البشر. على سبيل المثال، عند تصميم أداة جلب البيانات، يقوم المبرمجون بتحديد User-Agent لمحاكاة تفاصيل مثل إصدار المتصفح ونظام التشغيل المستخدم من قبل المستخدمين الحقيقيين. إذا استخدم وكيل ذكاء اصطناعي لمحاكاة سلوك الإنسان بشكل أكثر دقة، فقد يؤدي ذلك إلى إنشاء إطار عمل لجلب البيانات يعتمد على وكيل ذكاء اصطناعي، مما يجعل الأداة "تشبه البشر أكثر".
في مثل هذه التحولات، يجب أن تدمج مقدمة وكلاء الذكاء الاصطناعي مع السيناريوهات القائمة، حيث نادراً ما توجد مجالات جديدة تمامًا. حتى قدرات إكمال الشفرة وإنشاء الشفرة في أدوات مثل Curosr و Github Copilot ليست سوى تحسينات وظيفية ضمن إطار بروتوكول خادم اللغة (LSP)، مع العديد من الأمثلة على هذا التطور:
للتوضيح، في تفاعل الإنسان والحاسوب، جمع بين واجهة المستخدم الرسومية والمتصفحات في ويب 1.0 حقق حقاً السماح للجمهور باستخدام الحواسيب دون حواجز، ممثلة بالجمع بين نظام التشغيل ويندوز ومتصفح إنترنت إكسبلورر. أصبحت واجهات برمجة التطبيقات (APIs) المعيار الرئيسي للتحويل والتجريد البياناتي وراء الإنترنت، وخلال عصر ويب 2.0، ظهرت متصفحات مثل كروم، مع تحول إلى الهواتف المحمولة يغير عادات استخدام الإنترنت للناس. تغطي التطبيقات الفائقة مثل وي شات والمنصات الفائقة كل جانب من جوانب حياة الناس الآن.
المصدر الثالث هو مفهوم 'النية' في مجال العملات الرقمية، الذي أدى إلى زيادة الاهتمام بوجود وكلاء الذكاء الاصطناعي. ومع ذلك، يجب ملاحظة أن هذا لا ينطبق إلا داخل مجال العملات الرقمية. من البرامج النصية لبيتكوين ذات الوظائف المحدودة إلى عقود إثريوم الذكية، فقد تم استخدام مفهوم الوكيل نفسه على نطاق واسع. ومن ثم، فإن الظهور اللاحق لجسور السلسلة المتقاطعة، والتجريدات السلسلة، وحسابات EOA (Externally Owned Accounts) إلى محافظ AA (Account Abstraction) هي تمديدات طبيعية لهذا التفكير. ولذلك، عندما يقوم وكلاء الذكاء الاصطناعي بـ 'غزو' المجال العملات الرقمية، فإنه ليس من المستغرب أن يؤديوا بشكل طبيعي إلى سيناريوهات DeFi.
هنا ينشأ الالتباس حول مفهوم عميل الذكاء الاصطناعي. في سياق Crypto ، ما نحاول بالفعل تحقيقه هو عميل "إدارة مالية آلية ، إنشاء ميمات آليًا". ومع ذلك ، بموجب تعريف OpenAI ، سيتطلب سيناريو خطير مثل هذا L4 أو L5 لتنفيذه حقًا. وفي الوقت نفسه ، يقوم الجمهور بتجربة إنشاء الرمز التلقائي أو المساعدة في الكتابة والملخصات المدعومة بالذكاء الاصطناعي ، والتي لا تتطابق مع المستوى الذي نسعى إليه.
عندما نفهم ما نريد حقًا ، يمكننا التركيز على المنطق التنظيمي لوكلاء الذكاء الاصطناعي. ستتبع التفاصيل التقنية ، حيث يتعلق مفهوم وكيل الذكاء الاصطناعي في النهاية بإزالة الحواجز عن تبني التكنولوجيا بمقياس كبير ، تمامًا مثل كيف غير المتصفحات صناعة أجهزة الكمبيوتر الشخصية. سيكون تركيزنا على نقطتين: فحص وكلاء الذكاء الاصطناعي من منظور التفاعل بين الإنسان والكمبيوتر ، وفهم الاختلافات والارتباطات بين وكلاء الذكاء الاصطناعي و LLMs ، والتي ستؤدي بنا إلى الجزء الثالث: ما الذي ستتركه في النهاية مزيج من Crypto ووكلاء الذكاء الاصطناعي.
قبل نماذج التفاعل بين الإنسان والحاسوب للمحادثة مثل ChatGPT ، كانت الأشكال الأساسية للتفاعل بين الإنسان والحاسوب هي واجهة المستخدم الرسومية (واجهة المستخدم الرسومية) و CLI (واجهة سطر الأوامر). تطورت عقلية واجهة المستخدم الرسومية إلى أشكال محددة مختلفة مثل المتصفحات والتطبيقات ، بينما شهد الجمع بين CLI و Shell تغييرا طفيفا.
ولكن هذا مجرد "الواجهة الأمامية" للتفاعل بين الإنسان والكمبيوتر. مع تطور الإنترنت، زيادة حجم البيانات وتنوعها أدى إلى المزيد من التفاعلات "الخلفية" بين البيانات والتطبيقات. تعتمد هاتان الجوانبان على بعضهما البعض - حتى الإجراءات البسيطة لتصفح الويب تتطلب فعلياً التعاون بينهما.
إذا ما اعتُبِرَ تفاعل الإنسان مع المتصفحات والتطبيقات نقطة الدخول للمستخدم، فإن الروابط والانتقالات بين واجهات برمجة التطبيقات تدعم العمل الفعلي للإنترنت. وهذا، في الواقع، جزء من الوكيل أيضًا. لا يحتاج المستخدمون العاديون إلى فهم مصطلحات مثل سطر الأوامر وواجهات برمجة التطبيقات لتحقيق أهدافهم.
والأمر نفسه صحيح بالنسبة للـ LLMs. الآن، يمكن للمستخدمين الذهاب أكثر من ذلك - ليس هناك حاجة للبحث بعد الآن. يمكن وصف العملية بالكامل في الخطوات التالية:
يمكن العثور على أن أكبر تحدٍ في هذه العملية هو Google، لأن المستخدمين لا يحتاجون إلى فتح محرك البحث، ولكن نوافذ الحوار المشابهة لـ GPT متنوعة، ومدخلات المرور تتغير بصمت. ولهذا السبب يعتقد بعض الناس أن هذا الـ LLM يحدث ثورة في حياة محركات البحث.
إذن، ما هو دور وكيل الذكاء الاصطناعي في هذه العملية؟
باختصار، الوكيل الذكي هو تمديد متخصص لـ LLM.
الـ LLMs الحالية ليست AGI (الذكاء الاصطناعي العام) وبعيدة عن منظم OpenAI المقترح. إن قدراتهم محدودة بشكل كبير. على سبيل المثال، فإن LLMs عرضة للهلوسة إذا تم تغذية الكثير من مدخلات المستخدم عليها. ويعود السبب الرئيسي لذلك إلى آلية التدريب. على سبيل المثال، إذا قمت بإخبار GPT مرارًا وتكرارًا بأن 1+1=3، فهناك احتمالية أن تجيب 4 عندما يتم سؤالها عن 1+1+1=؟.
يحدث هذا لأن تعليقات GPT تعتمد بالكامل على إدخال المستخدم. إذا لم يكن النموذج متصلاً بالإنترنت ، فمن الممكن أن يتم تعديل عمله بواسطة إدخالاتك ، مما يؤدي إلى نموذج يعرف فقط أن 1 + 1 = 3. ومع ذلك ، إذا سمح للنموذج بالاتصال بالإنترنت ، فإن آلية التعليقات الخاصة به تصبح أكثر تنوعًا ، حيث يؤكد الغالبية العظمى من البيانات عبر الإنترنت أن 1 + 1 = 2.
الآن، ماذا لو كان علينا استخدام LLMs محليًا ونرغب في تجنب مثل هذه المشاكل؟
إحدى الحلول البسيطة هي استخدام اثنين من نصوص اللغة الطبيعية الطويلة الذاكرة في نفس الوقت، مما يتطلب منهم التحقق المتبادل من إجابات بعضهم البعض لتقليل احتمالية الأخطاء. إذا لم يكن هذا كافيا، يمكن أن يكون النهج الآخر تضمين مشاركة مستخدمين اثنين في عملية واحدة - أحدهما يطرح الأسئلة والآخر يحسنها - لجعل اللغة أكثر دقة ومنطقية.
بالطبع، فإن الاتصال بالإنترنت لا يقضي تمامًا على المشاكل. على سبيل المثال، إذا استخرجت نظام اللغة الطبيعية الإجابات من مصادر غير موثوقة، فإن الحالة قد تتدهور. ومع ذلك، يقلل تجنب مثل هذه البيانات من كمية المعلومات المتاحة. ويمكن تقسيم البيانات القائمة، وإعادة تجميعها، أو حتى استخدامها لإنشاء بيانات جديدة بناءً على مجموعات بيانات أقدم لجعل الردود أكثر موثوقية. هذا النهج هو أساسًا مفهوم RAG (استرجاع المولد) في فهم اللغة الطبيعية.
يحتاج البشر والآلات إلى فهم بعضهم البعض. عندما تتعاون وتتفاعل العديد من LLMs ، فإننا نستفيد بشكل أساسي من النموذج التشغيلي لوكلاء الذكاء الاصطناعي. هذه بمثابة وكلاء بشريين ، والوصول إلى موارد أخرى ، بما في ذلك النماذج الكبيرة وغيرها من الوكلاء.
يؤدي هذا إلى الارتباط بين LLMs ووكلاء الذكاء الاصطناعي:
تعد LLMs تجميعات من المعرفة التي يتفاعل البشر معها عبر واجهات الدردشة. ومع ذلك ، في الواقع ، يمكن ضغط سير العمل المحدد إلى برامج أصغر أو روبوتات أو مجموعات من التعليمات. يتم تعريف هذه باسم الوكلاء.
يبقى وكلاء الذكاء الاصطناعي جزءًا من الأدوات اللغوية القانونية (LLMs) ولكن يجب ألا يتم تساويها معها. إن السمة المميزة لوكلاء الذكاء الاصطناعي تكمن في التركيز على التعاون مع البرامج الخارجية وأدوات اللغة القانونية والوكلاء الأخرين. ولهذا السبب ، يلخص الناس في كثير من الأحيان وكلاء الذكاء الاصطناعي على أنها LLM + API.
لتوضيح ذلك في سير العمل LLM ، دعنا نأخذ مثالًا على استدعاء واجهة برمجة التطبيقات من خلال وكيل AI:
هل تتذكر تطور تفاعل الإنسان مع الحاسوب؟ متصفحات الويب، واجهات برمجة التطبيقات، وعناصر أخرى من الويب 1.0 والويب 2.0 لا تزال موجودة، ولكن لم يعد المستخدمون بحاجة للتفاعل معها مباشرة. بدلاً من ذلك، يمكنهم ببساطة التفاعل مع وكلاء الذكاء الاصطناعي. يمكن إجراء مكالمات واجهات برمجة التطبيقات والعمليات ذات الصلة بشكل محادثة. يمكن لهذه الخدمات تضمين أي نوع من البيانات، سواء كانت محلية أو عبر الإنترنت، أو من تطبيقات خارجية، طالما أن الواجهات مفتوحة والمستخدمون لديهم الصلاحيات اللازمة للوصول إليها.
سير عمل وكيل الذكاء الاصطناعي الكامل، كما هو موضح أعلاه، يعامل LLM إما كمكون منفصل من وكيل الذكاء الاصطناعي أو كعملية فرعية في سير عمل واحد. بغض النظر عما إذا كانت قسمة العملية مختلفة، فإن الهدف دائمًا هو خدمة احتياجات المستخدمين. من وجهة نظر التفاعل بين الإنسان والكمبيوتر، يمكن أن يشعر المستخدمون حتى بأنهم يتحدثون مع أنفسهم. فقط تحتاج إلى التعبير بشكل كامل عن أفكارك، وسيقوم وكيل الذكاء الاصطناعي / LLM / وكيل الذكاء الاصطناعي بتخمين احتياجاتك مرارًا وتكرارًا. من خلال دمج آليات التغذية الراجعة وضمان أن يتذكر LLM السياق الحالي، يتجنب وكيل الذكاء الاصطناعي فقدان مسار مهامه.
في الختام، يعتبر وكلاء الذكاء الاصطناعي إبداعات أكثر تخصيصا وإنسانية، مما يفصلها عن السكربتات التقليدية وأدوات الأتمتة. إنهم يتصرفون مثل المساعدين الشخصيين، مراعين احتياجات المستخدم الفعلية. ومع ذلك، من المهم ملاحظة أن هذا التخصيص ما زال يعتمد على الاستدلال الاحتمالي. وكيل الذكاء الاصطناعي المستوى L3 لا يمتلك فهمًا وقدرات التعبير على مستوى الإنسان، مما يجعل اندماجه مع واجهات برمجة التطبيقات الخارجية خطيرًا بشكل جوهري.
القدرة على تحقيق الربح من إطارات الذكاء الاصطناعي هي واحدة من الأسباب الرئيسية التي تجعلني مهتمًا بالعملات الرقمية. في تراكيب التكنولوجيا التقليدية للذكاء الاصطناعي ، لا تعتبر الأطر ذات أهمية خاصة ، على الأقل ليس بالمقارنة مع البيانات وقوة الحوسبة. نادراً ما يبدأ تحقيق الربح من المنتجات الذكاء الاصطناعي بالإطار ، حيث أن معظم خوارزميات الذكاء الاصطناعي وإطارات النماذج هي متاحة كشفت. ما يبقى حصريًا هو العناصر الحساسة مثل البيانات.
في الأساس، إطارات الذكاء الاصطناعي أو النماذج هي حاويات ومجموعات من الخوارزميات، تمامًا مثل وعاء لطهي البط. ومع ذلك، فإن جودة البط وإتقان عملية الطهي هما ما يحددان حقًا النكهة. في النظرية، ينبغي أن يكون المنتج المعروض للبيع هو البط، ولكن يبدو أن زبائن الويب3 يفضلون شراء الوعاء مع التخلص من البط.
السبب في ذلك ليس معقدًا. يقوم معظم منتجات Web3 AI على إطارات وخوارزميات ومنتجات AI موجودة مسبقًا ، مخصصة لأغراضهم. في الواقع ، لا تختلف المبادئ التقنية وراء إطارات AI المختلفة في المجال الرقمي بشكل كبير. نظرًا لعدم تفرد التكنولوجيا نفسها ، يتحول الاهتمام إلى التمييز بين العلامات التجارية وسيناريوهات التطبيق والتمييزات السطحية الأخرى. ونتيجة لذلك ، حتى الإجراءات البسيطة على إطار الذكاء الاصطناعي تصبح أساسًا لدعم العديد من الرموز المميزة المختلفة ، مما يؤدي إلى فقاعة إطار العمل في النظم البيئية لوكلاء AI الرقمية.
نظرًا لعدم الحاجة إلى الاستثمار بشكل كبير في بيانات التدريب أو الخوارزميات، يصبح تمييز الأطر بالاسم أمرًا حاسمًا بشكل خاص. حتى الأطر الميسورة مثل DeepSeek V3 تتطلب تكاليف كبيرة من حيث طاقة وحدة معالجة الرسومات والكهرباء والجهد.
في الواقع، هذا يتماشى مع اتجاه Web3 الحديث: منصات إصدار الرموز غالبًا ما تكون أكثر قيمة من الرموز أنفسها. تمثل مشاريع مثل Pump.Fun و Hyperliquid هذا بشكل جيد. في الأصل، كان من المفترض أن تمثل الوكالات التطبيقات والأصول، ولكن الأطر الصادرة للوكلاء أصبحت الآن أهم السلع.
هذا يعكس شكلاً من أشكال ربط القيمة. نظرًا لعدم وجود تفاوت بين الوكلاء ، تصبح الأطر الخاصة بإصدار الوكلاء أكثر استقرارًا وتخلق تأثيرًا لامتصاص القيمة لإصدار الأصول. يعتبر هذا الإصدار 1.0 من التكامل بين العملات الرقمية ووكلاء الذكاء الاصطناعي.
النسخة 2.0 الآن تظهر، كما يُبيّنه اندماج العملات الرقمية ووكلاء الذكاء الاصطناعي. بينما قد يكون مفهوم DeFAI قد أثير بواسطة الضجة السوقية، إلا أن نظرة أعمق على الاتجاهات التالية تشير إلى خلاف ذلك:
Dentro de este telón de fondo de transformación DeFi, la IA está remodelando la lógica fundamental de DeFi. Anteriormente, la lógica central de DeFi era verificar la viabilidad de contratos inteligentes. Ahora, los Agentes de IA están alterando la lógica de fabricación de DeFi. Ya no es necesario entender DeFi para crear productos DeFi. Esto representa un paso más allá de la abstracción de cadenas, proporcionando un empoderamiento fundamental más profundo.
العصر الذي يمكن للجميع فيه أن يكون مبرمجًا على الأفق. يمكن توظيف الحسابات المعقدة للعملاء الموجهين بواسطة واجهات برمجة التطبيقات وراء وكلاء الذكاء الاصطناعي، مما يسمح للأفراد بالتركيز فقط على أفكارهم. يمكن تحويل اللغة الطبيعية بكفاءة إلى منطق البرمجة.
هذه المقالة لا تذكر أي رموز أو أطر عمل Crypto AI Agent، حيث أن Cookie.Fun قامت بالفعل بعمل ممتاز - منصة لتجميع معلومات AI Agent واكتشاف الرموز، تليها أطر عمل AI Agent، وأخيرًا ظهور واختفاء مؤقت لرموز Agent. مواصلة سرد مثل هذه المعلومات هنا لن تكون ذات قيمة.
ومع ذلك، من خلال الملاحظات خلال هذه الفترة، لا يزال السوق يفتقر إلى مناقشة معنوية حول ما تشير عملاء Crypto AI في نهاية المطاف إليه. لا يمكننا الاستمرار في التركيز على المشيرات؛ الجوهر يكمن في التغيرات التي تحدث على مستوى الذاكرة.
من الجميل جداً أن القدرة المتطورة باستمرار على تحويل مختلف الأصول إلى أشكال مرمزة هي التي تجعل مجال العملات الرقمية مثيرة للإعجاب جداً.