Variant 投资合伙人:مفتوح المصدر AI 的困境与突破,为什么التشفير技术是最后一块拼图?

المؤلف: دانيال باراباندر

ترجمة: دينغتشاو تيك فلو

ملخص موجز

يتم تطوير الذكاء الاصطناعي الأساسي حاليًا بواسطة عدد قليل من شركات التكنولوجيا الرائدة، مما يتسبب في طبيعة مغلقة ونقص المنافسة.

على الرغم من أن تطوير البرمجيات مفتوحة المصدر هو حلاً محتملًا ، إلا أن الذكاء الاصطناعي الأساسي لا يمكن أن يعمل بنفس الطريقة كمشروع مفتوح المصدر التقليدي (مثل Linux) بسبب ما يواجهه من "مشكلة الموارد": يحتاج المساهمون في المصدر المفتوح للتضحية بالوقت وأيضًا تحمل تكاليف الحسابات والبيانات التي تتجاوز قدرات الأفراد.

تسعى التكنولوجيا الرقمية إلى حل هذه المشكلة من خلال تحفيز مقدمي الموارد للمشاركة في مشروعات الذكاء الاصطناعي مفتوحة المصدر الأساسية.

دمج التكنولوجيا المشفرة مع الذكاء الاصطناعي مفتوح المصدر يمكن أن يدعم تطوير نماذج أكبر ويعزز المزيد من الابتكار لإنشاء أنظمة ذكاء اصطناعي أكثر تقدما.

مقدمة

وفقًا لاستطلاع أجراه مركز بيو للأبحاث في عام 2024 ، يعتقد 64٪ من الأمريكيين أن وسائل التواصل الاجتماعي لها تأثير سلبي على البلاد ، ويقول 78٪ من الناس إن شركات التواصل الاجتماعي لديها قوة وتأثير كبير في السياسة ، ويعتقد 83٪ من الناس أن هذه المنصات من المحتمل جدًا أن تقوم برقابة متعمدة على وجهات النظر السياسية التي لا يتفقون معها. عدم الرضا عن وسائل التواصل الاجتماعي أصبح تقريبًا اتفاقًا نادرًا في المجتمع الأمريكي.

إذا نظرنا إلى الوراء في تطور وسائل الإعلام الاجتماعية على مدى السنوات ال 20 الماضية ، يبدو أن هذا الوضع مقدر مسبقا. القصة ليست معقدة: لقد جذبت حفنة من شركات التكنولوجيا الكبرى انتباه المستخدمين ، والأهم من ذلك ، بيانات المستخدم. على الرغم من الآمال الأولية في البيانات المفتوحة ، غيرت الشركات استراتيجيتها بسرعة ، باستخدام البيانات لبناء تأثيرات شبكة غير قابلة للكسر وإغلاق الوصول الخارجي. والنتيجة هي الوضع اليوم: أقل من 10 شركات تكنولوجيا كبرى تهيمن على صناعة وسائل التواصل الاجتماعي ، مما يخلق مشهدا "احتكار القلة". نظرا لأن الوضع الراهن موات للغاية بالنسبة لهم ، فإن هذه الشركات ليس لديها حافز كبير للتغيير. هذا النموذج مغلق ويفتقر إلى المنافسة.

يبدو أن مسار تطور تقنية الذكاء الاصطناعي يعيد نفسه الآن، لكن التأثير هذه المرة أعمق. قلة من شركات التكنولوجيا التي تسيطر على موارد الأجهزة المعالجة الرسومية والبيانات قامت ببناء نماذج ذكاء اصطناعي أساسية وأغلقت الوصول إليها من الخارج. بالنسبة للمنافسين الجدد الذين ليس لديهم مليارات الدولارات في التمويل، فإن تطوير نموذج منافس يكاد يكون مستحيلاً. حيث أن تكلفة تدريب نموذج أساسي واحد تتطلب مليارات الدولارات فقط، وشركات وسائل التواصل الاجتماعي التي استفادت من موجة التكنولوجيا السابقة تستغل سيطرتها على البيانات الخاصة بالمستخدمين لتطوير نماذج يصعب على المنافسين الوصول إليها. نحن نعيد السير على نفس خطأ وسائل التواصل الاجتماعي، ونتجه نحو عالم ذكاء اصطناعي مغلق وخال من التنافس. إذا استمر هذا الاتجاه، فسوف تحتكر قلة من شركات التكنولوجيا الوصول غير المحدود إلى المعلومات والفرص.

الذكاء الاصطناعي مفتوح المصدر و"مشكلة الموارد"

إذا لم نكن نرغب في رؤية عالم الذكاء الاصطناعي المغلق، فما هي خياراتنا؟ الإجابة واضحة من الواضح أن نطور النماذج الأساسية كمشروعات برمجيات مفتوحة المصدر. من الناحية التاريخية، لقد نجحت المشاريع مفتوحة المصدر بناء البرمجيات الأساسية التي نعتمد عليها يوميًا. على سبيل المثال، نجاح لينكس يثبت أنه حتى البرمجيات الأساسية مثل أنظمة التشغيل يمكن تطويرها بطريقة مفتوحة المصدر. إذًا، لماذا لا يمكن لـ LLMs (النماذج اللغوية الكبيرة)؟

ومع ذلك، تواجه النماذج الأساسية للذكاء الاصطناعي قيودًا خاصة تجعلها مختلفة عن البرمجيات التقليدية، مما يضعف بشكل كبير قابليتها كمشروع مفتوح المصدر التقليدي. على وجه التحديد، تتطلب النماذج الأساسية للذكاء الاصطناعي موارد حسابية وبيانات هائلة، تتجاوز هذه الموارد بكثير قدرة الأفراد. بخلاف المشاريع المفتوحة المصدر التقليدية التي تعتمد فقط على تبرع الناس بوقتهم، يتطلب الذكاء الاصطناعي مفتوح المصدر أيضًا تبرع الناس بقدرات الحساب وموارد البيانات، وهذا ما يُعرف بـ "مشكلة الموارد".

على سبيل المثال، باستخدام نموذج LLaMa من Meta، يمكننا فهم مشكلة هذه الموارد بشكل أفضل. بدلاً من منافسيها مثل OpenAI و Google، لم تخفي Meta النموذج وراء واجهة برمجة تطبيقات مدفوعة، بل قدمت وزن LLaMa بشكل علني لاستخدام أي شخص مجانًا (مع بعض القيود). تتضمن هذه الأوزان المعرفة التي اكتسبها النموذج خلال عملية التدريب في Meta، وهي شرط ضروري لتشغيل النموذج. باستخدام هذه الأوزان، يمكن للمستخدمين ضبط النموذج بشكل دقيق، أو استخدام نتائج النموذج كإدخال لنموذج جديد.

في حين أن إصدار Meta من LLaMa يستحق التقدير ، إلا أنه لا يعتبر مشروعا برمجيا مفتوح المصدر حقيقيا. خلف الكواليس، تتحكم Meta في عملية التدريب، وتعتمد على موارد الحوسبة والبيانات والقرارات الخاصة بها، وتقرر من جانب واحد متى تجعل النموذج متاحا للجمهور. لا تدعو Meta الباحثين أو المطورين المستقلين للمشاركة في التعاون المجتمعي، حيث أن الموارد المطلوبة لتدريب النماذج أو إعادة تدريبها تتجاوز بكثير قدرات الفرد العادي. تتضمن هذه الموارد عشرات الآلاف من وحدات معالجة الرسومات عالية الأداء ، ومراكز البيانات لتخزين وحدات معالجة الرسومات هذه ، ومرافق التبريد المتطورة ، وتريليونات الرموز المميزة (وحدات البيانات النصية المطلوبة لتدريب النماذج) للتدريب. كما هو مذكور في تقرير مؤشر ستانفورد الذكاء الاصطناعي لعام 2024 ، "إن الارتفاع الحاد في تكاليف التدريب يستبعد الجامعات بشكل فعال ، التي كانت تقليديا مراكز قوة لأبحاث الذكاء الاصطناعي ، من تطوير نموذج تأسيسي من الدرجة الأولى." على سبيل المثال ، ذكر Sam Altman أنه يكلف ما يصل إلى 100 مليون دولار لتدريب GPT-4 ، وهذا لا يشمل حتى النفقات الرأسمالية للأجهزة. بالإضافة إلى ذلك، ارتفعت النفقات الرأسمالية لشركة Meta بمقدار 2.1 مليار دولار أمريكي في الربع الثاني من عام 2024 مقارنة بالفترة نفسها من عام 2023، خاصة للخوادم ومراكز البيانات والبنية التحتية للشبكة المتعلقة بتدريب نموذج الذكاء الاصطناعي. نتيجة لذلك ، في حين أن المساهمين في مجتمع LLaMa قد يكون لديهم القدرة التقنية على تحسين بنية النموذج ، إلا أنهم يفتقرون إلى الموارد اللازمة لتنفيذ هذه التحسينات.

في الختام ، على عكس مشاريع البرامج المفتوحة المعتادة ، فإن مشاريع الذكاء الاصطناعي المفتوحة المصدر ليست تتطلب فقط من المساهمين أن يستثمروا الوقت ، بل تتطلب أيضًا منهم تحمل تكاليف الحساب والبيانات الباهظة. إن الاعتماد فقط على النية الحسنة وروح التطوع لتشجيع مزودي الموارد بشكل كافي ليس واقعيًا. إنهم بحاجة إلى آليات تحفيز إضافية. كنموذج لغة BLOOM المفتوح المصدر الكبير ، يجمع هذا النموذج الذي يحتوي على 176 مليار معلمة جهود 1000 باحث متطوع من أكثر من 70 دولة وأكثر من 250 مؤسسة. على الرغم من أن نجاح BLOOM مثير للإعجاب (أنا أدعمه بقوة) ، إلا أنه استغرق عامًا لتنسيق التدريب مرة واحدة ، واعتمد على تمويل بقيمة 3 ملايين يورو من مؤسسة بحثية فرنسية (بدون تكاليف رأس المال للحواسيب العملاقة المستخدمة في تدريب النموذج). الاعتماد على جولة جديدة من التمويل لتنسيق وتطوير BLOOM هو عملية معقدة للغاية ولا يمكن مقارنتها بسرعة تطوير المختبرات التكنولوجية الكبيرة. منذ إصدار BLOOM قبل أكثر من عامين ، لم نسمع حتى الآن عن فريق التطوير يعمل على أي نموذج لاحق.

لجعل الذكاء الاصطناعي مفتوح المصدر ممكنًا ، نحتاج إلى إيجاد طريقة لتحفيز مزودي الموارد للمساهمة بقدراتهم الحسابية ومواردهم البياناتية ، بدلاً من تحميل هذه التكاليف على المساهمين في المشروع.

لماذا يمكن لتقنية التشفير حل "مشكلة الموارد" في الذكاء الاصطناعي المفتوح المصدر؟

انتقال تقنية التشفير الرئيسي هو نتيجة لآلية "الملكية"، مما يجعل من الممكن أن تكون مشاريع البرمجيات مفتوحة المصدر ذات تكلفة مرتفعة من حيث الموارد. فهي تحل مشكلة الموارد في الذكاء الاصطناعي المفتوح من خلال تحفيز الموردين المحتملين للموارد للمشاركة في الشبكة، بدلاً من أن يتحمل المساهمون في المشروع التكلفة المسبقة لهذه الموارد.

بيتكوين هو مثال جيد. كمشروع تشفير أولي ، فإن بيتكوين هو مشروع برمجي مفتوح بالكامل ، حيث تم توفير الشفرة المصدرية له من البداية. ومع ذلك ، ليس الشفرة المصدرية هي العنصر الرئيسي في بيتكوين. فقط تنزيل وتشغيل برنامج عقدة بيتكوين وإنشاء سلسلة كتل محلية ليس لها أي معنى فعلي. يتم تجسيد القيمة الحقيقية لهذا البرنامج فقط عندما يكون كمية حساب الكتلة التي تم التعدين عليها تتجاوز قدرة أي مساهم فردي: الحفاظ على سجل محاسب غير مركزي وغير مراقب. مثل الذكاء الاصطناعي المفتوح الأساسي ، فإن بيتكوين هو أيضًا مشروع مفتوح المصدر يتطلب موارد تتجاوز قدرات الأفراد. على الرغم من أن السبب وراء احتياج الطاقة الحسابية لكل منهما مختلف - يحتاج بيتكوين إلى طاقة حسابية لضمان عدم قابلية التلاعب بالشبكة ، بينما يحتاج الذكاء الاصطناعي الأساسي إلى طاقة حسابية لتحسين وتحديث النماذج - إلا أنهما مشتركان في الاعتماد على موارد تتجاوز قدرات الأفراد.

يكمن "سر" القدرة على تحفيز المشاركين في مشاريع البرمجيات مفتوحة المصدر لتقديم الموارد لأي شبكة تشفير، بما في ذلك بيتكوين، في توفير الملكية للشبكة من خلال الرموز (Token). وكما هو موضح في فكرة التأسيس التي كتبها جيسي لـ Variant في عام 2020، توفر الملكية حافزًا قويًا لمزودي الموارد للمساهمة بالموارد مقابل العوائد المحتملة في الشبكة. يشبه هذا الآلية كيفية حل الشركات الناشئة مشكلة نقص التمويل في المراحل الأولى من خلال "حصة العرق" (Sweat Equity) - من خلال دفع الموظفين في المراحل الأولى (مثل المؤسسين) بصورة رئيسية عبر حصة في الملكية للشركة، يمكن للشركات الناشئة جذب القوى العاملة التي لا يمكنها تحملها بشكل طبيعي. توسّعت التقنيات التشفيرية مفهوم "حصة العرق" من التركيز على المساهمين الزمنيين إلى مزودي الموارد. لذلك، يركز Variant على استثمار المشاريع التي تستخدم آلية الملكية لبناء تأثير الشبكة، مثل Uniswap و Morpho و World.

إذا كنا نرغب في أن يصبح الذكاء الاصطناعي مفتوح المصدر حقيقة، فإن آلية الملكية التي تم تحقيقها من خلال تقنيات التشفير هي الحل الرئيسي لمشكلة الموارد. يمكن لهذه الآلية أن تتيح للباحثين تقديم أفكار تصميم النماذج الخاصة بهم لمشاريع مفتوحة المصدر بحرية، لأن الموارد اللازمة لتحقيق هذه الأفكار ستكون مسؤولية مزودي الموارد، وسيحصل مزودو الموارد على جزء من الملكية في المشروع كمقابل لذلك، بدلاً من طلب من الباحثين تحمل التكاليف الباهظة لوحدهم. في مجال الذكاء الاصطناعي المفتوح المصدر، يمكن أن تكون الملكية بأشكال متنوعة، ولكن الشكل الأكثر إثارة للتوقع هو الملكية للنموذج نفسه، وهو أيضاً الحل الذي قدمته Pluralis.

يعرف النهج الذي اقترحته Pluralis باسم نماذج البروتوكول. في هذا النموذج، يمكن لموفر موارد الحوسبة المساهمة بقوة الحوسبة لتدريب نموذج محدد مفتوح المصدر وبالتالي الحصول على ملكية جزئية لإيرادات الاستدلال المستقبلية لهذا النموذج. نظرا لأن هذه الملكية مرتبطة بنموذج معين ، وتستند قيمتها إلى إيرادات الاستدلال الخاصة بالنموذج ، يتم تحفيز موفري موارد الحوسبة لاختيار النموذج الأمثل للتدريب دون تزوير بيانات التدريب (لأن توفير تدريب غير مجدي يقلل بشكل مباشر من القيمة المتوقعة لإيرادات الاستدلال المستقبلية). ومع ذلك ، فإن السؤال الرئيسي هو: كيف تضمن Pluralis أمان الملكية إذا كانت عملية التدريب تتطلب إرسال أوزان النموذج إلى مزود الحساب؟ تكمن الإجابة في استخدام نموذج التوازي لتوزيع شظايا النموذج على عمال مختلفين. من السمات المهمة للشبكات العصبية أنه حتى لو كان جزء صغير فقط من أوزان النموذج معروفا ، فلا يزال بإمكان المحسب المشاركة في التدريب ، مما يضمن عدم إمكانية استخراج المجموعة الكاملة من الأوزان. بالإضافة إلى ذلك ، نظرا لأنه يتم تدريب العديد من الطرز المختلفة في نفس الوقت على منصة Pluralis ، سيواجه المدرب عددا كبيرا من مجموعات الوزن المختلفة ، مما يجعل من الصعب للغاية إعادة بناء النموذج الكامل.

الفكرة الأساسية لنماذج البروتوكول هي أنه يمكن تدريب هذه النماذج واستخدامها، ولكنها لا يمكن استخلاصها بالكامل من البروتوكول (إلا إذا تم استخدام قدرة الحوسبة التي تتجاوز الموارد المطلوبة لتدريب النماذج من الصفر). يحل هذا الآلية مشكلة التنبيه المتكرر التي يطرحها النقاد المفتوحين للذكاء الاصطناعي، وهي أن المتنافسين المغلقين قد يقومون بسرقة جهود المشروعات مفتوحة المصدر.

لماذا التشفير + مفتوح المصدر = ذكاء اصطناعي أفضل

في بداية المقال، أشرت من خلال تحليل السيطرة التي تمارسها الشركات التكنولوجية الكبيرة على الذكاء الاصطناعي، إلى مشكلات الذكاء الاصطناعي المغلقة من الناحية الأخلاقية والتنظيمية. ولكن في عصر الشبكات المليء بالإحساس بالعجز، أشعر بقلق من أن مثل هذه النقطة قد تكون صعبة التأثير على معظم القراء. لذا، أرغب في تقديم سببين من خلال النتائج الفعلية، لشرح لماذا يمكن أن يجلب الذكاء الاصطناعي مفتوح المصدر الذي يدعمه تقنيات التشفير ذات الفعالية العالية، الذي يجلب فعلاً تطوراً أفضل للذكاء الاصطناعي.

أولاً، يمكن أن يتعاون التكنولوجيا اللامركزية مع الذكاء الاصطناعي مفتوح المصدر لتنسيق المزيد من الموارد، وبالتالي دفع تطوير نماذج الأساس للجيل التالي. أظهرت الأبحاث أن زيادة القدرة الحسابية وموارد البيانات تسهم في تحسين أداء النماذج، وهذا هو السبب في أن حجم النماذج الأساسية يستمر في التوسع. أظهرت عملة بيتكوين لنا الإمكانيات الكامنة للبرمجيات مفتوحة المصدر مدعومة بتقنيات التشفير في مجال القدرة الحسابية. أصبحت شبكة الحوسبة العملاقة هذه الشبكة الأكبر والأقوى في العالم، حيث تفوقت بكثير على موارد الحوسبة السحابية المملوكة للشركات التكنولوجية الكبيرة. تتميز التكنولوجيا اللامركزية بقدرتها على تحويل المنافسة المعزولة إلى منافسة تعاونية. من خلال تحفيز مقدمي الموارد لتقديم مساهماتهم في حل المشكلات المشتركة بدلاً من الصراع وتكرار الجهد بشكل فردي، تحقق الشبكة اللامركزية استخدامًا فعالًا للموارد. يمكن للذكاء الاصطناعي مفتوح المصدر المدعوم بتقنيات التشفير الاستفادة من موارد الحوسبة والبيانات العالمية لبناء نماذج تتجاوز بكثير نطاق الذكاء الاصطناعي المغلق. على سبيل المثال، قدمت شركة Hyperbolic الشركة النموذجية لهذا النمط. عرضوا الإمكانيات المحتملة لهذا النمط من خلال سوق مفتوح، يمكن لأي شخص استئجار وحدة معالجة الرسومات بتكلفة منخفضة للاستفادة الكاملة من موارد الحوسبة الموزعة.

ثم، سيعزز الجمع بين التقنيات التشفير والذكاء الاصطناعي مفتوح المصدر الابتكار بشكل متسارع. هذا يرجع إلى حل مشكلة الموارد، حيث يمكن لباحثي التعلم الآلي أن يعودوا إلى طبيعتهم الأصلية كما مبادرة مفتوحة للابتكار والتطور بمرور الوقت. قبل ظهور نموذج اللغة الأساسي (LLM)، كان باحثو التعلم الآلي عادةً ما يقومون بنشر نماذجهم ومخططات تصميمها القابلة للتكرار. تستخدم هذه النماذج عادةً مجموعات بيانات مفتوحة المصدر، وتتطلب موارد الحسابات نسبياً منخفضة، وبالتالي يمكن للباحثين تحسينها وابتكارها باستمرار. هذه العملية المفتوحة للتطوير هي التي أدت إلى العديد من الانفجارات في مجال نمذجة التسلسل، مثل الشبكات العصبية التكرارية (RNN) وشبكات LSTM القصيرة الأجل ذاكرة طويلة المدى وآليات الانتباه (Attention Mechanisms)، مما جعل من الممكن في النهاية تصميم نماذج Transformer. ومع ذلك، تغيرت هذه الطريقة المفتوحة للبحث بعد إطلاق GPT-3. أثبتت OpenAI من خلال نجاح GPT-3 وChatGPT، أنه يمكن تدريب نماذج اللغة الكبيرة ذات القدرة على فهم اللغة، طالما تم توفير موارد حسابية وبيانات كافية. هذا الاتجاه أدى إلى زيادة حادة في عتبة الموارد، مما أدى إلى استبعاد العالم الأكاديمي تدريجياً، وفي نفس الوقت، لم تعد الشركات التكنولوجية الكبيرة تكشف عن تصميمات نماذجها من أجل الحفاظ على التفوق التنافسي. هذا الوضع يقيد قدرتنا على دفع تقنيات الذكاء الاصطناعي إلى الأمام.

يمكن أن يغير الذكاء الاصطناعي المفتوح المبني على تقنية التشفير هذا الوضع. يمكنهم تكرار النماذج المتقدمة مرة أخرى لاكتشاف 'محول القادم'. هذا الجمع ليس فقط يمكنه حل مشكلة الموارد ، بل يمكنه أيضًا إعادة تنشيط الابتكار في مجال التعلم الآلي وفتح طرق أوسع لتطوير مستقبل الذكاء الاصطناعي.

شاهد النسخة الأصلية
المحتوى هو للمرجعية فقط، وليس دعوة أو عرضًا. لا يتم تقديم أي مشورة استثمارية أو ضريبية أو قانونية. للمزيد من الإفصاحات حول المخاطر، يُرجى الاطلاع على إخلاء المسؤولية.
  • أعجبني
  • تعليق
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت