تحدثنا سابقًا عن كيفية تكامل الذكاء الاصطناعي والويب3 مع بعضهما في مجالات رأسية مثل الشبكات الحسابية ومنصات الوسطاء وتطبيقات المستهلك. عند التركيز على مصادر البيانات كمجال رأسي، تقدم مشاريع الويب الناشئة إمكانيات جديدة للاكتساب والمشاركة واستخدام البيانات.
أصبحت البيانات هي السائق الرئيسي للابتكار واتخاذ القرارات في جميع الصناعات. توقع UBS أن حجم البيانات العالمية سيزداد بمقدار عشرة أضعاف من عام 2020 إلى عام 2030 ، ليصل إلى 660 زيتابايت. بحلول عام 2025 ، من المتوقع أن ينشئ كل فرد على مستوى العالم 463 إكسابايت (1 إكسابايت = 1 مليار غيغابايت) من البيانات يوميًا. سوق البيانات كخدمة (DaaS) يتوسع بسرعة. وفقًا لبحث Grand View ، بلغت قيمة سوق DaaS العالمية 14.36 مليار دولار في عام 2023 ومن المتوقع أن ينمو بمعدل نمو سنوي مركب (CAGR) قدره 28.1٪ ، ليصل إلى 76.8 مليار دولار بحلول عام 2030.
تعتمد تدريب نموذج الذكاء الاصطناعي بشكل كبير على مجموعات بيانات كبيرة لتحديد الأنماط وضبط المعلمات. بعد التدريب، يتعين أيضًا توافر مجموعات البيانات لاختبار أداء النماذج وقدرات التعميم. بالإضافة إلى ذلك، تتطلب وكلاء الذكاء الاصطناعي، كأشكال تطبيقية ذكية ناشئة، مصادر بيانات في الوقت الحقيقي وموثوقة لضمان اتخاذ القرارات الدقيقة وتنفيذ المهام بدقة.
(المصدر: Leewayhertz)
تزداد أيضًا تنوع وانتشار الطلب على تحليلات الأعمال ، حيث تعمل كأداة أساسية تدفع الابتكار في المؤسسات. على سبيل المثال ، تحتاج منصات التواصل الاجتماعي وشركات أبحاث السوق إلى بيانات موثوقة عن سلوك المستخدم لصياغة استراتيجيات وتحليل الاتجاهات ، ودمج بيانات متنوعة من منصات اجتماعية متعددة لبناء صورة أكثر شمولاً.
بالنسبة لنظام الويب 3، يتطلب الأمر أيضًا بيانات موثوقة وأصيلة على السلسلة الرقمية لدعم المنتجات المالية الجديدة. مع تحويل المزيد من الأصول الابتكارية إلى رموز، يتطلب وجود واجهات بيانات مرنة وموثوقة لدعم تطوير المنتجات وإدارة المخاطر، والسماح للعقود الذكية بالتنفيذ على أساس بيانات حية يمكن التحقق منها في الوقت الحقيقي.
بالإضافة إلى ذلك، تبرز حالات الاستخدام في البحث العلمي، والإنترنت of Things، وغيرها من المجالات الطلب المتزايد بشكل مذهل على البيانات المتنوعة والأصلية والمباشرة. قد تواجه الأنظمة التقليدية صعوبة في التعامل مع حجم البيانات المتزايد بسرعة والمطالب المتغيرة باستمرار.
تتضمن البيئة البيانية النموذجية جمع البيانات وتخزينها ومعالجتها وتحليلها وتطبيقها. تتميز النماذج المركزية بجمع البيانات وتخزينها المركزي، وإدارتها من قبل فريق الاتصالات الأساسي مع رقابة صارمة على الوصول. على سبيل المثال، تمتد بيئة بيانات Google عبر مصادر بيانات مختلفة مثل محركات البحث وGmail ونظام التشغيل Android. تقوم هذه المنصات بجمع بيانات المستخدمين، وتخزينها في مراكز بيانات منتشرة عالمياً، ومعالجتها باستخدام خوارزميات لدعم تطوير وتحسين مختلف المنتجات والخدمات.
في الأسواق المالية، تجمع LSEG (السابقة Refinitiv) البيانات الفورية والتاريخية من البورصات العالمية والبنوك والمؤسسات المالية الكبرى، مع استخدام شبكة Reuters News المملوكة لها لجمع أخبار ذات صلة بالسوق. يتم معالجة هذه المعلومات باستخدام خوارزميات ونماذج خاصة لتوليد منتجات تحليلية وتقييم المخاطر كخدمات قيمة مضافة.
(المصدر: kdnuggets.com)
بينما تكون هندسة البيانات التقليدية فعالة في الخدمات المهنية، إلا أن القيود التي تفرضها النماذج المركزية تصبح واضحة بشكل متزايد، لا سيما في تغطية مصادر البيانات الناشئة، والشفافية، وحماية خصوصية المستخدم. فيما يلي بعض القضايا الرئيسية:
على سبيل المثال، كشفت حدث GameStop لعام 2021 عن قيود مزودي البيانات المالية التقليدية في تحليل الرأي الاجتماعي على وسائل التواصل الاجتماعي. تأثير رأي المستثمرين على منصات مثل ريديت أثر بسرعة على اتجاهات السوق، ولكن أجهزة البيانات مثل بلومبرغ ورويترز فشلت في التقاط هذه الديناميات في الوقت المناسب، مما أدى إلى توقعات سوق متأخرة.
بالإضافة إلى هذه المسائل، تواجه مقدمو البيانات التقليدية تحديات تتعلق بكفاءة التكلفة والمرونة. على الرغم من أنهم يعملون على معالجة هذه المشكلات بنشاط، توفر تقنيات Web3 الناشئة وجهات نظر وإمكانيات جديدة للتعامل معها.
منذ إطلاق حلول التخزين اللامركزية مثل IPFS (نظام الملفات بين الكواكب) في عام 2014، توجهت سلسلة من المشاريع الناشئة إلى معالجة قيود النظم التقليدية للبيانات. تطورت حلول البيانات اللامركزية إلى نظام بيئي متعدد الطبقات ومترابط يغطي جميع مراحل دورة حياة البيانات، بما في ذلك إنشاء البيانات وتخزينها وتبادلها ومعالجتها وتحليلها والتحقق والأمان، فضلاً عن الخصوصية والملكية.
مع زيادة تبادل البيانات واستخدامها، أصبح ضمان المصداقية والموثوقية والخصوصية أمرًا حاسمًا. وهذا يدفع نظام الويب3 إلى الابتكار في التحقق من البيانات وحماية الخصوصية، مما يؤدي إلى حلول مبتكرة.
تركز العديد من تقنيات Web3 والمشاريع الأصلية على معالجة قضايا صحة البيانات وحماية الخصوصية. وبالإضافة إلى انتشار تقنيات مثل البراهين بدون معرفة (ZK) والحوسبة متعددة الأطراف (MPC)، ظهر Notary TLS كطريقة تحقق جديدة ملحوظة.
مقدمة لـ TLS Notary
بروتوكول الأمان في طبقة النقل (TLS) هو بروتوكول تشفير يستخدم على نطاق واسع للاتصالات الشبكية. الغرض الأساسي منه هو ضمان أمان وسلامة وسرية نقل البيانات بين العميل والخادم. TLS هو معيار تشفير شائع في الاتصالات الشبكية الحديثة، يُطبق في سيناريوهات مثل HTTPS والبريد الإلكتروني والرسائل الفورية.
(مبادئ تشفير TLS، المصدر: تك تارگت)
عندما تم تقديم TLS Notary لأول مرة قبل عقد من الزمان، كان هدفه التحقق من أصالة جلسات TLS من خلال إدخال "كاتب الشهادات" كطرف ثالث خارج العميل (المثبت) والخادم.
باستخدام تقنية تقسيم المفتاح، يتم تقسيم المفتاح الرئيسي لجلسة TLS إلى جزأين، يحتفظ كل من العميل والكاتب بجزء منهما على حدة. تتيح هذه التصميمة للكاتب المشاركة كطرف ثالث موثوق به في عملية التحقق دون الوصول إلى محتوى الاتصال الفعلي. تهدف هذه الآلية إلى اكتشاف هجمات الوسيط السري، ومنع الشهادات الاحتيالية، وضمان عدم تلاعب ببيانات الاتصال أثناء النقل. كما تمكن الأطراف الثالثة الموثوقة من تأكيد شرعية الاتصالات مع حماية الخصوصية.
وبالتالي، يقدم TLS Notary التحقق الآمن للبيانات ويوازن بشكل فعال بين احتياجات التحقق وحماية الخصوصية.
في عام 2022 ، تم إعادة هيكلة مشروع TLS Notary من قبل مختبر بحوث Ethereum Foundation's Privacy and Scaling Exploration (PSE). تم إعادة كتابة نسخة جديدة من بروتوكول TLS Notary من البداية باستخدام لغة برمجة Rust وتم دمجها مع بروتوكولات تشفير متقدمة أكثر مثل MPC. تتيح هذه التحديثات للمستخدمين إثبات صحة البيانات التي تم استلامها من خادم إلى طرف ثالث دون كشف محتوى البيانات. في حين أنه يحتفظ بقدرات التحقق الأساسية ، يعزز بروتوكول TLS Notary الجديد بشكل كبير حماية الخصوصية ، مما يجعله أكثر ملاءمة لمتطلبات الخصوصية للبيانات الحالية والمستقبلية.
في السنوات الأخيرة، استمر تطور تكنولوجيا TLS Notary، مما أدى إلى العديد من المشتقات التي تعزز بشكل أكبر خصوصيتها وقدرات التحقق منها:
تستفيد مشاريع Web3 من هذه التقنيات التشفيرية لتعزيز التحقق من البيانات وحماية الخصوصية، ومعالجة قضايا مثل احتكار البيانات والأبراج والنقل الموثوق. يمكن للمستخدمين التحقق بأمان من ملكية حسابات وسائل التواصل الاجتماعي، وسجلات التسوق للقروض المالية، وتاريخ الائتمان المصرفي، والخلفية المهنية، والمؤهلات الأكاديمية دون المساس بخصوصيتهم. أمثلة على ذلك تشمل:
(المشاريع التي تعمل على الموردين الآمنين لطبقة النقل، المصدر: بستيان فيتزل)
التحقق من البعد البياني في Web3 هو رابط أساسي في نظام البيانات، مع احتمالات تطبيق واسعة. ازدهار هذا النظام يوجه الاقتصاد الرقمي نحو نموذج أكثر انفتاحًا وديناميكية وتوجهًا نحو المستخدم. ومع ذلك، فإن تطوير تقنيات التحقق من الأصالة هو فقط بداية بناء بنية بيانات الجيل القادم.
قامت بعض المشاريع بدمج تقنيات التحقق من البيانات المذكورة أعلاه مع استكشافات أخرى لنظم البيانات الرئيسية مثل تتبع البيانات وجمع البيانات الموزعة والنقل الموثوق. فيما يلي، نسلط الضوء على ثلاثة مشاريع ممثلة - OpenLayer و Grass و Vana - التي تعرض إمكانات فريدة في بناء بنية بيانات الجيل التالي.
OpenLayer، أحد المشاريع من a16z Crypto 2024 Spring Startup Accelerator، هو أول طبقة بيانات أصلية متعددة الوحدات. يهدف إلى توفير حلاً متعدد الوحدات مبتكرًا لتنسيق جمع البيانات والتحقق والتحويل، ملبياً احتياجات الشركات Web2 و Web3 على حد سواء. حصل OpenLayer على دعم من صناديق ومستثمرين ملائمين، بما في ذلك Geometry Ventures و LongHash Ventures.
تواجه طبقات البيانات التقليدية تحديات متعددة: نقص آليات التحقق الموثوقة، التعتمد على الهياكل المركزية التي تحد من الوصول، نقص التوافق والتدفق بين الأنظمة المختلفة، وغياب آليات توزيع قيمة البيانات العادلة.
مشكلة أكثر تحديدًا هي زيادة ندرة بيانات التدريب للذكاء الاصطناعي. على الإنترنت العام، العديد من المواقع الآن تنفذ تدابير مكافحة الخرق لمنع الحصول على البيانات بشكل كبير من قبل شركات الذكاء الاصطناعي. في البيانات الخاصة الممتلكات، الوضع أكثر تعقيداً. البيانات القيمة غالباً ما يتم تخزينها بطريقة محمية بسبب طبيعتها الحساسة، ناقصة آليات الحوافز الفعالة. المستخدمون لا يمكنهم تحقيق ربح مادي آمن من بياناتهم الخاصة وبالتالي يترددون في مشاركة المعلومات الحساسة.
لحل هذه المشاكل، تجمع OpenLayer تقنيات التحقق من البيانات لبناء طبقة بيانات موثوقة ومعتمدة. من خلال التمويل والحوافز الاقتصادية، ينسق عمليات جمع البيانات والتحقق منها وتحويلها، ويوفر بنية بيانات أكثر أمانًا وكفاءة ومرونة لشركات الويب2 والويب3.
توفر OpenLayer منصة قابلة للتعديل تبسط عملية جمع البيانات والتحقق منها بشكل موثوق وعمليات التحويل.
a) OpenNodes
OpenNodes هي المكونات الأساسية المسؤولة عن جمع البيانات المتمركز في نظام OpenLayer. يمكن للمستخدمين جمع البيانات من خلال تطبيقات الجوال وإضافات المتصفح وقنوات أخرى. يمكن للمشغلين/العقد تحسين مكافآتهم من خلال أداء المهام التي تناسب مواصفات الأجهزة الخاصة بهم.
تدعم OpenNodes ثلاثة أنواع رئيسية من البيانات:
يمكن للمطورين إضافة أنواع بيانات جديدة بسهولة وتحديد مصادر البيانات وتحديد المتطلبات وطرق الاسترجاع. يمكن للمستخدمين تقديم بيانات مجهولة للحصول على مكافآت. يتيح هذا التصميم للنظام التوسع بشكل مستمر لتلبية الطلبات الجديدة للبيانات. تجعل مصادر البيانات المتنوعة OpenLayer مناسبة لسيناريوهات التطبيق المختلفة وتخفض عتبة توفير البيانات.
ب) فتح المراقبين
تتعامل OpenValidators مع التحقق من البيانات المجمعة، مما يتيح لمستهلكي البيانات تأكيد دقة البيانات التي يقدمها المستخدم مقابل مصدرها. تستخدم طرق التحقق البراهين الكريبتوغرافية، ويمكن التحقق من النتائج بشكل مستقبلي. يمكن لمقدمي الخدمات المتعددة تقديم خدمات التحقق لنفس نوع البرهان، مما يتيح للمطورين اختيار المزود الأنسب لاحتياجاتهم.
في الحالات الاستخدام الأولية، خاصة للبيانات العامة أو الخاصة من واجهات برمجة التطبيقات على الإنترنت، تعتمد OpenLayer على TLS Notary كحل للتحقق. يقوم بتصدير البيانات من أي تطبيق ويتحقق من أصالتها دون المساس بالخصوصية.
بالإضافة إلى TLS Notary، بفضل تصميمه القابل للتوسيع، يمكن لنظام التحقق بسهولة دمج أساليب أخرى لاستيعاب احتياجات البيانات والتحقق المتنوعة، بما في ذلك:
c) OpenConnect
يعد OpenConnect الوحدة المسؤولة عن تحويل البيانات والقابلية للاستخدام داخل نظام OpenLayer البيئي. يقوم بمعالجة البيانات من مصادر مختلفة، مضمنًا التوافق بين الأنظمة المختلفة لتلبية متطلبات التطبيقات المتنوعة. على سبيل المثال:
توفير تعميم البيانات الذي يحافظ على الخصوصية لحسابات المستخدم الخاصة مع تعزيز الأمان أثناء مشاركة البيانات لتقليل التسرب والاستخدام السيئ.
لتلبية مطالب البيانات في الوقت الحقيقي لتطبيقات الذكاء الاصطناعي والبلوكشين، تدعم OpenConnect تحويل البيانات في الوقت الحقيقي بكفاءة.
حالياً، من خلال التكامل مع EigenLayer، يراقب مشغلو OpenLayer AVS (خدمة التحقق النشط) مهام طلب البيانات، يجمعون البيانات، يتحققون منها، ويقدمون تقارير بالنتائج إلى النظام. يراهن المشغلون أو يعيدون رهن الأصول على EigenLayer لتوفير ضمانات اقتصادية لأفعالهم. يؤدي السلوك الخبيث إلى خفض الأصول. كواحدة من أوائل مشاريع AVS على شبكة EigenLayer الرئيسية، جذبت OpenLayer أكثر من 50 مشغلًا و4 مليار دولار في الأصول التي تم إعادة رهنها.
شجرة، المشروع الرائد الذي طوّرته شبكة Wynd، مصمم لإنشاء متصفح شبكة لامركزية ومنصة بيانات تدريب الذكاء الاصطناعي. بحلول نهاية عام 2023، أكملت شجرة جولة تمويل أولية بقيمة 3.5 مليون دولار بقيادة Polychain Capital و Tribe Capital. في سبتمبر 2024، حصلت على تمويل سلسلة A بقيمة 5 ملايين دولار بقيادة HackVC ومشاركة إضافية من Polychain، Delphi، Lattice، و Brevan Howard.
مع اعتماد تدريب الذكاء الاصطناعي بشكل متزايد على مصادر بيانات متنوعة وواسعة النطاق، تتناول Grass هذه الحاجة من خلال إنشاء شبكة عقدية لعقد الويب الموزعة. تستفيد هذه الشبكة من البنية التحتية الفيزيائية اللامركزية وعرض النطاق الترددي الشاغر للمستخدمين لجمع البيانات وتوفيرها لتدريب الذكاء الاصطناعي يمكن التحقق منها. توجه العقد طلبات الويب من خلال اتصالات الإنترنت للمستخدمين، مع الوصول إلى مواقع الويب العامة وتجميع مجموعات البيانات المنظمة. يتم إجراء التنظيف الأولي للبيانات وتنسيقها باستخدام تكنولوجيا الحوسبة الحافة، مما يضمن النواتج عالية الجودة.
يستخدم Grass هندسة تجميع البيانات طبقة البيانات Solana Layer 2 Rollup لتعزيز كفاءة المعالجة. يتلقى المحققون البيانات ويتحققون منها ويقومون بمعالجة عمليات الويب بشكل دفعة واحدة من العقد، وينشئون دلائل Zero-Knowledge (ZK) لتأكيد صحة البيانات. يتم تخزين البيانات المتحققة على دفتر الأستاذ للبيانات الخضراء (L2)، مع وجود دلائل مقابلة مرتبطة بسلسلة كتل Solana L1.
a) عقد العشب:
يقوم المستخدمون بتثبيت تطبيق Grass أو امتداد المتصفح، مما يتيح لشريط النطاق الخامل لديهم تشغيل الزحف على الويب اللامركزي. توجه العقد الذكية طلبات الويب، ويصلون إلى المواقع الإلكترونية العامة، ويجمعون مجموعات البيانات المنظمة. باستخدام الحوسبة الحافة، يقومون بتنظيف البيانات الأولية وتنسيقها. يكسب المستخدمون رموز GRASS كمكافأة استنادًا إلى مساهمتهم في النطاق وحجم البيانات المقدمة.
b) الموجهات:
بصفتهم وسطاء، يقوم الموجهون بربط عقد العشب بالمحققين. إنهم يديرون شبكة العقد، ويقومون بإعادة توجيه النطاق الترددي، ويتلقون حوافز استناداً إلى إجمالي النطاق الترددي المحقق الذي يسهلونه.
c) المحققون:
تتلقى المحققون وتحقق من عمليات الويب التي يتم إعادتها بواسطة الموجهات. يقومون بتوليد أدلة ZK لتأكيد صحة البيانات، مستفيدين من مجموعات مفاتيح فريدة لإقامة اتصالات آمنة بروتوكول نقل البيانات ومجموعات التشفير. في حين يستخدم Grass حاليًا محققين مركزيين، يوجد خطط للانتقال إلى لجنة محققين لامركزية.
d) معالجات ZK:
هذه المعالجات تقوم بالتحقق من براهين بيانات جلسة العقدة وتجميع جميع براهين طلب الويب لإرسالها إلى طبقة Solana 1.
e) كتاب الحسابات الخاص بالبيانات العشبية (Grass L2):
تخزن سجل بيانات العشب مجموعات بيانات شاملة وتربطها ببراهينها L1 على سولانا ، مما يضمن الشفافية والتتبع.
f) نماذج تضمين الحواف:
هذه النماذج تحول البعتات غير المهيكلة على شبكة الويب إلى مجموعات بيانات منظمة تصلح لتدريب الذكاء الاصطناعي.
المصدر: العشب
يتشارك Grass و OpenLayer التزامًا بالاستفادة من الشبكات الموزعة لتوفير الشركات بالوصول إلى بيانات الإنترنت المفتوحة وبيانات الخاصة الموثقة. كلاهما يستخدم آليات حوافز لتعزيز مشاركة البيانات وإنتاج مجموعات بيانات عالية الجودة، ولكن هناك اختلافات في التصميمات الفنية ونماذج الأعمال بينهما.
الهندسة المعمارية التقنية:
يستخدم Grass تركيبة تجميع بيانات طبقة 2 لـ Solana مع التحقق المركزي، بالاعتماد على محقق واحد. تعتمد OpenLayer، بوصفها معتمدًا مبكرًا على خدمة التحقق النشطة AVS (Active Validation Service) الخاصة بـ EigenLayer، على آلية تحقق متمركزة باستخدام حوافز اقتصادية وعقوبات تقليص. يؤكد تصميمه القابل للتوسيع والمرونة في خدمات التحقق من البيانات.
تركيز المنتج:
كلا المشاريع يسمحان للمستخدمين بتحقيق الربح من البيانات من خلال العقد، ولكن حالات استخدام أعمالهم تختلف:
يستهدف العشب في المقام الأول شركات الذكاء الاصطناعي وعلماء البيانات الذين يحتاجون إلى مجموعات بيانات مُهيكلة بشكل كبير، وكذلك مؤسسات البحث والشركات التي تحتاج إلى بيانات مستندة إلى الويب. يلبي OpenLayer احتياجات مطوري Web3 الذين يحتاجون إلى مصادر بيانات خارج السلسلة، وشركات الذكاء الاصطناعي التي تحتاج إلى تيارات في الوقت الحقيقي وقابلة للتحقق، والشركات التي تسعى إلى استراتيجيات مبتكرة مثل التحقق من استخدام منتجات المنافسين.
في حين أن كل من المشاريع تحتل حاليًا مجالات نوعية مختلفة، قد تتلاقى وظائفها مع تطور الصناعة:
ويمكن لكلا المشروعين أيضا أن يدمجا توسيم البيانات كخطوة حاسمة لمجموعات بيانات التدريب. يمكن ل Grass ، بشبكتها الواسعة التي تضم أكثر من 2.2 مليون عقدة نشطة ، نشر خدمات التعلم المعزز مع التغذية الراجعة البشرية (RLHF) بسرعة لتحسين نماذج الذكاء الاصطناعي. يمكن ل OpenLayer ، بخبرتها في التحقق من البيانات ومعالجتها في الوقت الفعلي ، الحفاظ على ميزة في مصداقية البيانات وجودتها ، خاصة بالنسبة لمجموعات البيانات الخاصة.
على الرغم من التداخل المحتمل، فإن نقاط القوة الفريدة والنهج التكنولوجي لهذه الشركات قد تسمح لها بالسيطرة على مجالات فرعية مختلفة داخل نظام البيانات اللامركزي.
(المصدر: IOSG، ديفيد)
فانا شبكة تجمع البيانات الموجهة للمستخدمين المصممة لتوفير بيانات عالية الجودة للذكاء الاصطناعي والتطبيقات ذات الصلة. بالمقارنة مع أوبنلاير وجراس، تعتمد فانا على نهج تكنولوجي وتجاري متميز. في سبتمبر 2024، حصلت فانا على تمويل بقيمة 5 ملايين دولار بقيادة كوينبيس فينتشرز، بعد جولة تمويل سلسلة أ بقيمة 18 مليون دولار ترأسها بارادايم، بمشاركة بوليتشاين وكايسي كاروسو.
تم إطلاق Vana في الأصل في عام 2018 كمشروع بحثي لجامعة MIT، وهو بلوكشين من الطبقة الأولى مخصص لبيانات المستخدم الخاصة. ابتكاراته في ملكية البيانات وتوزيع القيمة تسمح للمستخدمين بتحقيق أرباح من نماذج الذكاء الاصطناعي المدربة على بياناتهم. تحقق Vana من ذلك من خلال حمامات سائلية للبيانات (DLPs) غير الموثوقة والخاصة والقابلة للتتبع وآلية دليل المساهمة المبتكرة التي تسهل تدفق وتحقيق الربح من البيانات الخاصة.
تقدم فانا مفهوم فريد لبرك السيولة البيانات (DLPs)، والتي تكون في صميم شبكة فانا. كل DLP هو شبكة ند لند مستقلة تجمع أصول البيانات النوعية المحددة. يمكن للمستخدمين رفع بياناتهم الخاصة — مثل سجلات التسوق وعادات التصفح ونشاط وسائل التواصل الاجتماعي — إلى DLPs المعينة وتقرير ما إذا كانوا يوافقون على استخدام جهات خارجية محددة.
البيانات ضمن هذه الحمامات تخضع لعملية تجهيز للحفاظ على خصوصية المستخدم وفي الوقت نفسه تبقى قابلة للاستخدام في التطبيقات التجارية، مثل تدريب نماذج الذكاء الاصطناعي والبحوث السوقية. يتم مكافأة المستخدمين الذين يساهمون بالبيانات في DLP بالرموز المقابلة لـ DLP. تمثل هذه الرموز مساهمة المستخدم في الحمام، وتمنح حقوق الحوكمة، وتمنح المستخدم حصة من الأرباح المستقبلية.
على عكس بيع البيانات لمرة واحدة التقليدي، تتيح Vana للبيانات المشاركة بشكل مستمر في الدورة الاقتصادية، مما يتيح للمستخدمين الحصول على مكافآت مستمرة مع تتبع استخدام شفاف ومرئي.
آلية إثبات المساهمة (PoC) هي أساس منهجية فانا لضمان جودة البيانات. يمكن لكل طبقة البيانات الموزعة تحديد وظيفة فريدة لـ PoC مصممة خصيصًا لخصائصها ، تحقق من صحة البيانات المقدمة واكتمالها وتقييم مساهمتها في تحسين أداء نموذج الذكاء الاصطناعي. تقوم هذه الآلية بقياس مساهمات المستخدمين وتسجيلها لتخصيص المكافآت. على غرار مفهوم 'إثبات العمل' في عملة مشفرة ، فإن PoC يكافئ المستخدمين بناءً على جودة البيانات وكميتها وتكرار استخدامها. تقوم العقود الذكية بتأمين هذه العملية ، مما يضمن تعويض المساهمين بشكل عادل وشفاف.
هذه الطبقة الأساسية تمكن المساهمة والتحقق وتسجيل البيانات في DLPs، محولة البيانات إلى أصول رقمية قابلة للتحويل على السلسلة. ينشئ مبتكرو DLP عقود ذكية لتحديد الأغراض وطرق التحقق ومعلمات المساهمة. يقدم المساهمون في البيانات البيانات للتحقق، ويقوم وحدة PoC بتقييم جودة البيانات وتخصيص حقوق الحوكمة والمكافآت.
بمثابة طبقة التطبيقات لـ Vana، تُيسّر هذه المنصة التعاون بين مُساهمي البيانات والمُطوّرين. إنها توفر البنية التحتية لبناء نماذج تدريب الذكاء الاصطناعي الموزعة وتطبيقات الذكاء الاصطناعي باستخدام السيولة في DLPs.
محفل غير مركزي يدعم البيئة البيئية فانا ، يعمل كمخطط تدفق البيانات في الوقت الحقيقي. يسجل جميع عمليات المعاملات الفعلية للبيانات باستخدام موافقة الحصة الاستثمارية ، مما يضمن نقل الرموز DLP بكفاءة ويمكن الوصول إلى البيانات المشتركة بين الشبكات المختلفة للرموز DLP. متوافق تمامًا مع EVM ، ويتيح التعامل بين الشبكات الأخرى والبروتوكولات وتطبيقات DeFi.
(المصدر: فانا)
توفر Vana نهجًا جديدًا من خلال التركيز على سيولة وتمكين بيانات المستخدم. يدعم هذا النموذج المركزي لتبادل البيانات ليس فقط تدريب الذكاء الاصطناعي وأسواق البيانات ولكنه يمكن أيضًا من مشاركة البيانات وملكيتها بسهولة عبر المنصات المتعددة في نظام الويب 3. في النهاية ، يعزز الإنترنت المفتوح حيث يمكن للمستخدمين امتلاك وإدارة بياناتهم والمنتجات الذكية التي تم إنشاؤها منها.
في عام 2006 ، قال عالم البيانات كلايف هومبي ، "البيانات هي النفط الجديد". على مدى العقدين الماضيين ، شهدنا التطور السريع للتقنيات التي "تصقل" هذا المورد ، مثل تحليلات البيانات الضخمة والتعلم الآلي ، والتي أطلقت العنان لقيمة غير مسبوقة من البيانات. وفقا ل IDC ، بحلول عام 2025 ، سيتوسع مجال البيانات العالمي إلى 163 ZB ، مع وصول الغالبية من الأفراد. نظرا لأن إنترنت الأشياء والأجهزة القابلة للارتداء الذكاء الاصطناعي والخدمات الشخصية أصبحت أكثر انتشارا ، فإن الكثير من البيانات المطلوبة للاستخدام التجاري ستنشأ من الأفراد.
تتغلب حلول بيانات Web3 على قيود البنية التحتية التقليدية من خلال الاستفادة من شبكات العقد الموزعة. تتيح هذه الشبكات جمع البيانات على نطاق أوسع وأكثر كفاءة مع تحسين إمكانية الوصول في الوقت الفعلي وإمكانية التحقق من مجموعات بيانات محددة. تضمن تقنيات Web3 صحة البيانات وسلامتها مع حماية خصوصية المستخدم ، مما يعزز نموذج استخدام البيانات بشكل أكثر عدلا. تعمل هذه البنية اللامركزية على إضفاء الطابع الديمقراطي على الوصول إلى البيانات وتمكين المستخدمين من المشاركة في الفوائد الاقتصادية لاقتصاد البيانات.
كل من OpenLayer و Grass يعتمدان على نماذج المستخدم العقدية لتعزيز عمليات جمع البيانات المحددة، بينما تقوم Vana بتحقيق ربح من بيانات المستخدم الخاصة. هذه النهج لا تحسن فقط الكفاءة ولكنها أيضًا تمكّن المستخدمين العاديين من المشاركة في القيمة التي تنشأ من اقتصاد البيانات، مما يخلق سيناريو مربح للمستخدمين والمطورين.
من خلال اقتصاديات الرمز المميز، تقوم حلول بيانات الويب3 بإعادة تصميم نماذج الحوافز، وإنشاء آلية توزيع قيم أكثر عدالة. تجذب هذه الأنظمة مشاركة مستخدمين كبيرة، وموارد الأجهزة، واستثمارات رأس المال، مما يحسن تشغيل شبكة البيانات بأكملها.
توفر حلول Web3 نمطية وقابلية للتوسع ، مما يسمح بالتكرار التكنولوجي وتوسيع النظام البيئي. على سبيل المثال: يوفر التصميم المعياري ل OpenLayer المرونة للتطورات المستقبلية ؛ تعمل بنية Grass الموزعة على تحسين تدريب نموذج الذكاء الاصطناعي من خلال توفير مجموعات بيانات متنوعة وعالية الجودة.
من إنتاج البيانات وتخزينها والتحقق منها إلى التبادل والتحليل ، تعالج حلول الويب3 النقائص في البنى التحتية التقليدية. من خلال تمكين المستخدمين من تحقيق ربح من بياناتهم ، تحول هذه الحلول بشكل جوهري اقتصاد البيانات.
مع تطور التقنيات وتوسع سيناريوهات التطبيق ، تستعد طبقات البيانات اللامركزية لتصبح حجر الزاوية في البنية التحتية للجيل التالي. وستدعم مجموعة واسعة من الصناعات القائمة على البيانات مع تمكين المستخدمين من التحكم في بياناتهم وإمكاناتها الاقتصادية.
تحدثنا سابقًا عن كيفية تكامل الذكاء الاصطناعي والويب3 مع بعضهما في مجالات رأسية مثل الشبكات الحسابية ومنصات الوسطاء وتطبيقات المستهلك. عند التركيز على مصادر البيانات كمجال رأسي، تقدم مشاريع الويب الناشئة إمكانيات جديدة للاكتساب والمشاركة واستخدام البيانات.
أصبحت البيانات هي السائق الرئيسي للابتكار واتخاذ القرارات في جميع الصناعات. توقع UBS أن حجم البيانات العالمية سيزداد بمقدار عشرة أضعاف من عام 2020 إلى عام 2030 ، ليصل إلى 660 زيتابايت. بحلول عام 2025 ، من المتوقع أن ينشئ كل فرد على مستوى العالم 463 إكسابايت (1 إكسابايت = 1 مليار غيغابايت) من البيانات يوميًا. سوق البيانات كخدمة (DaaS) يتوسع بسرعة. وفقًا لبحث Grand View ، بلغت قيمة سوق DaaS العالمية 14.36 مليار دولار في عام 2023 ومن المتوقع أن ينمو بمعدل نمو سنوي مركب (CAGR) قدره 28.1٪ ، ليصل إلى 76.8 مليار دولار بحلول عام 2030.
تعتمد تدريب نموذج الذكاء الاصطناعي بشكل كبير على مجموعات بيانات كبيرة لتحديد الأنماط وضبط المعلمات. بعد التدريب، يتعين أيضًا توافر مجموعات البيانات لاختبار أداء النماذج وقدرات التعميم. بالإضافة إلى ذلك، تتطلب وكلاء الذكاء الاصطناعي، كأشكال تطبيقية ذكية ناشئة، مصادر بيانات في الوقت الحقيقي وموثوقة لضمان اتخاذ القرارات الدقيقة وتنفيذ المهام بدقة.
(المصدر: Leewayhertz)
تزداد أيضًا تنوع وانتشار الطلب على تحليلات الأعمال ، حيث تعمل كأداة أساسية تدفع الابتكار في المؤسسات. على سبيل المثال ، تحتاج منصات التواصل الاجتماعي وشركات أبحاث السوق إلى بيانات موثوقة عن سلوك المستخدم لصياغة استراتيجيات وتحليل الاتجاهات ، ودمج بيانات متنوعة من منصات اجتماعية متعددة لبناء صورة أكثر شمولاً.
بالنسبة لنظام الويب 3، يتطلب الأمر أيضًا بيانات موثوقة وأصيلة على السلسلة الرقمية لدعم المنتجات المالية الجديدة. مع تحويل المزيد من الأصول الابتكارية إلى رموز، يتطلب وجود واجهات بيانات مرنة وموثوقة لدعم تطوير المنتجات وإدارة المخاطر، والسماح للعقود الذكية بالتنفيذ على أساس بيانات حية يمكن التحقق منها في الوقت الحقيقي.
بالإضافة إلى ذلك، تبرز حالات الاستخدام في البحث العلمي، والإنترنت of Things، وغيرها من المجالات الطلب المتزايد بشكل مذهل على البيانات المتنوعة والأصلية والمباشرة. قد تواجه الأنظمة التقليدية صعوبة في التعامل مع حجم البيانات المتزايد بسرعة والمطالب المتغيرة باستمرار.
تتضمن البيئة البيانية النموذجية جمع البيانات وتخزينها ومعالجتها وتحليلها وتطبيقها. تتميز النماذج المركزية بجمع البيانات وتخزينها المركزي، وإدارتها من قبل فريق الاتصالات الأساسي مع رقابة صارمة على الوصول. على سبيل المثال، تمتد بيئة بيانات Google عبر مصادر بيانات مختلفة مثل محركات البحث وGmail ونظام التشغيل Android. تقوم هذه المنصات بجمع بيانات المستخدمين، وتخزينها في مراكز بيانات منتشرة عالمياً، ومعالجتها باستخدام خوارزميات لدعم تطوير وتحسين مختلف المنتجات والخدمات.
في الأسواق المالية، تجمع LSEG (السابقة Refinitiv) البيانات الفورية والتاريخية من البورصات العالمية والبنوك والمؤسسات المالية الكبرى، مع استخدام شبكة Reuters News المملوكة لها لجمع أخبار ذات صلة بالسوق. يتم معالجة هذه المعلومات باستخدام خوارزميات ونماذج خاصة لتوليد منتجات تحليلية وتقييم المخاطر كخدمات قيمة مضافة.
(المصدر: kdnuggets.com)
بينما تكون هندسة البيانات التقليدية فعالة في الخدمات المهنية، إلا أن القيود التي تفرضها النماذج المركزية تصبح واضحة بشكل متزايد، لا سيما في تغطية مصادر البيانات الناشئة، والشفافية، وحماية خصوصية المستخدم. فيما يلي بعض القضايا الرئيسية:
على سبيل المثال، كشفت حدث GameStop لعام 2021 عن قيود مزودي البيانات المالية التقليدية في تحليل الرأي الاجتماعي على وسائل التواصل الاجتماعي. تأثير رأي المستثمرين على منصات مثل ريديت أثر بسرعة على اتجاهات السوق، ولكن أجهزة البيانات مثل بلومبرغ ورويترز فشلت في التقاط هذه الديناميات في الوقت المناسب، مما أدى إلى توقعات سوق متأخرة.
بالإضافة إلى هذه المسائل، تواجه مقدمو البيانات التقليدية تحديات تتعلق بكفاءة التكلفة والمرونة. على الرغم من أنهم يعملون على معالجة هذه المشكلات بنشاط، توفر تقنيات Web3 الناشئة وجهات نظر وإمكانيات جديدة للتعامل معها.
منذ إطلاق حلول التخزين اللامركزية مثل IPFS (نظام الملفات بين الكواكب) في عام 2014، توجهت سلسلة من المشاريع الناشئة إلى معالجة قيود النظم التقليدية للبيانات. تطورت حلول البيانات اللامركزية إلى نظام بيئي متعدد الطبقات ومترابط يغطي جميع مراحل دورة حياة البيانات، بما في ذلك إنشاء البيانات وتخزينها وتبادلها ومعالجتها وتحليلها والتحقق والأمان، فضلاً عن الخصوصية والملكية.
مع زيادة تبادل البيانات واستخدامها، أصبح ضمان المصداقية والموثوقية والخصوصية أمرًا حاسمًا. وهذا يدفع نظام الويب3 إلى الابتكار في التحقق من البيانات وحماية الخصوصية، مما يؤدي إلى حلول مبتكرة.
تركز العديد من تقنيات Web3 والمشاريع الأصلية على معالجة قضايا صحة البيانات وحماية الخصوصية. وبالإضافة إلى انتشار تقنيات مثل البراهين بدون معرفة (ZK) والحوسبة متعددة الأطراف (MPC)، ظهر Notary TLS كطريقة تحقق جديدة ملحوظة.
مقدمة لـ TLS Notary
بروتوكول الأمان في طبقة النقل (TLS) هو بروتوكول تشفير يستخدم على نطاق واسع للاتصالات الشبكية. الغرض الأساسي منه هو ضمان أمان وسلامة وسرية نقل البيانات بين العميل والخادم. TLS هو معيار تشفير شائع في الاتصالات الشبكية الحديثة، يُطبق في سيناريوهات مثل HTTPS والبريد الإلكتروني والرسائل الفورية.
(مبادئ تشفير TLS، المصدر: تك تارگت)
عندما تم تقديم TLS Notary لأول مرة قبل عقد من الزمان، كان هدفه التحقق من أصالة جلسات TLS من خلال إدخال "كاتب الشهادات" كطرف ثالث خارج العميل (المثبت) والخادم.
باستخدام تقنية تقسيم المفتاح، يتم تقسيم المفتاح الرئيسي لجلسة TLS إلى جزأين، يحتفظ كل من العميل والكاتب بجزء منهما على حدة. تتيح هذه التصميمة للكاتب المشاركة كطرف ثالث موثوق به في عملية التحقق دون الوصول إلى محتوى الاتصال الفعلي. تهدف هذه الآلية إلى اكتشاف هجمات الوسيط السري، ومنع الشهادات الاحتيالية، وضمان عدم تلاعب ببيانات الاتصال أثناء النقل. كما تمكن الأطراف الثالثة الموثوقة من تأكيد شرعية الاتصالات مع حماية الخصوصية.
وبالتالي، يقدم TLS Notary التحقق الآمن للبيانات ويوازن بشكل فعال بين احتياجات التحقق وحماية الخصوصية.
في عام 2022 ، تم إعادة هيكلة مشروع TLS Notary من قبل مختبر بحوث Ethereum Foundation's Privacy and Scaling Exploration (PSE). تم إعادة كتابة نسخة جديدة من بروتوكول TLS Notary من البداية باستخدام لغة برمجة Rust وتم دمجها مع بروتوكولات تشفير متقدمة أكثر مثل MPC. تتيح هذه التحديثات للمستخدمين إثبات صحة البيانات التي تم استلامها من خادم إلى طرف ثالث دون كشف محتوى البيانات. في حين أنه يحتفظ بقدرات التحقق الأساسية ، يعزز بروتوكول TLS Notary الجديد بشكل كبير حماية الخصوصية ، مما يجعله أكثر ملاءمة لمتطلبات الخصوصية للبيانات الحالية والمستقبلية.
في السنوات الأخيرة، استمر تطور تكنولوجيا TLS Notary، مما أدى إلى العديد من المشتقات التي تعزز بشكل أكبر خصوصيتها وقدرات التحقق منها:
تستفيد مشاريع Web3 من هذه التقنيات التشفيرية لتعزيز التحقق من البيانات وحماية الخصوصية، ومعالجة قضايا مثل احتكار البيانات والأبراج والنقل الموثوق. يمكن للمستخدمين التحقق بأمان من ملكية حسابات وسائل التواصل الاجتماعي، وسجلات التسوق للقروض المالية، وتاريخ الائتمان المصرفي، والخلفية المهنية، والمؤهلات الأكاديمية دون المساس بخصوصيتهم. أمثلة على ذلك تشمل:
(المشاريع التي تعمل على الموردين الآمنين لطبقة النقل، المصدر: بستيان فيتزل)
التحقق من البعد البياني في Web3 هو رابط أساسي في نظام البيانات، مع احتمالات تطبيق واسعة. ازدهار هذا النظام يوجه الاقتصاد الرقمي نحو نموذج أكثر انفتاحًا وديناميكية وتوجهًا نحو المستخدم. ومع ذلك، فإن تطوير تقنيات التحقق من الأصالة هو فقط بداية بناء بنية بيانات الجيل القادم.
قامت بعض المشاريع بدمج تقنيات التحقق من البيانات المذكورة أعلاه مع استكشافات أخرى لنظم البيانات الرئيسية مثل تتبع البيانات وجمع البيانات الموزعة والنقل الموثوق. فيما يلي، نسلط الضوء على ثلاثة مشاريع ممثلة - OpenLayer و Grass و Vana - التي تعرض إمكانات فريدة في بناء بنية بيانات الجيل التالي.
OpenLayer، أحد المشاريع من a16z Crypto 2024 Spring Startup Accelerator، هو أول طبقة بيانات أصلية متعددة الوحدات. يهدف إلى توفير حلاً متعدد الوحدات مبتكرًا لتنسيق جمع البيانات والتحقق والتحويل، ملبياً احتياجات الشركات Web2 و Web3 على حد سواء. حصل OpenLayer على دعم من صناديق ومستثمرين ملائمين، بما في ذلك Geometry Ventures و LongHash Ventures.
تواجه طبقات البيانات التقليدية تحديات متعددة: نقص آليات التحقق الموثوقة، التعتمد على الهياكل المركزية التي تحد من الوصول، نقص التوافق والتدفق بين الأنظمة المختلفة، وغياب آليات توزيع قيمة البيانات العادلة.
مشكلة أكثر تحديدًا هي زيادة ندرة بيانات التدريب للذكاء الاصطناعي. على الإنترنت العام، العديد من المواقع الآن تنفذ تدابير مكافحة الخرق لمنع الحصول على البيانات بشكل كبير من قبل شركات الذكاء الاصطناعي. في البيانات الخاصة الممتلكات، الوضع أكثر تعقيداً. البيانات القيمة غالباً ما يتم تخزينها بطريقة محمية بسبب طبيعتها الحساسة، ناقصة آليات الحوافز الفعالة. المستخدمون لا يمكنهم تحقيق ربح مادي آمن من بياناتهم الخاصة وبالتالي يترددون في مشاركة المعلومات الحساسة.
لحل هذه المشاكل، تجمع OpenLayer تقنيات التحقق من البيانات لبناء طبقة بيانات موثوقة ومعتمدة. من خلال التمويل والحوافز الاقتصادية، ينسق عمليات جمع البيانات والتحقق منها وتحويلها، ويوفر بنية بيانات أكثر أمانًا وكفاءة ومرونة لشركات الويب2 والويب3.
توفر OpenLayer منصة قابلة للتعديل تبسط عملية جمع البيانات والتحقق منها بشكل موثوق وعمليات التحويل.
a) OpenNodes
OpenNodes هي المكونات الأساسية المسؤولة عن جمع البيانات المتمركز في نظام OpenLayer. يمكن للمستخدمين جمع البيانات من خلال تطبيقات الجوال وإضافات المتصفح وقنوات أخرى. يمكن للمشغلين/العقد تحسين مكافآتهم من خلال أداء المهام التي تناسب مواصفات الأجهزة الخاصة بهم.
تدعم OpenNodes ثلاثة أنواع رئيسية من البيانات:
يمكن للمطورين إضافة أنواع بيانات جديدة بسهولة وتحديد مصادر البيانات وتحديد المتطلبات وطرق الاسترجاع. يمكن للمستخدمين تقديم بيانات مجهولة للحصول على مكافآت. يتيح هذا التصميم للنظام التوسع بشكل مستمر لتلبية الطلبات الجديدة للبيانات. تجعل مصادر البيانات المتنوعة OpenLayer مناسبة لسيناريوهات التطبيق المختلفة وتخفض عتبة توفير البيانات.
ب) فتح المراقبين
تتعامل OpenValidators مع التحقق من البيانات المجمعة، مما يتيح لمستهلكي البيانات تأكيد دقة البيانات التي يقدمها المستخدم مقابل مصدرها. تستخدم طرق التحقق البراهين الكريبتوغرافية، ويمكن التحقق من النتائج بشكل مستقبلي. يمكن لمقدمي الخدمات المتعددة تقديم خدمات التحقق لنفس نوع البرهان، مما يتيح للمطورين اختيار المزود الأنسب لاحتياجاتهم.
في الحالات الاستخدام الأولية، خاصة للبيانات العامة أو الخاصة من واجهات برمجة التطبيقات على الإنترنت، تعتمد OpenLayer على TLS Notary كحل للتحقق. يقوم بتصدير البيانات من أي تطبيق ويتحقق من أصالتها دون المساس بالخصوصية.
بالإضافة إلى TLS Notary، بفضل تصميمه القابل للتوسيع، يمكن لنظام التحقق بسهولة دمج أساليب أخرى لاستيعاب احتياجات البيانات والتحقق المتنوعة، بما في ذلك:
c) OpenConnect
يعد OpenConnect الوحدة المسؤولة عن تحويل البيانات والقابلية للاستخدام داخل نظام OpenLayer البيئي. يقوم بمعالجة البيانات من مصادر مختلفة، مضمنًا التوافق بين الأنظمة المختلفة لتلبية متطلبات التطبيقات المتنوعة. على سبيل المثال:
توفير تعميم البيانات الذي يحافظ على الخصوصية لحسابات المستخدم الخاصة مع تعزيز الأمان أثناء مشاركة البيانات لتقليل التسرب والاستخدام السيئ.
لتلبية مطالب البيانات في الوقت الحقيقي لتطبيقات الذكاء الاصطناعي والبلوكشين، تدعم OpenConnect تحويل البيانات في الوقت الحقيقي بكفاءة.
حالياً، من خلال التكامل مع EigenLayer، يراقب مشغلو OpenLayer AVS (خدمة التحقق النشط) مهام طلب البيانات، يجمعون البيانات، يتحققون منها، ويقدمون تقارير بالنتائج إلى النظام. يراهن المشغلون أو يعيدون رهن الأصول على EigenLayer لتوفير ضمانات اقتصادية لأفعالهم. يؤدي السلوك الخبيث إلى خفض الأصول. كواحدة من أوائل مشاريع AVS على شبكة EigenLayer الرئيسية، جذبت OpenLayer أكثر من 50 مشغلًا و4 مليار دولار في الأصول التي تم إعادة رهنها.
شجرة، المشروع الرائد الذي طوّرته شبكة Wynd، مصمم لإنشاء متصفح شبكة لامركزية ومنصة بيانات تدريب الذكاء الاصطناعي. بحلول نهاية عام 2023، أكملت شجرة جولة تمويل أولية بقيمة 3.5 مليون دولار بقيادة Polychain Capital و Tribe Capital. في سبتمبر 2024، حصلت على تمويل سلسلة A بقيمة 5 ملايين دولار بقيادة HackVC ومشاركة إضافية من Polychain، Delphi، Lattice، و Brevan Howard.
مع اعتماد تدريب الذكاء الاصطناعي بشكل متزايد على مصادر بيانات متنوعة وواسعة النطاق، تتناول Grass هذه الحاجة من خلال إنشاء شبكة عقدية لعقد الويب الموزعة. تستفيد هذه الشبكة من البنية التحتية الفيزيائية اللامركزية وعرض النطاق الترددي الشاغر للمستخدمين لجمع البيانات وتوفيرها لتدريب الذكاء الاصطناعي يمكن التحقق منها. توجه العقد طلبات الويب من خلال اتصالات الإنترنت للمستخدمين، مع الوصول إلى مواقع الويب العامة وتجميع مجموعات البيانات المنظمة. يتم إجراء التنظيف الأولي للبيانات وتنسيقها باستخدام تكنولوجيا الحوسبة الحافة، مما يضمن النواتج عالية الجودة.
يستخدم Grass هندسة تجميع البيانات طبقة البيانات Solana Layer 2 Rollup لتعزيز كفاءة المعالجة. يتلقى المحققون البيانات ويتحققون منها ويقومون بمعالجة عمليات الويب بشكل دفعة واحدة من العقد، وينشئون دلائل Zero-Knowledge (ZK) لتأكيد صحة البيانات. يتم تخزين البيانات المتحققة على دفتر الأستاذ للبيانات الخضراء (L2)، مع وجود دلائل مقابلة مرتبطة بسلسلة كتل Solana L1.
a) عقد العشب:
يقوم المستخدمون بتثبيت تطبيق Grass أو امتداد المتصفح، مما يتيح لشريط النطاق الخامل لديهم تشغيل الزحف على الويب اللامركزي. توجه العقد الذكية طلبات الويب، ويصلون إلى المواقع الإلكترونية العامة، ويجمعون مجموعات البيانات المنظمة. باستخدام الحوسبة الحافة، يقومون بتنظيف البيانات الأولية وتنسيقها. يكسب المستخدمون رموز GRASS كمكافأة استنادًا إلى مساهمتهم في النطاق وحجم البيانات المقدمة.
b) الموجهات:
بصفتهم وسطاء، يقوم الموجهون بربط عقد العشب بالمحققين. إنهم يديرون شبكة العقد، ويقومون بإعادة توجيه النطاق الترددي، ويتلقون حوافز استناداً إلى إجمالي النطاق الترددي المحقق الذي يسهلونه.
c) المحققون:
تتلقى المحققون وتحقق من عمليات الويب التي يتم إعادتها بواسطة الموجهات. يقومون بتوليد أدلة ZK لتأكيد صحة البيانات، مستفيدين من مجموعات مفاتيح فريدة لإقامة اتصالات آمنة بروتوكول نقل البيانات ومجموعات التشفير. في حين يستخدم Grass حاليًا محققين مركزيين، يوجد خطط للانتقال إلى لجنة محققين لامركزية.
d) معالجات ZK:
هذه المعالجات تقوم بالتحقق من براهين بيانات جلسة العقدة وتجميع جميع براهين طلب الويب لإرسالها إلى طبقة Solana 1.
e) كتاب الحسابات الخاص بالبيانات العشبية (Grass L2):
تخزن سجل بيانات العشب مجموعات بيانات شاملة وتربطها ببراهينها L1 على سولانا ، مما يضمن الشفافية والتتبع.
f) نماذج تضمين الحواف:
هذه النماذج تحول البعتات غير المهيكلة على شبكة الويب إلى مجموعات بيانات منظمة تصلح لتدريب الذكاء الاصطناعي.
المصدر: العشب
يتشارك Grass و OpenLayer التزامًا بالاستفادة من الشبكات الموزعة لتوفير الشركات بالوصول إلى بيانات الإنترنت المفتوحة وبيانات الخاصة الموثقة. كلاهما يستخدم آليات حوافز لتعزيز مشاركة البيانات وإنتاج مجموعات بيانات عالية الجودة، ولكن هناك اختلافات في التصميمات الفنية ونماذج الأعمال بينهما.
الهندسة المعمارية التقنية:
يستخدم Grass تركيبة تجميع بيانات طبقة 2 لـ Solana مع التحقق المركزي، بالاعتماد على محقق واحد. تعتمد OpenLayer، بوصفها معتمدًا مبكرًا على خدمة التحقق النشطة AVS (Active Validation Service) الخاصة بـ EigenLayer، على آلية تحقق متمركزة باستخدام حوافز اقتصادية وعقوبات تقليص. يؤكد تصميمه القابل للتوسيع والمرونة في خدمات التحقق من البيانات.
تركيز المنتج:
كلا المشاريع يسمحان للمستخدمين بتحقيق الربح من البيانات من خلال العقد، ولكن حالات استخدام أعمالهم تختلف:
يستهدف العشب في المقام الأول شركات الذكاء الاصطناعي وعلماء البيانات الذين يحتاجون إلى مجموعات بيانات مُهيكلة بشكل كبير، وكذلك مؤسسات البحث والشركات التي تحتاج إلى بيانات مستندة إلى الويب. يلبي OpenLayer احتياجات مطوري Web3 الذين يحتاجون إلى مصادر بيانات خارج السلسلة، وشركات الذكاء الاصطناعي التي تحتاج إلى تيارات في الوقت الحقيقي وقابلة للتحقق، والشركات التي تسعى إلى استراتيجيات مبتكرة مثل التحقق من استخدام منتجات المنافسين.
في حين أن كل من المشاريع تحتل حاليًا مجالات نوعية مختلفة، قد تتلاقى وظائفها مع تطور الصناعة:
ويمكن لكلا المشروعين أيضا أن يدمجا توسيم البيانات كخطوة حاسمة لمجموعات بيانات التدريب. يمكن ل Grass ، بشبكتها الواسعة التي تضم أكثر من 2.2 مليون عقدة نشطة ، نشر خدمات التعلم المعزز مع التغذية الراجعة البشرية (RLHF) بسرعة لتحسين نماذج الذكاء الاصطناعي. يمكن ل OpenLayer ، بخبرتها في التحقق من البيانات ومعالجتها في الوقت الفعلي ، الحفاظ على ميزة في مصداقية البيانات وجودتها ، خاصة بالنسبة لمجموعات البيانات الخاصة.
على الرغم من التداخل المحتمل، فإن نقاط القوة الفريدة والنهج التكنولوجي لهذه الشركات قد تسمح لها بالسيطرة على مجالات فرعية مختلفة داخل نظام البيانات اللامركزي.
(المصدر: IOSG، ديفيد)
فانا شبكة تجمع البيانات الموجهة للمستخدمين المصممة لتوفير بيانات عالية الجودة للذكاء الاصطناعي والتطبيقات ذات الصلة. بالمقارنة مع أوبنلاير وجراس، تعتمد فانا على نهج تكنولوجي وتجاري متميز. في سبتمبر 2024، حصلت فانا على تمويل بقيمة 5 ملايين دولار بقيادة كوينبيس فينتشرز، بعد جولة تمويل سلسلة أ بقيمة 18 مليون دولار ترأسها بارادايم، بمشاركة بوليتشاين وكايسي كاروسو.
تم إطلاق Vana في الأصل في عام 2018 كمشروع بحثي لجامعة MIT، وهو بلوكشين من الطبقة الأولى مخصص لبيانات المستخدم الخاصة. ابتكاراته في ملكية البيانات وتوزيع القيمة تسمح للمستخدمين بتحقيق أرباح من نماذج الذكاء الاصطناعي المدربة على بياناتهم. تحقق Vana من ذلك من خلال حمامات سائلية للبيانات (DLPs) غير الموثوقة والخاصة والقابلة للتتبع وآلية دليل المساهمة المبتكرة التي تسهل تدفق وتحقيق الربح من البيانات الخاصة.
تقدم فانا مفهوم فريد لبرك السيولة البيانات (DLPs)، والتي تكون في صميم شبكة فانا. كل DLP هو شبكة ند لند مستقلة تجمع أصول البيانات النوعية المحددة. يمكن للمستخدمين رفع بياناتهم الخاصة — مثل سجلات التسوق وعادات التصفح ونشاط وسائل التواصل الاجتماعي — إلى DLPs المعينة وتقرير ما إذا كانوا يوافقون على استخدام جهات خارجية محددة.
البيانات ضمن هذه الحمامات تخضع لعملية تجهيز للحفاظ على خصوصية المستخدم وفي الوقت نفسه تبقى قابلة للاستخدام في التطبيقات التجارية، مثل تدريب نماذج الذكاء الاصطناعي والبحوث السوقية. يتم مكافأة المستخدمين الذين يساهمون بالبيانات في DLP بالرموز المقابلة لـ DLP. تمثل هذه الرموز مساهمة المستخدم في الحمام، وتمنح حقوق الحوكمة، وتمنح المستخدم حصة من الأرباح المستقبلية.
على عكس بيع البيانات لمرة واحدة التقليدي، تتيح Vana للبيانات المشاركة بشكل مستمر في الدورة الاقتصادية، مما يتيح للمستخدمين الحصول على مكافآت مستمرة مع تتبع استخدام شفاف ومرئي.
آلية إثبات المساهمة (PoC) هي أساس منهجية فانا لضمان جودة البيانات. يمكن لكل طبقة البيانات الموزعة تحديد وظيفة فريدة لـ PoC مصممة خصيصًا لخصائصها ، تحقق من صحة البيانات المقدمة واكتمالها وتقييم مساهمتها في تحسين أداء نموذج الذكاء الاصطناعي. تقوم هذه الآلية بقياس مساهمات المستخدمين وتسجيلها لتخصيص المكافآت. على غرار مفهوم 'إثبات العمل' في عملة مشفرة ، فإن PoC يكافئ المستخدمين بناءً على جودة البيانات وكميتها وتكرار استخدامها. تقوم العقود الذكية بتأمين هذه العملية ، مما يضمن تعويض المساهمين بشكل عادل وشفاف.
هذه الطبقة الأساسية تمكن المساهمة والتحقق وتسجيل البيانات في DLPs، محولة البيانات إلى أصول رقمية قابلة للتحويل على السلسلة. ينشئ مبتكرو DLP عقود ذكية لتحديد الأغراض وطرق التحقق ومعلمات المساهمة. يقدم المساهمون في البيانات البيانات للتحقق، ويقوم وحدة PoC بتقييم جودة البيانات وتخصيص حقوق الحوكمة والمكافآت.
بمثابة طبقة التطبيقات لـ Vana، تُيسّر هذه المنصة التعاون بين مُساهمي البيانات والمُطوّرين. إنها توفر البنية التحتية لبناء نماذج تدريب الذكاء الاصطناعي الموزعة وتطبيقات الذكاء الاصطناعي باستخدام السيولة في DLPs.
محفل غير مركزي يدعم البيئة البيئية فانا ، يعمل كمخطط تدفق البيانات في الوقت الحقيقي. يسجل جميع عمليات المعاملات الفعلية للبيانات باستخدام موافقة الحصة الاستثمارية ، مما يضمن نقل الرموز DLP بكفاءة ويمكن الوصول إلى البيانات المشتركة بين الشبكات المختلفة للرموز DLP. متوافق تمامًا مع EVM ، ويتيح التعامل بين الشبكات الأخرى والبروتوكولات وتطبيقات DeFi.
(المصدر: فانا)
توفر Vana نهجًا جديدًا من خلال التركيز على سيولة وتمكين بيانات المستخدم. يدعم هذا النموذج المركزي لتبادل البيانات ليس فقط تدريب الذكاء الاصطناعي وأسواق البيانات ولكنه يمكن أيضًا من مشاركة البيانات وملكيتها بسهولة عبر المنصات المتعددة في نظام الويب 3. في النهاية ، يعزز الإنترنت المفتوح حيث يمكن للمستخدمين امتلاك وإدارة بياناتهم والمنتجات الذكية التي تم إنشاؤها منها.
في عام 2006 ، قال عالم البيانات كلايف هومبي ، "البيانات هي النفط الجديد". على مدى العقدين الماضيين ، شهدنا التطور السريع للتقنيات التي "تصقل" هذا المورد ، مثل تحليلات البيانات الضخمة والتعلم الآلي ، والتي أطلقت العنان لقيمة غير مسبوقة من البيانات. وفقا ل IDC ، بحلول عام 2025 ، سيتوسع مجال البيانات العالمي إلى 163 ZB ، مع وصول الغالبية من الأفراد. نظرا لأن إنترنت الأشياء والأجهزة القابلة للارتداء الذكاء الاصطناعي والخدمات الشخصية أصبحت أكثر انتشارا ، فإن الكثير من البيانات المطلوبة للاستخدام التجاري ستنشأ من الأفراد.
تتغلب حلول بيانات Web3 على قيود البنية التحتية التقليدية من خلال الاستفادة من شبكات العقد الموزعة. تتيح هذه الشبكات جمع البيانات على نطاق أوسع وأكثر كفاءة مع تحسين إمكانية الوصول في الوقت الفعلي وإمكانية التحقق من مجموعات بيانات محددة. تضمن تقنيات Web3 صحة البيانات وسلامتها مع حماية خصوصية المستخدم ، مما يعزز نموذج استخدام البيانات بشكل أكثر عدلا. تعمل هذه البنية اللامركزية على إضفاء الطابع الديمقراطي على الوصول إلى البيانات وتمكين المستخدمين من المشاركة في الفوائد الاقتصادية لاقتصاد البيانات.
كل من OpenLayer و Grass يعتمدان على نماذج المستخدم العقدية لتعزيز عمليات جمع البيانات المحددة، بينما تقوم Vana بتحقيق ربح من بيانات المستخدم الخاصة. هذه النهج لا تحسن فقط الكفاءة ولكنها أيضًا تمكّن المستخدمين العاديين من المشاركة في القيمة التي تنشأ من اقتصاد البيانات، مما يخلق سيناريو مربح للمستخدمين والمطورين.
من خلال اقتصاديات الرمز المميز، تقوم حلول بيانات الويب3 بإعادة تصميم نماذج الحوافز، وإنشاء آلية توزيع قيم أكثر عدالة. تجذب هذه الأنظمة مشاركة مستخدمين كبيرة، وموارد الأجهزة، واستثمارات رأس المال، مما يحسن تشغيل شبكة البيانات بأكملها.
توفر حلول Web3 نمطية وقابلية للتوسع ، مما يسمح بالتكرار التكنولوجي وتوسيع النظام البيئي. على سبيل المثال: يوفر التصميم المعياري ل OpenLayer المرونة للتطورات المستقبلية ؛ تعمل بنية Grass الموزعة على تحسين تدريب نموذج الذكاء الاصطناعي من خلال توفير مجموعات بيانات متنوعة وعالية الجودة.
من إنتاج البيانات وتخزينها والتحقق منها إلى التبادل والتحليل ، تعالج حلول الويب3 النقائص في البنى التحتية التقليدية. من خلال تمكين المستخدمين من تحقيق ربح من بياناتهم ، تحول هذه الحلول بشكل جوهري اقتصاد البيانات.
مع تطور التقنيات وتوسع سيناريوهات التطبيق ، تستعد طبقات البيانات اللامركزية لتصبح حجر الزاوية في البنية التحتية للجيل التالي. وستدعم مجموعة واسعة من الصناعات القائمة على البيانات مع تمكين المستخدمين من التحكم في بياناتهم وإمكاناتها الاقتصادية.