ข้อมูลของฉันไม่ใช่ของฉัน: การเกิดของชั้นข้อมูล

กลาง2/10/2025, 4:24:36 AM
การพูดคุยเกี่ยวกับความเป็นเจ้าของข้อมูลและความเป็นส่วนตัวได้เพิ่มขึ้น โปรโตคอลข้อมูล Web3 เช่น Vana, Ocean Protocol และ Masa กำลังเกิดขึ้น ส่งเสริมความเป็นระบบสมบูรณ์ของข้อมูลแบบกระจายและทำให้ผู้ใช้สามารถควบคุมและทำให้ได้รายได้จากข้อมูลของตนเองได้อย่างเฉพาะอย่างยิ่งในการฝึกอบรม AI และการรับข้อมูลแบบเรียลไทม์ โปรโตคอลเหล่านี้นำเสนอวิธีการซื้อขายข้อมูลและการป้องกันความเป็นส่วนตัวที่ใหม่ จึงสามารถตอบสนองความต้องการข้อมูลที่มีคุณภาพสูงที่เพิ่มขึ้น

ข้อมูลคือทองคำดิจิทัลในยุคนี้ที่ความสนใจเป็นออนไลน์ ในปี 2024 เวลาที่ใช้บนหน้าจอโลกเฉลี่ยอยู่ที่ 6 ชั่วโมง 40 นาทีต่อวัน มีการเพิ่มขึ้นจากปีก่อนหน้า ในสหรัฐอเมริกา เวลาเฉลี่ยสูงกว่าอีกทีที่ 7 ชั่วโมง 3 นาทีต่อวัน

ด้วยระดับความชุ่มชื่นนี้ ปริมาณข้อมูลที่สร้างขึ้นเป็นเรื่อย ๆ ทำให้น่าตื่นตาตื่นใจ - มีการสร้างข้อมูลอยู่ 328.77 ล้านเทระไบต์ต่อวันในปี 2024 นั่นคือประมาณ 0.4 เซตตะไบต์ต่อวันเมื่อพิจารณาข้อมูลที่สร้างใหม่ทั้งหมดที่ถูกแยกออก ถูกคัดลอก หรือถูกบรรจุไว้

แต่ถึงกระทั้งจำนวนมากของข้อมูลที่ถูกสร้างและใช้งานในแต่ละวันก็เป็นจำนวนมาก ผู้ใช้เกือบไม่เป็นเจ้าของข้อมูลเลย:

  • สื่อสังคม: ข้อมูลบนแพลตฟอร์มเช่น Twitter, Instagram และอื่นๆ เป็นสิทธิ์ของบริษัทที่ควบคุม ถึงแม้ว่าผู้ใช้จะสร้างข้อมูล
  • Internet of Things (IoT): ข้อมูลจากอุปกรณ์ฉลาดมักเป็นของผู้ผลิตอุปกรณ์หรือผู้ให้บริการบริการ นอกจากนี้แล้ว หากไม่มีข้อตกลงเฉพาะระบุ
  • ข้อมูลสุขภาพ: ในขณะที่บุคคลมีสิทธิ์เกี่ยวกับบันทึกการรักษาของพวกเขา แต่ข้อมูลที่มาจากแอปพลิเคชันสุขภาพหรืออุปกรณ์สวมใส่ใช้งานได้ถูกควบคุมโดยบริษัทที่ให้บริการเหล่านั้น

ข้อมูลเกี่ยวกับสกุลเงินดิจิทัลและข้อมูลสังคม

ในโลกคริปโตเราเห็นการเจริญขึ้นของ @_kaitoai, ซึ่งดัชนีข้อมูลทางสังคมบนทวิตเตอร์และแปลงมันเป็นข้อมูลที่สามารถดำเนินการได้สำหรับโครงการ บุคคลสำคัญในวงการ และผู้นำทางความคิด คำว่า 'yap' และ 'mindshare' ได้รับความนิยมจากทีม Kaito เนื่องจากความเชี่ยวชาญในการเจริญเติบโต (ด้วยแดชบอร์ด mindshare & yapper ที่ได้รับความนิยม) และความสามารถในการดึงดูดความสนใจโดยอินทรีย์บน Crypto Twitter

“Yap” มีเป้าหมายที่จะให้สิ่งสร้างสรรค์เนื้อหาคุณภาพบนทวิตเตอร์โดยให้คำถามหลายอย่างที่ยังคงไม่ได้รับคำตอบ:

  • วิธีการคะแนน 'แย็ป' อย่างแม่นยำเป็นอย่างไร?
  • คุณได้รับเยบเมื่อกล่าวถึง Kaito อีกหนึ่งครั้งหรือไม่?
  • Kaito ให้คะแนนคุณภาพเนื้อหาจริง ๆ หรือเขาชอบความคิดร้อนแรงที่โต้แย้งกัน?

นอกจากข้อมูลทางสังคมแล้ว การอภิปรายเกี่ยวกับเจ้าของข้อมูล ความเป็นส่วนตัว และความ๏ว่างไว้ให้เห็นกำลังร้อนขึ้น ด้วยการเร่งข้ันที่ AI ก้าวหน้าอย่างรวดเร็ว คำถามใหม่เกิดขึ้น: ใครเป็นเจ้าของข้อมูลที่ใช้ในการฝึก AI แบบจำลอง? ใครได้รับประโยชน์จากผลลัพธ์ที่สร้างโดย AI?

คำถามเหล่านี้เป็นตัวเริ่มต้นสำหรับการเกิดขึ้นของชั้นข้อมูล Web3 - การเปลี่ยนแปลงที่เน้นการเป็นเจ้าของข้อมูลแบบผู้ใช้และระบบนิเวศข้อมูลที่กระจาย

การเกิดขึ้นของชั้นข้อมูล

ใน Web3 มีระบบนิเวศขนาดใหญ่ของชั้นข้อมูล โปรโตคอล และโครงสร้างพื้นฐานที่ให้ความสำคัญกับการเป็นเจ้าของข้อมูลส่วนบุคคล - ความคิดเชิงบวกในการให้บุคคลมีควบคุมมากขึ้นเกี่ยวกับข้อมูลของตนเอง พร้อมทางเลือกในการสร้างรายได้จากข้อมูลของตน

1. Vana

@vana's core mission is to give users control over their data, particularly in the context of AI, where data is invaluable for training models.

Vana นำเสนอ DataDAOs ซึ่งเป็นหน่วยงานที่เป็นมูลฐานของชุมชนที่ผู้ใช้รวมข้อมูลของพวกเขาเพื่อประโยชน์ร่วมกัน แต่ละ DataDAO มุ่งเน้นที่ชุดข้อมูลที่เฉพาะ

  • r/datadao: โฟกัสที่ข้อมูลผู้ใช้ Reddit เพื่อให้ผู้ใช้สามารถควบคุมและหารายได้จากการมอบเสนอของพวกเขาได้
  • Volara: จัดการข้อมูล Twitter เพื่อให้ผู้ใช้ได้รับประโยชน์จากกิจกรรมสื่อสังคมของพวกเขา
  • DNA DAO: มีเป้าหมายที่จะบริหารจัดการข้อมูลพันธุกรรมด้วยความเป็นส่วนตัวและการเป็นเจ้าของในใจ

Vana ทำให้ข้อมูลเป็นสินทรัพย์ที่ซื้อขายได้ที่เรียกว่า "DLP" แต่ละ DLP รวมข้อมูลสำหรับโดเมนที่แน่นอน และผู้ใช้สามารถเดิมพันโทเค็นไปยังพูลเหล่านี้เพื่อรับรางวัล โดยที่พูลยอดนิยมได้รับรางวัลโดยอิงตามการสนับสนุนของชุมชนและคุณภาพข้อมูล

สิ่งที่ทำให้ Vana โดดเด่นคือความง่ายในการส่งข้อมูลให้กับผู้ใช้ ผู้ใช้เพียงแค่:

  1. เลือก DataDAO
  2. สรรพาวัตรข้อมูลของพวกเขาโดยตรงผ่านการผสานข้อมูล API หรืออัปโหลดด้วยตนเอง
  3. รับโทเค็น DataDAO และ gate $VANAเป็นรางวัล

2. Ocean Protocol

@oceanprotocolเป็นตลาดข้อมูลที่กระจายอำนาจที่ช่วยให้ผู้ให้บริการข้อมูลสามารถแบ่งปัน ขายหรืออนุญาตให้ข้อมูลของพวกเขาใช้ได้ ในขณะที่ผู้บริโภคเข้าถึงมันสำหรับ AI และการวิจัย

Ocean Protocol ใช้ “datatokens” (โทเค็น ERC-20) เพื่อแสดงสิทธิ์ในการเข้าถึงชุดข้อมูล ทำให้ผู้ให้ข้อมูลสามารถทำกำไรจากข้อมูลของตน พร้อมรักษาการควบคุมเงื่อนไขการเข้าถึง

ประเภทของข้อมูลที่ซื้อขายบน Ocean:

  • ข้อมูลสาธารณะ: ชุดข้อมูลเปิดเช่นข้อมูลสภาพอากาศ ข้อมูลดัชนีประชากรสาธารณะ หรือข้อมูลหุ้นประวัติศาสตร์ - มีค่าสำหรับการฝึกอบรมและการวิจัยด้าน AI
  • ข้อมูลส่วนตัว: บัญชีการแพทย์ ธุรกรรมทางการเงิน ข้อมูลเซ็นเซอร์ IoT หรือข้อมูลผู้ใช้ที่กำหนดเอง - ต้องใช้การควบคุมความเป็นส่วนตัวอย่างเข้มงวด

Compute-to-Data เป็นคุณสมบัติสำคัญอีกอย่างหนึ่งของ Ocean ซึ่งช่วยให้การคำนวณสามารถทำได้บนข้อมูลโดยไม่ต้องย้ายข้อมูล ทำให้มั่นใจได้ในความเป็นส่วนตัวและความปลอดภัยสำหรับชุดข้อมูลที่เป็นข้อมูลที่อ่อนไหว

3. Masa

@getmasafiเน้นการสร้างชั้นเปิดสำหรับข้อมูลการฝึก AI ซัพพลายข้อมูลแบบเรียลไทม์คุณภาพสูง และราคาถูกสำหรับเอเจนต์และนักพัฒนา AI

Masa ได้เปิดใช้งานเน็ตเวิร์กย่อยสองรูปแบบบนเครือข่าย Bittensor:

  • Subnet 42 (SN42): รวมและประมวลผลรายการข้อมูลล้านรายการต่อวัน ซึ่งเป็นรากฐานสำหรับการพัฒนาเอเย่นต์และแอปพลิเคชัน AI
  • Subnet 59 (SN59) – “AI Agent Arena”: สภาพแวดล้อมการแข่งขันที่เชิงประสิทธิภาพที่เอเจนต์ AI ซึ่งได้รับพลังจากข้อมูลแบบเรียลไทม์จาก SN42 แข่งขันเพื่อ $TAOการปล่อยก๊าซเรือนกระจกที่พึงพอใจต่อผลการดำเนินงานเช่นการแบ่งปันความสนใจ, การเข้าร่วมของผู้ใช้งานและการปรับปรุงตนเอง

Masa partnered with @virtuals_ioการทำให้ตัวแทนเสมือนมีความสามารถในการใช้ข้อมูลแบบเรียลไทม์ และยังเปิดตัว gate $TAOCAT, แสดงความสามารถของมัน (ปัจจุบันอยู่บน Binance Alpha)

4. เปิดบัญชี

@OpenledgerHQกำลังสร้างบล็อกเชนที่เหมาะสำหรับข้อมูลโดยเฉพาะอย่างยิ่งสำหรับแอปพลิเคชัน AI และ ML เพื่อให้การจัดการข้อมูลมีความปลอดภัย กระจายได้และสามารถตรวจสอบได้

เนื้อหาสำคัญ:

  • Datanets: เครือข่ายการสร้างข้อมูลที่เชื่อมต่อกับ OpenLedger ที่จัดการและเพิ่มคุณภาพข้อมูลจากโลกจริงสำหรับการประยุกต์ใช้ AI
  • SLMs: โมเดล AI ที่ออกแบบให้เหมาะสำหรับธุรกิจหรือแอปพลิเคชันที่เฉพาะเจาะจง ความคิดคือการ提供โมเดลที่ไม่เพียงแค่มีความแม่นยำมากขึ้นสำหรับกรณีการใช้ที่เฉพาะเจาะจงแต่ยังเป็นไปตามข้อกำหนดเกี่ยวกับความเป็นส่วนตัวและลดความเสี่ยงของความคลาดเคลื่อนที่พบในโมเดลทั่วไป
  • การตรวจสอบข้อมูล: ให้ความแม่นยำและน่าเชื่อถือของข้อมูลที่ใช้สำหรับการฝึกโมเดลภาษาที่เชี่ยวชาญ (SLMs) ซึ่งเป็นที่แม่นยำและเชื่อถือได้สำหรับกรณีการใช้งานที่เฉพาะเจาะจง

ความต้องการข้อมูลสำหรับการฝึกฝน AI

ความต้องการข้อมูลคุณภาพสูงเพื่อใช้เป็นแรงขับเคลื่อน AI และตัวแทนอัตโนมัติกำลังเพิ่มขึ้น นอกเหนือจากการฝึกอบรมเบื้องต้น AI ต้องใช้ข้อมูลแบบเรียลไทม์สำหรับการเรียนรู้และปรับตัวอย่างต่อเนื่อง

ความท้าทายและโอกาสสำคัญ:

  • คุณภาพข้อมูลสำคัญกว่าปริมาณ: โมเดล AI ต้องการข้อมูลที่มีคุณภาพสูง หลากหลายและเกี่ยวข้องเพื่อป้องกันความเอื้ออำนวยหรือประสิทธิภาพที่ต่ำ
  • Data Sovereignty & Privacy: ตามที่เห็นกับ Vana มีการผลักดันให้ข้อมูลที่เป็นเจ้าของเป็นเงิน ซึ่งอาจทำให้เปลี่ยนรูปแบบวิธีการที่ข้อมูลการฝึก AI ได้มา
  • ข้อมูลสังเคราะห์: ด้วยความกังวลเกี่ยวกับความเป็นส่วนตัว ข้อมูลสังเคราะห์กำลังได้รับความสนใจเป็นวิธีในการฝึกโมเดล AI ในขณะที่ลดปัญหาทางจรรยาบรรณ
  • ตลาดข้อมูล: การเติบโตของตลาดข้อมูล (ทั้งในรูปแบบที่มีศูนย์กลางและแบบกระจาย) กำลังสร้างเศรษฐกิจที่ข้อมูลเป็นสินทรัพย์ที่สามารถซื้อขายได้
  • AI สำหรับการจัดการข้อมูล: ปัจจุบันใช้ AI เพื่อจัดการ ทำความสะอาด และเพิ่มประสิทธิภาพของชุดข้อมูล เพิ่มคุณภาพของข้อมูลสำหรับการฝึก AI

เมื่อตัวแทน AI กลายเป็นมีอิสระมากขึ้น ความสามารถในการเข้าถึงและประมวลผลข้อมูลแบบเรียลไทม์คุณภาพสูงจะกำหนดประสิทธิภาพของพวกเขา ความต้องการที่เพิ่มมากขึ้นนี้ทำให้เกิด AI agent-specific data marketplaces ขึ้นมา - ที่ในนั้นทั้งมนุษย์และตัวแทน AI สามารถเข้าถึงข้อมูลตัวแทน AI คุณภาพสูงได้

ตลาดสำหรับข้อมูล Web3 Agents

  • @cookiedotfunรวมข้อมูลเชิงสัญญาณสังคม AI เอเจนต์และเกี่ยวกับโทเค็น โดยแปลงมันเป็นข้อมูลที่นำมาใช้ได้สำหรับเอเจนต์ AI และมนุษย์
  • Cookie DataSwarm API ช่วยให้ตัวแทน AI สามารถเข้าถึงข้อมูลที่มีคุณภาพสูงปัจจุบันสำหรับข้อมูลสำหรับการซื้อขายที่เกี่ยวข้อง - หนึ่งในกรณีการใช้ที่ทุกคนตามหามากที่สุดใน crypto.
  • Cookie มีผู้ใช้เดือนละ 200,000 คนและผู้ใช้วันละ 20,000 คน ทำให้เป็นหนึ่งในตลาดข้อมูลเอเย่นต์ AI ที่ใหญ่ที่สุด $COOKIEที่ศูนย์กลาง

ผู้เล่นหลักอื่นๆ:

  • @GoatIndexAIเน้นในการบ่งชี้ข้อมูลของนิเวศ Solana
  • @Decentralisedcospecializes in niche data dashboards like GitHub repositories & project-specific analytics.

Wrapping up Part 1

นี่เพียงเริ่มต้นเท่านั้น ส่วนที่ 2 จะลงลึกไปยัง:

  • ความท้าทายและโอกาสที่กำลังเปลี่ยนแปลงในเศรษฐกิจข้อมูล
  • บทบาทของข้อมูลสังเคราะห์ในการฝึกฝน AI
  • ความกังวลเกี่ยวกับความเป็นส่วนตัวของข้อมูลและวิธีการจัดการกับมัน
  • อนาคตของการฝึกอบรม AI แบบกระจาย

ใครควบคุมข้อมูลก็จะเป็นผู้กำหนดอนาคต และโครงการที่กำลังพัฒนาภายในกลุ่มนี้จะกำหนดว่าข้อมูลคือของใคร เป็นข้อมูลที่ถูกแบ่งปันและมีการกำหนดราคาในยุค AI ซึ่งในขณะเดียวกัน ความต้องการข้อมูลคุณภาพสูงยังคงเติบโตอย่างต่อเนื่อง การแข่งขันเพื่อสร้างเครื่องกำหนดราคาข้อมูลที่โปร่งใสมากขึ้นและเป็นของผู้ใช้เองกำลังเพิ่มมากขึ้นอย่างต่อเนื่อง

รอติดตามส่วนที่ 2!

บันทึกส่วนบุคคล: ขอบคุณที่อ่านนะคะ! ถ้าคุณอยู่ใน Crypto AI และต้องการเชื่อมต่อ กรุณาติดต่อผมได้เลยครับ

หากคุณต้องการนำเสนอโครงการโปรดใช้แบบฟอร์มในไบโอของฉัน - มันจะได้รับความสำคัญกว่า DMs

ข้อความปลอดความรับผิดชอบ: เอกสารนี้มีจุดประสงค์เพื่อการให้ข้อมูลและความบันเทิงเท่านั้น มุมมองที่แสดงในเอกสารนี้ไม่ใช่และไม่ควรถือเป็นการให้คำแนะนำทางด้านการลงทุน ผู้รับเอกสารนี้ควรดำเนินการค้นคว้าข้อมูลอย่างถี่ถ้วนโดยพิจารณาถึงสถานการณ์ทางการเงินของตนเองวัตถุประสงค์ในการลงทุนและความอดทนต่อความเสี่ยง (ซึ่งไม่ได้พิจารณาในเอกสารนี้) ก่อนการลงทุน เอกสารนี้ไม่ใช่ข้อเสนอ หรือการขอรับข้อเสนอให้ซื้อหรือขายทรัพย์สินใดที่ถูกกล่าวถึงในเอกสาร

คำประกาศปฏิเสธความรับผิดชอบ:

  1. บทความนี้ถูกนำเข้ามาจากX. ลิขสิทธิ์เป็นของผู้เขียนต้นฉบับ [@Defi0xJeff]. If there are any objections to the reproduction, please contact thegate Learn Team, และทีมจะดำเนินการตามขั้นตอนที่เกี่ยวข้อง
  2. คำประกาศความรับผิด: มุมมองและความคิดเห็นที่แสดงในบทความนี้เป็นเพียงของผู้เขียนเท่านั้น และไม่เป็นที่ปรึกษาด้านการลงทุน
  3. ทีม gate แลร์นแปลบทความเป็นภาษาอื่น ๆ การคัดลอก การแจกจ่ายหรือการลอกเลียนแบบบทความที่ถูกแปลนั้นห้ามหากไม่ได้กล่าวถึง

ข้อมูลของฉันไม่ใช่ของฉัน: การเกิดของชั้นข้อมูล

กลาง2/10/2025, 4:24:36 AM
การพูดคุยเกี่ยวกับความเป็นเจ้าของข้อมูลและความเป็นส่วนตัวได้เพิ่มขึ้น โปรโตคอลข้อมูล Web3 เช่น Vana, Ocean Protocol และ Masa กำลังเกิดขึ้น ส่งเสริมความเป็นระบบสมบูรณ์ของข้อมูลแบบกระจายและทำให้ผู้ใช้สามารถควบคุมและทำให้ได้รายได้จากข้อมูลของตนเองได้อย่างเฉพาะอย่างยิ่งในการฝึกอบรม AI และการรับข้อมูลแบบเรียลไทม์ โปรโตคอลเหล่านี้นำเสนอวิธีการซื้อขายข้อมูลและการป้องกันความเป็นส่วนตัวที่ใหม่ จึงสามารถตอบสนองความต้องการข้อมูลที่มีคุณภาพสูงที่เพิ่มขึ้น

ข้อมูลคือทองคำดิจิทัลในยุคนี้ที่ความสนใจเป็นออนไลน์ ในปี 2024 เวลาที่ใช้บนหน้าจอโลกเฉลี่ยอยู่ที่ 6 ชั่วโมง 40 นาทีต่อวัน มีการเพิ่มขึ้นจากปีก่อนหน้า ในสหรัฐอเมริกา เวลาเฉลี่ยสูงกว่าอีกทีที่ 7 ชั่วโมง 3 นาทีต่อวัน

ด้วยระดับความชุ่มชื่นนี้ ปริมาณข้อมูลที่สร้างขึ้นเป็นเรื่อย ๆ ทำให้น่าตื่นตาตื่นใจ - มีการสร้างข้อมูลอยู่ 328.77 ล้านเทระไบต์ต่อวันในปี 2024 นั่นคือประมาณ 0.4 เซตตะไบต์ต่อวันเมื่อพิจารณาข้อมูลที่สร้างใหม่ทั้งหมดที่ถูกแยกออก ถูกคัดลอก หรือถูกบรรจุไว้

แต่ถึงกระทั้งจำนวนมากของข้อมูลที่ถูกสร้างและใช้งานในแต่ละวันก็เป็นจำนวนมาก ผู้ใช้เกือบไม่เป็นเจ้าของข้อมูลเลย:

  • สื่อสังคม: ข้อมูลบนแพลตฟอร์มเช่น Twitter, Instagram และอื่นๆ เป็นสิทธิ์ของบริษัทที่ควบคุม ถึงแม้ว่าผู้ใช้จะสร้างข้อมูล
  • Internet of Things (IoT): ข้อมูลจากอุปกรณ์ฉลาดมักเป็นของผู้ผลิตอุปกรณ์หรือผู้ให้บริการบริการ นอกจากนี้แล้ว หากไม่มีข้อตกลงเฉพาะระบุ
  • ข้อมูลสุขภาพ: ในขณะที่บุคคลมีสิทธิ์เกี่ยวกับบันทึกการรักษาของพวกเขา แต่ข้อมูลที่มาจากแอปพลิเคชันสุขภาพหรืออุปกรณ์สวมใส่ใช้งานได้ถูกควบคุมโดยบริษัทที่ให้บริการเหล่านั้น

ข้อมูลเกี่ยวกับสกุลเงินดิจิทัลและข้อมูลสังคม

ในโลกคริปโตเราเห็นการเจริญขึ้นของ @_kaitoai, ซึ่งดัชนีข้อมูลทางสังคมบนทวิตเตอร์และแปลงมันเป็นข้อมูลที่สามารถดำเนินการได้สำหรับโครงการ บุคคลสำคัญในวงการ และผู้นำทางความคิด คำว่า 'yap' และ 'mindshare' ได้รับความนิยมจากทีม Kaito เนื่องจากความเชี่ยวชาญในการเจริญเติบโต (ด้วยแดชบอร์ด mindshare & yapper ที่ได้รับความนิยม) และความสามารถในการดึงดูดความสนใจโดยอินทรีย์บน Crypto Twitter

“Yap” มีเป้าหมายที่จะให้สิ่งสร้างสรรค์เนื้อหาคุณภาพบนทวิตเตอร์โดยให้คำถามหลายอย่างที่ยังคงไม่ได้รับคำตอบ:

  • วิธีการคะแนน 'แย็ป' อย่างแม่นยำเป็นอย่างไร?
  • คุณได้รับเยบเมื่อกล่าวถึง Kaito อีกหนึ่งครั้งหรือไม่?
  • Kaito ให้คะแนนคุณภาพเนื้อหาจริง ๆ หรือเขาชอบความคิดร้อนแรงที่โต้แย้งกัน?

นอกจากข้อมูลทางสังคมแล้ว การอภิปรายเกี่ยวกับเจ้าของข้อมูล ความเป็นส่วนตัว และความ๏ว่างไว้ให้เห็นกำลังร้อนขึ้น ด้วยการเร่งข้ันที่ AI ก้าวหน้าอย่างรวดเร็ว คำถามใหม่เกิดขึ้น: ใครเป็นเจ้าของข้อมูลที่ใช้ในการฝึก AI แบบจำลอง? ใครได้รับประโยชน์จากผลลัพธ์ที่สร้างโดย AI?

คำถามเหล่านี้เป็นตัวเริ่มต้นสำหรับการเกิดขึ้นของชั้นข้อมูล Web3 - การเปลี่ยนแปลงที่เน้นการเป็นเจ้าของข้อมูลแบบผู้ใช้และระบบนิเวศข้อมูลที่กระจาย

การเกิดขึ้นของชั้นข้อมูล

ใน Web3 มีระบบนิเวศขนาดใหญ่ของชั้นข้อมูล โปรโตคอล และโครงสร้างพื้นฐานที่ให้ความสำคัญกับการเป็นเจ้าของข้อมูลส่วนบุคคล - ความคิดเชิงบวกในการให้บุคคลมีควบคุมมากขึ้นเกี่ยวกับข้อมูลของตนเอง พร้อมทางเลือกในการสร้างรายได้จากข้อมูลของตน

1. Vana

@vana's core mission is to give users control over their data, particularly in the context of AI, where data is invaluable for training models.

Vana นำเสนอ DataDAOs ซึ่งเป็นหน่วยงานที่เป็นมูลฐานของชุมชนที่ผู้ใช้รวมข้อมูลของพวกเขาเพื่อประโยชน์ร่วมกัน แต่ละ DataDAO มุ่งเน้นที่ชุดข้อมูลที่เฉพาะ

  • r/datadao: โฟกัสที่ข้อมูลผู้ใช้ Reddit เพื่อให้ผู้ใช้สามารถควบคุมและหารายได้จากการมอบเสนอของพวกเขาได้
  • Volara: จัดการข้อมูล Twitter เพื่อให้ผู้ใช้ได้รับประโยชน์จากกิจกรรมสื่อสังคมของพวกเขา
  • DNA DAO: มีเป้าหมายที่จะบริหารจัดการข้อมูลพันธุกรรมด้วยความเป็นส่วนตัวและการเป็นเจ้าของในใจ

Vana ทำให้ข้อมูลเป็นสินทรัพย์ที่ซื้อขายได้ที่เรียกว่า "DLP" แต่ละ DLP รวมข้อมูลสำหรับโดเมนที่แน่นอน และผู้ใช้สามารถเดิมพันโทเค็นไปยังพูลเหล่านี้เพื่อรับรางวัล โดยที่พูลยอดนิยมได้รับรางวัลโดยอิงตามการสนับสนุนของชุมชนและคุณภาพข้อมูล

สิ่งที่ทำให้ Vana โดดเด่นคือความง่ายในการส่งข้อมูลให้กับผู้ใช้ ผู้ใช้เพียงแค่:

  1. เลือก DataDAO
  2. สรรพาวัตรข้อมูลของพวกเขาโดยตรงผ่านการผสานข้อมูล API หรืออัปโหลดด้วยตนเอง
  3. รับโทเค็น DataDAO และ gate $VANAเป็นรางวัล

2. Ocean Protocol

@oceanprotocolเป็นตลาดข้อมูลที่กระจายอำนาจที่ช่วยให้ผู้ให้บริการข้อมูลสามารถแบ่งปัน ขายหรืออนุญาตให้ข้อมูลของพวกเขาใช้ได้ ในขณะที่ผู้บริโภคเข้าถึงมันสำหรับ AI และการวิจัย

Ocean Protocol ใช้ “datatokens” (โทเค็น ERC-20) เพื่อแสดงสิทธิ์ในการเข้าถึงชุดข้อมูล ทำให้ผู้ให้ข้อมูลสามารถทำกำไรจากข้อมูลของตน พร้อมรักษาการควบคุมเงื่อนไขการเข้าถึง

ประเภทของข้อมูลที่ซื้อขายบน Ocean:

  • ข้อมูลสาธารณะ: ชุดข้อมูลเปิดเช่นข้อมูลสภาพอากาศ ข้อมูลดัชนีประชากรสาธารณะ หรือข้อมูลหุ้นประวัติศาสตร์ - มีค่าสำหรับการฝึกอบรมและการวิจัยด้าน AI
  • ข้อมูลส่วนตัว: บัญชีการแพทย์ ธุรกรรมทางการเงิน ข้อมูลเซ็นเซอร์ IoT หรือข้อมูลผู้ใช้ที่กำหนดเอง - ต้องใช้การควบคุมความเป็นส่วนตัวอย่างเข้มงวด

Compute-to-Data เป็นคุณสมบัติสำคัญอีกอย่างหนึ่งของ Ocean ซึ่งช่วยให้การคำนวณสามารถทำได้บนข้อมูลโดยไม่ต้องย้ายข้อมูล ทำให้มั่นใจได้ในความเป็นส่วนตัวและความปลอดภัยสำหรับชุดข้อมูลที่เป็นข้อมูลที่อ่อนไหว

3. Masa

@getmasafiเน้นการสร้างชั้นเปิดสำหรับข้อมูลการฝึก AI ซัพพลายข้อมูลแบบเรียลไทม์คุณภาพสูง และราคาถูกสำหรับเอเจนต์และนักพัฒนา AI

Masa ได้เปิดใช้งานเน็ตเวิร์กย่อยสองรูปแบบบนเครือข่าย Bittensor:

  • Subnet 42 (SN42): รวมและประมวลผลรายการข้อมูลล้านรายการต่อวัน ซึ่งเป็นรากฐานสำหรับการพัฒนาเอเย่นต์และแอปพลิเคชัน AI
  • Subnet 59 (SN59) – “AI Agent Arena”: สภาพแวดล้อมการแข่งขันที่เชิงประสิทธิภาพที่เอเจนต์ AI ซึ่งได้รับพลังจากข้อมูลแบบเรียลไทม์จาก SN42 แข่งขันเพื่อ $TAOการปล่อยก๊าซเรือนกระจกที่พึงพอใจต่อผลการดำเนินงานเช่นการแบ่งปันความสนใจ, การเข้าร่วมของผู้ใช้งานและการปรับปรุงตนเอง

Masa partnered with @virtuals_ioการทำให้ตัวแทนเสมือนมีความสามารถในการใช้ข้อมูลแบบเรียลไทม์ และยังเปิดตัว gate $TAOCAT, แสดงความสามารถของมัน (ปัจจุบันอยู่บน Binance Alpha)

4. เปิดบัญชี

@OpenledgerHQกำลังสร้างบล็อกเชนที่เหมาะสำหรับข้อมูลโดยเฉพาะอย่างยิ่งสำหรับแอปพลิเคชัน AI และ ML เพื่อให้การจัดการข้อมูลมีความปลอดภัย กระจายได้และสามารถตรวจสอบได้

เนื้อหาสำคัญ:

  • Datanets: เครือข่ายการสร้างข้อมูลที่เชื่อมต่อกับ OpenLedger ที่จัดการและเพิ่มคุณภาพข้อมูลจากโลกจริงสำหรับการประยุกต์ใช้ AI
  • SLMs: โมเดล AI ที่ออกแบบให้เหมาะสำหรับธุรกิจหรือแอปพลิเคชันที่เฉพาะเจาะจง ความคิดคือการ提供โมเดลที่ไม่เพียงแค่มีความแม่นยำมากขึ้นสำหรับกรณีการใช้ที่เฉพาะเจาะจงแต่ยังเป็นไปตามข้อกำหนดเกี่ยวกับความเป็นส่วนตัวและลดความเสี่ยงของความคลาดเคลื่อนที่พบในโมเดลทั่วไป
  • การตรวจสอบข้อมูล: ให้ความแม่นยำและน่าเชื่อถือของข้อมูลที่ใช้สำหรับการฝึกโมเดลภาษาที่เชี่ยวชาญ (SLMs) ซึ่งเป็นที่แม่นยำและเชื่อถือได้สำหรับกรณีการใช้งานที่เฉพาะเจาะจง

ความต้องการข้อมูลสำหรับการฝึกฝน AI

ความต้องการข้อมูลคุณภาพสูงเพื่อใช้เป็นแรงขับเคลื่อน AI และตัวแทนอัตโนมัติกำลังเพิ่มขึ้น นอกเหนือจากการฝึกอบรมเบื้องต้น AI ต้องใช้ข้อมูลแบบเรียลไทม์สำหรับการเรียนรู้และปรับตัวอย่างต่อเนื่อง

ความท้าทายและโอกาสสำคัญ:

  • คุณภาพข้อมูลสำคัญกว่าปริมาณ: โมเดล AI ต้องการข้อมูลที่มีคุณภาพสูง หลากหลายและเกี่ยวข้องเพื่อป้องกันความเอื้ออำนวยหรือประสิทธิภาพที่ต่ำ
  • Data Sovereignty & Privacy: ตามที่เห็นกับ Vana มีการผลักดันให้ข้อมูลที่เป็นเจ้าของเป็นเงิน ซึ่งอาจทำให้เปลี่ยนรูปแบบวิธีการที่ข้อมูลการฝึก AI ได้มา
  • ข้อมูลสังเคราะห์: ด้วยความกังวลเกี่ยวกับความเป็นส่วนตัว ข้อมูลสังเคราะห์กำลังได้รับความสนใจเป็นวิธีในการฝึกโมเดล AI ในขณะที่ลดปัญหาทางจรรยาบรรณ
  • ตลาดข้อมูล: การเติบโตของตลาดข้อมูล (ทั้งในรูปแบบที่มีศูนย์กลางและแบบกระจาย) กำลังสร้างเศรษฐกิจที่ข้อมูลเป็นสินทรัพย์ที่สามารถซื้อขายได้
  • AI สำหรับการจัดการข้อมูล: ปัจจุบันใช้ AI เพื่อจัดการ ทำความสะอาด และเพิ่มประสิทธิภาพของชุดข้อมูล เพิ่มคุณภาพของข้อมูลสำหรับการฝึก AI

เมื่อตัวแทน AI กลายเป็นมีอิสระมากขึ้น ความสามารถในการเข้าถึงและประมวลผลข้อมูลแบบเรียลไทม์คุณภาพสูงจะกำหนดประสิทธิภาพของพวกเขา ความต้องการที่เพิ่มมากขึ้นนี้ทำให้เกิด AI agent-specific data marketplaces ขึ้นมา - ที่ในนั้นทั้งมนุษย์และตัวแทน AI สามารถเข้าถึงข้อมูลตัวแทน AI คุณภาพสูงได้

ตลาดสำหรับข้อมูล Web3 Agents

  • @cookiedotfunรวมข้อมูลเชิงสัญญาณสังคม AI เอเจนต์และเกี่ยวกับโทเค็น โดยแปลงมันเป็นข้อมูลที่นำมาใช้ได้สำหรับเอเจนต์ AI และมนุษย์
  • Cookie DataSwarm API ช่วยให้ตัวแทน AI สามารถเข้าถึงข้อมูลที่มีคุณภาพสูงปัจจุบันสำหรับข้อมูลสำหรับการซื้อขายที่เกี่ยวข้อง - หนึ่งในกรณีการใช้ที่ทุกคนตามหามากที่สุดใน crypto.
  • Cookie มีผู้ใช้เดือนละ 200,000 คนและผู้ใช้วันละ 20,000 คน ทำให้เป็นหนึ่งในตลาดข้อมูลเอเย่นต์ AI ที่ใหญ่ที่สุด $COOKIEที่ศูนย์กลาง

ผู้เล่นหลักอื่นๆ:

  • @GoatIndexAIเน้นในการบ่งชี้ข้อมูลของนิเวศ Solana
  • @Decentralisedcospecializes in niche data dashboards like GitHub repositories & project-specific analytics.

Wrapping up Part 1

นี่เพียงเริ่มต้นเท่านั้น ส่วนที่ 2 จะลงลึกไปยัง:

  • ความท้าทายและโอกาสที่กำลังเปลี่ยนแปลงในเศรษฐกิจข้อมูล
  • บทบาทของข้อมูลสังเคราะห์ในการฝึกฝน AI
  • ความกังวลเกี่ยวกับความเป็นส่วนตัวของข้อมูลและวิธีการจัดการกับมัน
  • อนาคตของการฝึกอบรม AI แบบกระจาย

ใครควบคุมข้อมูลก็จะเป็นผู้กำหนดอนาคต และโครงการที่กำลังพัฒนาภายในกลุ่มนี้จะกำหนดว่าข้อมูลคือของใคร เป็นข้อมูลที่ถูกแบ่งปันและมีการกำหนดราคาในยุค AI ซึ่งในขณะเดียวกัน ความต้องการข้อมูลคุณภาพสูงยังคงเติบโตอย่างต่อเนื่อง การแข่งขันเพื่อสร้างเครื่องกำหนดราคาข้อมูลที่โปร่งใสมากขึ้นและเป็นของผู้ใช้เองกำลังเพิ่มมากขึ้นอย่างต่อเนื่อง

รอติดตามส่วนที่ 2!

บันทึกส่วนบุคคล: ขอบคุณที่อ่านนะคะ! ถ้าคุณอยู่ใน Crypto AI และต้องการเชื่อมต่อ กรุณาติดต่อผมได้เลยครับ

หากคุณต้องการนำเสนอโครงการโปรดใช้แบบฟอร์มในไบโอของฉัน - มันจะได้รับความสำคัญกว่า DMs

ข้อความปลอดความรับผิดชอบ: เอกสารนี้มีจุดประสงค์เพื่อการให้ข้อมูลและความบันเทิงเท่านั้น มุมมองที่แสดงในเอกสารนี้ไม่ใช่และไม่ควรถือเป็นการให้คำแนะนำทางด้านการลงทุน ผู้รับเอกสารนี้ควรดำเนินการค้นคว้าข้อมูลอย่างถี่ถ้วนโดยพิจารณาถึงสถานการณ์ทางการเงินของตนเองวัตถุประสงค์ในการลงทุนและความอดทนต่อความเสี่ยง (ซึ่งไม่ได้พิจารณาในเอกสารนี้) ก่อนการลงทุน เอกสารนี้ไม่ใช่ข้อเสนอ หรือการขอรับข้อเสนอให้ซื้อหรือขายทรัพย์สินใดที่ถูกกล่าวถึงในเอกสาร

คำประกาศปฏิเสธความรับผิดชอบ:

  1. บทความนี้ถูกนำเข้ามาจากX. ลิขสิทธิ์เป็นของผู้เขียนต้นฉบับ [@Defi0xJeff]. If there are any objections to the reproduction, please contact thegate Learn Team, และทีมจะดำเนินการตามขั้นตอนที่เกี่ยวข้อง
  2. คำประกาศความรับผิด: มุมมองและความคิดเห็นที่แสดงในบทความนี้เป็นเพียงของผู้เขียนเท่านั้น และไม่เป็นที่ปรึกษาด้านการลงทุน
  3. ทีม gate แลร์นแปลบทความเป็นภาษาอื่น ๆ การคัดลอก การแจกจ่ายหรือการลอกเลียนแบบบทความที่ถูกแปลนั้นห้ามหากไม่ได้กล่าวถึง
今すぐ始める
登録して、
$100
のボーナスを獲得しよう!