Mis datos no son MINE: la aparición de capas de datos

2/10/2025, 4:24:36 AM

Intermedio

Las discusiones en torno a la propiedad de los datos y la privacidad se han intensificado. Han surgido protocolos de datos de Web3 como Vana, Ocean Protocol y Masa, impulsando la soberanía de datos descentralizados y permitiendo a los usuarios controlar y monetizar sus datos, especialmente en el entrenamiento de IA y la adquisición de datos en tiempo real. Estos protocolos ofrecen nuevas soluciones para el comercio de datos y la protección de la privacidad, abordando la creciente demanda de datos de alta calidad.

Los datos son el oro digital en esta era donde la atención está en línea. El tiempo promedio de pantalla a nivel global en 2024 es de 6 horas y 40 minutos al día, un aumento con respecto a años anteriores. En Estados Unidos, el promedio es aún mayor, con 7 horas y 3 minutos diarios.

Con este nivel de compromiso, el volumen de datos generado es asombroso: 328.77 millones de terabytes se crean cada día en 2024. Eso equivale aproximadamente a 0.4 zettabytes (ZB) al día si se consideran todos los datos recién generados, capturados, copiados o consumidos.

Sin embargo, a pesar de la enorme cantidad de datos que se producen y consumen a diario, los usuarios poseen muy poco de ellos:

Redes Sociales: Los datos en plataformas como Twitter, Instagram y otras son controlados por las empresas, aunque los usuarios los generan.
Internet de las cosas (IoT): Los datos de los dispositivos inteligentes generalmente pertenecen al fabricante del dispositivo o al proveedor de servicios, a menos que se indique lo contrario en acuerdos específicos.
Datos de salud: Si bien las personas tienen derechos sobre sus registros médicos, gran parte de los datos de las aplicaciones de salud o dispositivos portátiles están controlados por las empresas que brindan esos servicios.

Crypto y Datos Sociales

En cripto, hemos visto el surgimiento de @_kaitoai, que indexa datos sociales en Twitter y los traduce en datos de sentimiento accionables para proyectos, KOLs y líderes de pensamiento. Las palabras 'yap' y 'mindshare' se popularizaron por el equipo de Kaito debido a su experiencia en growth hacking (con sus populares paneles de mindshare y yapper) y su capacidad para atraer interés orgánico en Crypto Twitter.

“Yap” tiene como objetivo incentivar la creación de contenido de calidad en Twitter, pero muchas preguntas siguen sin respuesta:

¿Cómo se puntúan exactamente los yaps?
¿Obtienes yap adicional por mencionar a Kaito?
¿Kaito recompensa verdaderamente el contenido de calidad, o favorece opiniones controvertidas y polémicas?

Más allá de los datos sociales, las discusiones sobre la propiedad de los datos, la privacidad y la transparencia se están intensificando. Con el avance rápido de la IA, surgen nuevas preguntas: ¿Quién es dueño de los datos utilizados para entrenar los modelos de IA? ¿Quién se beneficia de los resultados generados por la IA?

Estas preguntas sientan las bases para el surgimiento de las capas de datos de Web3, un cambio hacia ecosistemas de datos descentralizados y propiedad del usuario.

La Emergencia de Capas de Datos

En Web3, hay un creciente ecosistema de capas de datos, protocolos e infraestructura enfocada en habilitar la soberanía de datos personales, la idea de dar a las personas más control sobre sus datos, con opciones para monetizarlos.

1. Vana

@vana's core mission is to give users control over their data, particularly in the context of AI, where data is invaluable for training models.

Vana presenta DataDAOs, entidades impulsadas por la comunidad donde los usuarios agrupan sus datos para beneficio colectivo. Cada DataDAO se enfoca en un conjunto de datos específico:

r/datadao: Se enfoca en los datos de los usuarios de Reddit, permitiendo a los usuarios controlar y monetizar sus contribuciones.
Volara: Trabaja con datos de Twitter, permitiendo a los usuarios beneficiarse de su actividad en las redes sociales.
DNA DAO: Con el objetivo de gestionar datos genéticos teniendo en cuenta la privacidad y la propiedad.

Vana tokenizes data into a tradable asset called “DLP.” Each DLP aggregates data for a specific domain, and users can stake tokens to these pools for rewards, with the top pools being rewarded based on community support and data quality.

Lo que hace que Vana se destaque es su facilidad para contribuir datos. Los usuarios simplemente:

Selecciona un DataDAO
Comparta sus datos directamente a través de la integración de API o cárguelos manualmente
Gana tokens DataDAO y $VANAcomo recompensas

2. Protocolo Ocean

@oceanprotocoles un mercado de datos descentralizado que permite a los proveedores de datos compartir, vender o conceder licencias de sus datos, mientras que los consumidores acceden a ellos para la inteligencia artificial y la investigación.

Ocean Protocol utiliza "datatokens" (tokens ERC-20) para representar los derechos de acceso a conjuntos de datos, permitiendo a los proveedores de datos monetizar sus datos manteniendo el control sobre las condiciones de acceso.

Tipos de datos negociados en Ocean:

Datos Públicos: Conjuntos de datos abiertos como información meteorológica, datos demográficos públicos o datos históricos de acciones, valiosos para el entrenamiento e investigación de IA.
Datos privados: registros médicos, transacciones financieras, datos de sensores IoT o datos de usuario personalizados—requiere controles estrictos de privacidad.

Compute-to-Data es otra característica clave de Ocean, que permite realizar cálculos en los datos sin moverlos, garantizando la privacidad y seguridad de conjuntos de datos sensibles.

3. Masa

@getmasafise enfoca en crear una capa abierta para los datos de entrenamiento de IA, suministrando datos en tiempo real, de alta calidad y bajo costo para los agentes y desarrolladores de IA.

Masa ha lanzado dos subredes en la red Bittensor:

Subred 42 (SN42): Agrega y procesa millones de registros de datos diariamente, sirviendo como base para el desarrollo de agentes de IA y aplicaciones.
Subred 59 (SN59) - "AI Agent Arena": Un entorno competitivo donde los agentes de IA, impulsados por datos en tiempo real de SN42, compiten por$TAOemisiones basadas en métricas de rendimiento como la cuota de mercado, la participación de los usuarios y la automejora.

Masa se asoció con @virtuals_io, potenciando a los agentes virtuales con capacidades de datos en tiempo real. También lanzó $TAOCAT, mostrando sus capacidades (actualmente en Binance Alpha).

4. Open Ledger

@OpenledgerHQestá construyendo una cadena de bloques especialmente diseñada para datos, especialmente para aplicaciones de IA y ML, garantizando una gestión segura, descentralizada y verificable de datos.

Aspectos destacados:

Datanets: Redes especializadas de obtención de datos dentro de OpenLedger que recopilan y enriquecen datos del mundo real para aplicaciones de IA.
SLMs: modelos de IA adaptados para industrias o aplicaciones específicas. La idea es proporcionar modelos que no solo sean más precisos para casos de uso de nicho, sino también cumplan con la privacidad y sean menos propensos a los sesgos encontrados en modelos de propósito general
Verificación de datos: asegura la precisión y confiabilidad de los datos utilizados para entrenar modelos de lenguaje especializados (SLMs) que son precisos y confiables para casos de uso específicos.

La demanda de datos para el entrenamiento de IA

La demanda de datos de alta calidad para impulsar la inteligencia artificial y los agentes autónomos está aumentando. Más allá del entrenamiento inicial, los agentes de inteligencia artificial requieren datos en tiempo real para un aprendizaje y adaptación continuos.

Desafíos clave & oportunidades:

Calidad de datos sobre cantidad: los modelos de IA requieren datos de alta calidad, diversos y relevantes para evitar sesgos o un rendimiento deficiente.
Soberanía de datos y privacidad: Como se ha visto con Vana, hay un impulso para la monetización de datos propiedad del usuario, lo que podría remodelar la forma en que se obtienen los datos de entrenamiento de IA.
Datos sintéticos: con las preocupaciones de privacidad, los datos sintéticos están ganando terreno como una forma de entrenar modelos de IA mientras se mitigan problemas éticos.
Mercado de datos: El auge de los mercados de datos (centralizados y descentralizados) está creando una economía donde los datos son un activo negociable.
AI para la gestión de datos: AI ahora se utiliza para gestionar, limpiar y mejorar conjuntos de datos, mejorando la calidad de los datos para el entrenamiento de AI.

A medida que los agentes de IA se vuelven más autónomos, su capacidad para acceder y procesar datos en tiempo real de alta calidad determinará su eficacia. Esta creciente demanda ha llevado al surgimiento de mercados de datos específicos para agentes de IA, donde tanto humanos como agentes de IA pueden acceder a datos de agentes de IA de alta calidad.

Mercado para datos de agentes Web3

@cookiedotfunagrega el sentimiento social del agente de IA & los datos relacionados con tokens, transformándolos en ideas accionables para agentes humanos y de IA.
La API de Cookie DataSwarm permite que los agentes de IA accedan a datos actuales y de alta calidad para obtener información relacionada con el trading, uno de los casos de uso más buscados en cripto.
Cookie cuenta con 200K MAU y 20K DAU, lo que la convierte en uno de los mayores mercados de datos de agentes de IA, con $COOKIEen el centro.

Otros actores clave:

@GoatIndexAIse centra en las perspectivas del ecosistema de Solana.
@Decentralisedcose especializa en paneles de datos de nicho como repositorios de GitHub y analíticas específicas del proyecto.

Finalizando la Parte 1

Esto es solo el comienzo. La Parte 2 se adentrará más en:

Los desafíos y oportunidades en constante evolución en la economía de datos
El papel de los datos sintéticos en el entrenamiento de IA
Preocupaciones sobre la privacidad de los datos y cómo se están abordando
El futuro del entrenamiento de IA descentralizado

Quien controle los datos dará forma al futuro, y los proyectos que se desarrollen dentro de este sector definirán cómo se poseen, comparten y monetizan los datos en la era de la IA. A medida que la demanda de datos de alta calidad continúa creciendo, la carrera por crear una economía de datos más transparente y propiedad de los usuarios recién comienza a despegar.

¡Manténganse atentos para la Parte 2!

Nota personal: ¡Gracias por leer! Si estás en Crypto AI y quieres conectarte, siéntete libre de enviarme un mensaje directo.

Si quieres presentar un proyecto, utiliza el formulario en mi biografía, tiene prioridad sobre los mensajes directos.

Aviso completo: Este documento tiene como objetivo proporcionar información y entretenimiento solamente. Las opiniones expresadas en este documento no deben ser interpretadas como asesoramiento o recomendaciones de inversión. Los destinatarios de este documento deben realizar su debida diligencia, teniendo en cuenta sus circunstancias financieras específicas, objetivos de inversión y tolerancia al riesgo (que no se consideran en este documento) antes de invertir. Este documento no es una oferta, ni la solicitud de una oferta, para comprar o vender cualquiera de los activos mencionados en el mismo.

Descargo de responsabilidad:

Este artículo es reproducido deX. El copyright pertenece al autor original [@Defi0xJeff]. Si hay alguna objeción a la reproducción, por favor contáctenos.gate Learn Team, y el equipo lo procesará según los procedimientos correspondientes.
Descargo de responsabilidad sobre la responsabilidad: Las opiniones expresadas en este artículo son únicamente las del autor y no constituyen asesoramiento de inversión.
El equipo de Aprendizaje de gate ha traducido el artículo a otros idiomas. Está prohibido copiar, distribuir o plagiar los artículos traducidos a menos que se mencione.

Contenido

Datos criptográficos y sociales

La Emergencia de las Capas de Datos

1. Vana

2. Ocean Protocol

3. Masa

4. Libro Mayor Abierto

La demanda de datos para el entrenamiento de IA

Mercado para Datos de Agentes Web3

Finalizando la parte 1

Calendario cripto

Encuentro en Abu Dhabi

Helium organizará el evento de networking Helium House el 10 de diciembre en Abu Dhabi, posicionado como un preludio a la conferencia Solana Breakpoint programada para el 11 al 13 de diciembre. La reunión de un día se centrará en el networking profesional, el intercambio de ideas y las discusiones comunitarias dentro del ecosistema Helium.

HNT

-0.85%

2025-12-09

Actualización de Hayabusa

VeChain ha revelado planes para la actualización Hayabusa, programada para diciembre. Esta actualización tiene como objetivo mejorar significativamente tanto el rendimiento del protocolo como la tokenómica, marcando lo que el equipo llama la versión más centrada en la utilidad de VeChain hasta la fecha.

VET

-3.53%

2025-12-27

Atardeceres de Litewallet

La Fundación Litecoin ha anunciado que la aplicación Litewallet se retirará oficialmente el 31 de diciembre. La aplicación ya no se mantiene activamente, con solo correcciones de errores críticas abordadas hasta esa fecha. El chat de soporte también se descontinuará después de este plazo. Se alienta a los usuarios a hacer la transición a Billetera Nexus, con herramientas de migración y una guía paso a paso proporcionadas dentro de Litewallet.

LTC

-1.1%

2025-12-30

La migración de tokens OM finaliza

MANTRA Chain emitió un recordatorio para que los usuarios migraran sus tokens OM a la mainnet de MANTRA Chain antes del 15 de enero. La migración asegura la participación continua en el ecosistema mientras $OM se transfiere a su cadena nativa.

-4.32%

2026-01-14

Cambio de precio de CSM

Hedera ha anunciado que a partir de enero de 2026, la tarifa fija en USD para el servicio ConsensusSubmitMessage aumentará de $0.0001 a $0.0008.

HBAR

-2.94%

2026-01-27