Мои данные не мои: появление слоев данных

Средний2/10/2025, 4:24:36 AM
Обсуждения вокруг владения данными и конфиденциальности усилились. Появляются протоколы данных Web3, такие как Vana, Ocean Protocol и Masa, способствующие децентрализованному владению данными и позволяющие пользователям контролировать и монетизировать свои данные, особенно в области обучения и получения данных в режиме реального времени в области искусственного интеллекта. Эти протоколы предлагают новые решения для торговли данными и защиты конфиденциальности, отвечая растущему спросу на данные высокого качества.

Данные - это цифровое золото в этом веке, когда внимание находится в онлайне. Среднее глобальное время просмотра экрана в 2024 году составляет 6 часов и 40 минут в день, что является увеличением по сравнению с предыдущими годами. В Соединенных Штатах среднее время еще выше и составляет 7 часов и 3 минуты в день.

С таким уровнем вовлеченности объем создаваемых данных поражает - в 2024 году каждый день создается 328,77 миллионов терабайтов. Это примерно 0,4 зеттабайта (ZB) в день, если учесть все вновь созданные, захваченные, скопированные или потребляемые данные.

Однако, несмотря на огромные объемы данных, которые ежедневно создаются и потребляются, пользователи владеют очень малой их частью:

  • Социальные медиа: Данные на платформах, таких как Twitter, Instagram и других, контролируются компаниями, хотя пользователи их создают.
  • Интернет вещей (IoT): Данные с умных устройств обычно принадлежат производителю устройства или поставщику услуг, если это не оговорено в конкретных соглашениях.
  • Данные о здоровье: Хотя у индивидуумов есть права на свои медицинские записи, большая часть данных из здоровья приложений или носимых устройств контролируется компаниями, предоставляющими эти услуги.

Крипто и социальные данные

В криптовалюте мы видели рост @_kaitoai, которая индексирует социальные данные в Twitter и преобразует их в конкретные данные о настроениях для проектов, KOL и ведущих мыслителей. Слова «yap» и «mindshare» стали популярными благодаря команде Kaito из-за их экспертизы в ростовых хаках (с их популярными панелями майндшер и япперов) и способности привлекать органический интерес в Crypto Twitter.

“Yap” стремится стимулировать создание качественного контента в Twitter, но остается много вопросов без ответов:

  • Как именно оцениваются «япы»?
  • Вы получаете дополнительный yap, упоминая Kaito?
  • Действительно ли Kaito вознаграждает качественный контент, или он предпочитает контроверсиальные горячие высказывания?

Помимо социальных данных, накаляется обсуждение вопроса владения данными, конфиденциальности и прозрачности. С быстро продвигающимися технологиями искусственного интеллекта возникают новые вопросы: кому принадлежат данные, используемые для обучения моделей ИИ? Кто получает преимущества от результатов, полученных с помощью ИИ?

Эти вопросы заложили основу для развития слоев данных Web3 — переход к децентрализованным экосистемам данных, принадлежащим пользователям.

Появление слоев данных

В Web3 существует растущая экосистема слоев данных, протоколов и инфраструктуры, которые сосредоточены на обеспечении суверенитета персональных данных - идеи предоставления людям большего контроля над своими данными, с возможностью заработка на них.

1. Vana

@vanaОсновная миссия заключается в том, чтобы дать пользователям контроль над их данными, особенно в контексте искусственного интеллекта, где данные являются бесценными для обучения моделей.

Vana представляет DataDAOs, сущности, управляемые сообществом, где пользователи объединяют свои данные для коллективной выгоды. Каждый DataDAO фокусируется на конкретном наборе данных:

  • r/datadao: Фокусируется на данныx пользователей Reddit, позволяя пользователям контролировать и монетизировать свои вклады.
  • Volara: занимается данными Twitter, позволяя пользователям получать выгоду от своей активности в социальных медиа.
  • DNA DAO: Направлен на управление генетическими данными с учетом конфиденциальности и собственности.

Vana токенизирует данные в торгуемый актив, называемый «DLP». Каждый DLP агрегирует данные для определенной области, и пользователи могут ставить токены в эти пулы для получения наград, причем лучшие пулы получают награды на основе поддержки сообщества и качества данных.

Чем отличается Vana, так это простота внесения данных. Пользователи просто:

  1. Выберите DataDAO
  2. Пул своих данных напрямую через интеграцию API или загрузите их вручную
  3. Заработайте токены DataDAO и $VANAкак награды

2. Ocean Protocol

@oceanprotocol— это децентрализованный рынок данных, который позволяет поставщикам данных делиться, продавать или предоставлять лицензии на свои данные, а потребители получать к ним доступ для искусственного интеллекта и исследований.

Ocean Protocol использует «дататокены» (токены ERC-20) для представления прав доступа к наборам данных, позволяя поставщикам данных монетизировать свои данные, сохраняя контроль над условиями доступа.

Типы данных, торгуемых на Ocean:

  • Публичные данные: Открытые наборы данных, такие как информация о погоде, общественная демография или исторические данные о фондовом рынке, ценные для обучения и исследований ИИ.
  • Приватные данные: медицинские записи, финансовые операции, данные датчиков IoT или персонализированные пользовательские данные требуют строгого контроля конфиденциальности.

Compute-to-Data - еще одна ключевая функция Ocean, позволяющая выполнять вычисления непосредственно на данных, не перемещая их, обеспечивая конфиденциальность и безопасность для чувствительных наборов данных.

3. Masa

@getmasafiсфокусирована на создании открытого уровня для обучения ИИ, предоставляющего в режиме реального времени высококачественные и недорогие данные для агентов ИИ и разработчиков.

Masa запустила две подсети в сети Bittensor:

  • Подсеть 42 (SN42): Агрегирует и обрабатывает миллионы записей данных ежедневно, служа основой для разработки искусственного интеллекта и приложений.
  • Сабнет 59 (SN59) - «AI Agent Arena»: конкурентная среда, где АИ-агенты, работающие на основе данных в режиме реального времени от SN42, соревнуются за $TAO выбросы на основе показателей производительности, таких как популярность, вовлеченность пользователей и самосовершенствование.

Masa сотрудничает с@virtuals_io, поддерживающий агентов Virtuals с возможностями обработки данных в реальном времени. Также запущен $TAOCAT, демонстрируя свои возможности (в настоящее время на Binance Alpha).

4. Открытая книга

@OpenledgerHQстроит блокчейн, специально разработанный для данных, особенно для приложений искусственного интеллекта и машинного обучения, обеспечивая безопасное, децентрализованное и проверяемое управление данными.

Основные моменты:

  • Datanets: Специализированные сети сбора данных в рамках OpenLedger, которые отбирают и обогащают реальные данные для приложений искусственного интеллекта.
  • SLMs: Искусственные интеллект модели, разработанные для конкретных отраслей или приложений. Идея заключается в предоставлении моделей, которые не только более точны для узкоспециализированных случаев использования, но также соответствуют требованиям конфиденциальности и менее подвержены смещениям, присущим общим моделям.
  • Проверка данных: обеспечивает точность и надежность данных, используемых для обучения специализированных языковых моделей (СЛМ), которые являются точными и надежными для конкретных случаев использования.

Спрос на данные для обучения искусственного интеллекта

Спрос на высококачественные данные для поддержки искусственного интеллекта и автономных агентов растет. Помимо начального обучения, агенты искусственного интеллекта требуют реальных данных для непрерывного обучения и адаптации.

Ключевые проблемы и возможности:

  • Качество данных важнее их количества: для моделей искусственного интеллекта требуется высококачественные, разнообразные и актуальные данные, чтобы избежать предвзятости или плохой производительности.
  • Суверенитет данных и конфиденциальность: Как видно на примере Ваны, существует стремление к монетизации данных, которыми владеют пользователи, что может изменить способ получения данных для обучения искусственного интеллекта.
  • Синтетические данные: В свете проблем с конфиденциальностью синтетические данные набирают популярность как способ обучения моделей искусственного интеллекта с учетом этических вопросов.
  • Рынок данных: Рост рынков данных (централизованных и децентрализованных) создает экономику, где данные являются торгуемым активом.
  • ИИ для управления данными: ИИ сейчас используется для управления, очистки и улучшения наборов данных, повышения качества данных для обучения ИИ.

По мере того как агенты искусственного интеллекта становятся более автономными, их способность получать и обрабатывать данные высокого качества в реальном времени будет определять их эффективность. Этот растущий спрос привел к появлению рынков данных, специфических для агентов искусственного интеллекта, где как люди, так и агенты искусственного интеллекта могут использовать данные высокого качества.

Рынок данных для агентов Web3

  • @cookiedotfunагрегирует данные общественного настроения и данных, связанных с токенами ИИ-агента, преобразуя их в практические рекомендации для человека и ИИ-агентов.
  • API Cookie DataSwarm позволяет искусственным интеллектуальным агентам получать доступ к актуальным данным высокого качества для получения интересной информации о торговле — одному из самых востребованных случаев использования в криптовалюте.
  • Cookie может похвастаться 200 тыс. MAU и 20 тыс. DAU, что делает его одним из крупнейших рынков данных агентов ИИ, с $COOKIEв центре.

Другие ключевые игроки:

  • @GoatIndexAIсосредотачивается на перспективах экосистемы Solana.
  • @Decentralisedcoспециализируется на узконаправленных панелях инструментов для данных, таких как хранилища GitHub и аналитика, специфическая для проектов.

Завершение Части 1

Это только начало. Часть 2 погрузится глубже в:

  • Развивающиеся вызовы и возможности в экономике данных
  • Роль синтетических данных в обучении искусственного интеллекта
  • Проблемы конфиденциальности данных и способы их решения
  • Будущее децентрализованного обучения искусственного интеллекта

Кто контролирует данные, тот будет формировать будущее, а проекты, разрабатываемые в этом секторе, определят, каким образом данные принадлежат, распространяются и монетизируются в эру искусственного интеллекта. По мере роста спроса на высококачественные данные, гонка за создание более прозрачной экономики данных, принадлежащих пользователям, только начинается.

Оставайтесь на связи для Части 2!

Личная заметка: Спасибо за чтение! Если вы занимаетесь крипто ИИ и хотите связаться, не стесняйтесь написать мне в личные сообщения.

Если вы хотите представить проект, используйте форму в моем био — она имеет приоритет перед личными сообщениями.

Полный отказ от ответственности: этот документ предназначен только для информационных и развлекательных целей. В выражениях, содержащихся в этом документе, не должно их рассматривать как инвестиционные советы или рекомендации. Получатели этого документа должны провести свои собственные исследования, учитывая свои конкретные финансовые обстоятельства, инвестиционные цели и уровень риска (которые не учитываются в этом документе) перед инвестированием. Этот документ не является предложением, а также не считается предложением к покупке или продаже любых упомянутых в нем активов.

Отказ от ответственности:

  1. Эта статья воспроизведена изX. Авторские права принадлежат оригинальному автору [@Defi0xJeff]. Если есть возражения по поводу воспроизведения, пожалуйста, свяжитесь сgate Учебная команда, и команда обработает его в соответствии с соответствующими процедурами.
  2. Отказ от ответственности: Мнения и взгляды, выраженные в этой статье, являются исключительно мнениями автора и не являются инвестиционным советом.
  3. Команда Gate Learn перевела статью на другие языки. Копирование, распространение или плагиатирование переведенных статей запрещено, если не указано иное.

Мои данные не мои: появление слоев данных

Средний2/10/2025, 4:24:36 AM
Обсуждения вокруг владения данными и конфиденциальности усилились. Появляются протоколы данных Web3, такие как Vana, Ocean Protocol и Masa, способствующие децентрализованному владению данными и позволяющие пользователям контролировать и монетизировать свои данные, особенно в области обучения и получения данных в режиме реального времени в области искусственного интеллекта. Эти протоколы предлагают новые решения для торговли данными и защиты конфиденциальности, отвечая растущему спросу на данные высокого качества.

Данные - это цифровое золото в этом веке, когда внимание находится в онлайне. Среднее глобальное время просмотра экрана в 2024 году составляет 6 часов и 40 минут в день, что является увеличением по сравнению с предыдущими годами. В Соединенных Штатах среднее время еще выше и составляет 7 часов и 3 минуты в день.

С таким уровнем вовлеченности объем создаваемых данных поражает - в 2024 году каждый день создается 328,77 миллионов терабайтов. Это примерно 0,4 зеттабайта (ZB) в день, если учесть все вновь созданные, захваченные, скопированные или потребляемые данные.

Однако, несмотря на огромные объемы данных, которые ежедневно создаются и потребляются, пользователи владеют очень малой их частью:

  • Социальные медиа: Данные на платформах, таких как Twitter, Instagram и других, контролируются компаниями, хотя пользователи их создают.
  • Интернет вещей (IoT): Данные с умных устройств обычно принадлежат производителю устройства или поставщику услуг, если это не оговорено в конкретных соглашениях.
  • Данные о здоровье: Хотя у индивидуумов есть права на свои медицинские записи, большая часть данных из здоровья приложений или носимых устройств контролируется компаниями, предоставляющими эти услуги.

Крипто и социальные данные

В криптовалюте мы видели рост @_kaitoai, которая индексирует социальные данные в Twitter и преобразует их в конкретные данные о настроениях для проектов, KOL и ведущих мыслителей. Слова «yap» и «mindshare» стали популярными благодаря команде Kaito из-за их экспертизы в ростовых хаках (с их популярными панелями майндшер и япперов) и способности привлекать органический интерес в Crypto Twitter.

“Yap” стремится стимулировать создание качественного контента в Twitter, но остается много вопросов без ответов:

  • Как именно оцениваются «япы»?
  • Вы получаете дополнительный yap, упоминая Kaito?
  • Действительно ли Kaito вознаграждает качественный контент, или он предпочитает контроверсиальные горячие высказывания?

Помимо социальных данных, накаляется обсуждение вопроса владения данными, конфиденциальности и прозрачности. С быстро продвигающимися технологиями искусственного интеллекта возникают новые вопросы: кому принадлежат данные, используемые для обучения моделей ИИ? Кто получает преимущества от результатов, полученных с помощью ИИ?

Эти вопросы заложили основу для развития слоев данных Web3 — переход к децентрализованным экосистемам данных, принадлежащим пользователям.

Появление слоев данных

В Web3 существует растущая экосистема слоев данных, протоколов и инфраструктуры, которые сосредоточены на обеспечении суверенитета персональных данных - идеи предоставления людям большего контроля над своими данными, с возможностью заработка на них.

1. Vana

@vanaОсновная миссия заключается в том, чтобы дать пользователям контроль над их данными, особенно в контексте искусственного интеллекта, где данные являются бесценными для обучения моделей.

Vana представляет DataDAOs, сущности, управляемые сообществом, где пользователи объединяют свои данные для коллективной выгоды. Каждый DataDAO фокусируется на конкретном наборе данных:

  • r/datadao: Фокусируется на данныx пользователей Reddit, позволяя пользователям контролировать и монетизировать свои вклады.
  • Volara: занимается данными Twitter, позволяя пользователям получать выгоду от своей активности в социальных медиа.
  • DNA DAO: Направлен на управление генетическими данными с учетом конфиденциальности и собственности.

Vana токенизирует данные в торгуемый актив, называемый «DLP». Каждый DLP агрегирует данные для определенной области, и пользователи могут ставить токены в эти пулы для получения наград, причем лучшие пулы получают награды на основе поддержки сообщества и качества данных.

Чем отличается Vana, так это простота внесения данных. Пользователи просто:

  1. Выберите DataDAO
  2. Пул своих данных напрямую через интеграцию API или загрузите их вручную
  3. Заработайте токены DataDAO и $VANAкак награды

2. Ocean Protocol

@oceanprotocol— это децентрализованный рынок данных, который позволяет поставщикам данных делиться, продавать или предоставлять лицензии на свои данные, а потребители получать к ним доступ для искусственного интеллекта и исследований.

Ocean Protocol использует «дататокены» (токены ERC-20) для представления прав доступа к наборам данных, позволяя поставщикам данных монетизировать свои данные, сохраняя контроль над условиями доступа.

Типы данных, торгуемых на Ocean:

  • Публичные данные: Открытые наборы данных, такие как информация о погоде, общественная демография или исторические данные о фондовом рынке, ценные для обучения и исследований ИИ.
  • Приватные данные: медицинские записи, финансовые операции, данные датчиков IoT или персонализированные пользовательские данные требуют строгого контроля конфиденциальности.

Compute-to-Data - еще одна ключевая функция Ocean, позволяющая выполнять вычисления непосредственно на данных, не перемещая их, обеспечивая конфиденциальность и безопасность для чувствительных наборов данных.

3. Masa

@getmasafiсфокусирована на создании открытого уровня для обучения ИИ, предоставляющего в режиме реального времени высококачественные и недорогие данные для агентов ИИ и разработчиков.

Masa запустила две подсети в сети Bittensor:

  • Подсеть 42 (SN42): Агрегирует и обрабатывает миллионы записей данных ежедневно, служа основой для разработки искусственного интеллекта и приложений.
  • Сабнет 59 (SN59) - «AI Agent Arena»: конкурентная среда, где АИ-агенты, работающие на основе данных в режиме реального времени от SN42, соревнуются за $TAO выбросы на основе показателей производительности, таких как популярность, вовлеченность пользователей и самосовершенствование.

Masa сотрудничает с@virtuals_io, поддерживающий агентов Virtuals с возможностями обработки данных в реальном времени. Также запущен $TAOCAT, демонстрируя свои возможности (в настоящее время на Binance Alpha).

4. Открытая книга

@OpenledgerHQстроит блокчейн, специально разработанный для данных, особенно для приложений искусственного интеллекта и машинного обучения, обеспечивая безопасное, децентрализованное и проверяемое управление данными.

Основные моменты:

  • Datanets: Специализированные сети сбора данных в рамках OpenLedger, которые отбирают и обогащают реальные данные для приложений искусственного интеллекта.
  • SLMs: Искусственные интеллект модели, разработанные для конкретных отраслей или приложений. Идея заключается в предоставлении моделей, которые не только более точны для узкоспециализированных случаев использования, но также соответствуют требованиям конфиденциальности и менее подвержены смещениям, присущим общим моделям.
  • Проверка данных: обеспечивает точность и надежность данных, используемых для обучения специализированных языковых моделей (СЛМ), которые являются точными и надежными для конкретных случаев использования.

Спрос на данные для обучения искусственного интеллекта

Спрос на высококачественные данные для поддержки искусственного интеллекта и автономных агентов растет. Помимо начального обучения, агенты искусственного интеллекта требуют реальных данных для непрерывного обучения и адаптации.

Ключевые проблемы и возможности:

  • Качество данных важнее их количества: для моделей искусственного интеллекта требуется высококачественные, разнообразные и актуальные данные, чтобы избежать предвзятости или плохой производительности.
  • Суверенитет данных и конфиденциальность: Как видно на примере Ваны, существует стремление к монетизации данных, которыми владеют пользователи, что может изменить способ получения данных для обучения искусственного интеллекта.
  • Синтетические данные: В свете проблем с конфиденциальностью синтетические данные набирают популярность как способ обучения моделей искусственного интеллекта с учетом этических вопросов.
  • Рынок данных: Рост рынков данных (централизованных и децентрализованных) создает экономику, где данные являются торгуемым активом.
  • ИИ для управления данными: ИИ сейчас используется для управления, очистки и улучшения наборов данных, повышения качества данных для обучения ИИ.

По мере того как агенты искусственного интеллекта становятся более автономными, их способность получать и обрабатывать данные высокого качества в реальном времени будет определять их эффективность. Этот растущий спрос привел к появлению рынков данных, специфических для агентов искусственного интеллекта, где как люди, так и агенты искусственного интеллекта могут использовать данные высокого качества.

Рынок данных для агентов Web3

  • @cookiedotfunагрегирует данные общественного настроения и данных, связанных с токенами ИИ-агента, преобразуя их в практические рекомендации для человека и ИИ-агентов.
  • API Cookie DataSwarm позволяет искусственным интеллектуальным агентам получать доступ к актуальным данным высокого качества для получения интересной информации о торговле — одному из самых востребованных случаев использования в криптовалюте.
  • Cookie может похвастаться 200 тыс. MAU и 20 тыс. DAU, что делает его одним из крупнейших рынков данных агентов ИИ, с $COOKIEв центре.

Другие ключевые игроки:

  • @GoatIndexAIсосредотачивается на перспективах экосистемы Solana.
  • @Decentralisedcoспециализируется на узконаправленных панелях инструментов для данных, таких как хранилища GitHub и аналитика, специфическая для проектов.

Завершение Части 1

Это только начало. Часть 2 погрузится глубже в:

  • Развивающиеся вызовы и возможности в экономике данных
  • Роль синтетических данных в обучении искусственного интеллекта
  • Проблемы конфиденциальности данных и способы их решения
  • Будущее децентрализованного обучения искусственного интеллекта

Кто контролирует данные, тот будет формировать будущее, а проекты, разрабатываемые в этом секторе, определят, каким образом данные принадлежат, распространяются и монетизируются в эру искусственного интеллекта. По мере роста спроса на высококачественные данные, гонка за создание более прозрачной экономики данных, принадлежащих пользователям, только начинается.

Оставайтесь на связи для Части 2!

Личная заметка: Спасибо за чтение! Если вы занимаетесь крипто ИИ и хотите связаться, не стесняйтесь написать мне в личные сообщения.

Если вы хотите представить проект, используйте форму в моем био — она имеет приоритет перед личными сообщениями.

Полный отказ от ответственности: этот документ предназначен только для информационных и развлекательных целей. В выражениях, содержащихся в этом документе, не должно их рассматривать как инвестиционные советы или рекомендации. Получатели этого документа должны провести свои собственные исследования, учитывая свои конкретные финансовые обстоятельства, инвестиционные цели и уровень риска (которые не учитываются в этом документе) перед инвестированием. Этот документ не является предложением, а также не считается предложением к покупке или продаже любых упомянутых в нем активов.

Отказ от ответственности:

  1. Эта статья воспроизведена изX. Авторские права принадлежат оригинальному автору [@Defi0xJeff]. Если есть возражения по поводу воспроизведения, пожалуйста, свяжитесь сgate Учебная команда, и команда обработает его в соответствии с соответствующими процедурами.
  2. Отказ от ответственности: Мнения и взгляды, выраженные в этой статье, являются исключительно мнениями автора и не являются инвестиционным советом.
  3. Команда Gate Learn перевела статью на другие языки. Копирование, распространение или плагиатирование переведенных статей запрещено, если не указано иное.
Начните торговать сейчас
Зарегистрируйтесь сейчас и получите ваучер на
$100
!