В прошлом году на рынке предсказаний по результатам президентских выборов в Венесуэле было заключено контрактов более чем на $6 млн. Однако после подсчёта голосов возникла неразрешимая ситуация: правительство объявило победителем Николаса Мадуро, а оппозиция и международные наблюдатели заявили о фальсификациях. Как следовало разрешать такие контракты: опираясь на «официальную информацию» (победа Мадуро) или на «консенсус авторитетных источников» (победа оппозиции)?
В случае выборов в Венесуэле наблюдатели говорили о нарушениях правил, а участники утверждали, что у них «украли деньги». Протокол для разрешения спорных контрактов называли «судьёй, присяжным и палачом» в остром политическом конфликте, а также отмечали, что система была «серьёзно сфальсифицирована».
Это не единичная проблема. Это проявление одной из главных сложностей масштабирования рынков предсказаний — разрешения контрактов.
Ставки здесь высоки. Если разрешение работает корректно, рынку доверяют, в нём хотят торговать, а цены становятся значимым индикатором для общества. Если механизм ошибочен, торговля становится разочаровывающей и непредсказуемой. Участники уходят, ликвидность иссякает, а цены перестают отражать точные прогнозы. Вместо этого они становятся смесью реальных вероятностей исхода и ожиданий трейдеров относительно того, как искажённый механизм разрешения примет решение.
Спор по Венесуэле был заметным, но менее явные сбои происходят регулярно на разных платформах:
В этой статье я рассматриваю, как LLM и криптотехнологии, грамотно объединённые, могут помочь создать механизмы разрешения контрактов на рынках предсказаний, которые сложно манипулировать, а также сделать их точными, прозрачными и объективными.
Аналогичные проблемы есть и на финансовых рынках. Международная ассоциация свопов и деривативов (ISDA) уже много лет решает вопросы разрешения контрактов на рынке кредитных дефолтных свопов — контрактов, выплачивающих при дефолте компании или страны. В отчёте за 2024 год откровенно описываются эти сложности. Комитеты по определениям, состоящие из крупных участников рынка, голосуют, произошло ли кредитное событие. Однако процесс критикуют за непрозрачность, потенциальные конфликты интересов и непоследовательные результаты — как и в случае с UMA.
Проблема та же: когда на кону крупные суммы, а ситуация неоднозначна, любой механизм разрешения становится целью для манипуляций, а любая неоднозначность — причиной конфликтов.
Какой должна быть хорошая система разрешения?
Любое жизнеспособное решение должно одновременно обеспечивать несколько ключевых свойств
Устойчивость к манипуляциям. Если противники могут влиять на разрешение — редактируя Википедию, распространяя фейковые новости, подкупая оракулы или используя процедурные лазейки — рынок становится соревнованием манипуляторов, а не прогнозистов.
Достаточная точность. Механизм должен в большинстве случаев правильно разрешать контракты. Абсолютная точность невозможна при реальной неопределённости, но систематические ошибки и явные промахи подрывают доверие.
Прозрачность ex ante. Трейдеры должны заранее знать, как будет происходить разрешение. Изменение правил в процессе нарушает базовое соглашение между платформой и участником.
Объективность. Участники должны быть уверены, что механизм не отдаёт предпочтения ни трейдерам, ни результатам. Поэтому особенно проблематично, когда крупные держатели UMA разрешают контракты, в которых сами участвуют: даже если они действуют честно, видимость конфликта подрывает доверие.
Человеческие комитеты могут соответствовать части этих критериев, но сталкиваются с трудностями — особенно при масштабировании. Голосование на основе токенов, как у UMA, также известно проблемами доминирования крупных игроков и конфликтов интересов.
Здесь на сцену выходит искусственный интеллект.
В последнее время набирает популярность предложение использовать крупные языковые модели как судей для разрешения, при этом конкретная модель и промпт фиксируются в блокчейне при создании контракта.
Базовая архитектура такова: при создании контракта маркетмейкер указывает не только критерии разрешения на естественном языке, но и конкретную LLM (с версией модели и временной меткой) и конкретный промпт, который будет использоваться для определения исхода.
Эта спецификация фиксируется в блокчейне. После открытия торгов участники могут ознакомиться с полной схемой разрешения — они знают, какая модель ИИ будет определять исход, какой промпт она получит и к каким источникам информации будет иметь доступ.
Если условия не устраивают, участник не торгует.
В момент разрешения зафиксированная LLM запускается с зафиксированным промптом, получает доступ к обозначенным источникам информации и выносит решение. На основании этого решения распределяются выплаты.
Такой подход одновременно решает несколько ключевых задач:
Высокая устойчивость к манипуляциям (хотя и не абсолютная). В отличие от страницы Википедии или новостного сайта, нельзя просто изменить выводы крупной LLM. Веса модели фиксируются при создании контракта. Чтобы повлиять на разрешение, злоумышленнику пришлось бы либо подделать источники информации, либо заранее отравить обучающие данные модели — оба варианта требуют значительных затрат и менее предсказуемы, чем подкуп оракула или изменение карты.
Точность. Современные модели быстро совершенствуются и способны решать широкий круг интеллектуальных задач, особенно если могут искать и анализировать новые данные в интернете. LLM-судьи могут точно разрешать множество рынков, и сейчас продолжаются эксперименты по оценке их точности.
Прозрачность. Вся схема разрешения видна и доступна для аудита до начала торговли. Нет изменения правил в процессе, нет произвольных решений и закулисных обсуждений. Участник заранее знает все условия.
Значительное повышение объективности. LLM не заинтересована в результате финансово. Её невозможно подкупить, она не владеет токенами UMA. Все возможные предубеждения — это свойства самой модели, а не заинтересованных лиц.
У LLM-судей есть ограничения, которые я опишу ниже.
Модели совершают ошибки. LLM может неправильно интерпретировать новость, придумать несуществующий факт или применить критерии разрешения непоследовательно. Но если трейдеры знают, с какой моделью они работают, они могут учитывать её особенности. Если у модели есть склонность разрешать спорные случаи определённым образом, опытные трейдеры это учтут. Модель не обязана быть идеальной — она должна быть предсказуемой.
Манипуляции не исключены, но усложнены. Если в промпте указаны конкретные СМИ, злоумышленники могут попытаться разместить новости именно там. Такая атака дорога против крупных ресурсов, но может быть реализуема против мелких — это разновидность проблемы с редактированием карт. Поэтому дизайн промпта крайне важен: механизмы разрешения, опирающиеся на разнообразные и резервные источники, гораздо надёжнее, чем зависящие от одного.
Теоретически возможны атаки на обучение. Злоумышленник с достаточными ресурсами может попытаться повлиять на обучающие данные LLM, чтобы сместить будущие решения. Но для этого придётся действовать задолго до создания контракта, с неопределённым результатом и большими затратами — это гораздо сложнее, чем подкупить члена комитета.
Множественность LLM-судей создаёт проблемы координации. Если разные создатели рынков фиксируют разные модели и промпты, ликвидность фрагментируется. Трейдерам сложнее сравнивать контракты и агрегировать информацию между рынками. Стандартизация принесёт пользу, но важно и экспериментировать для поиска оптимальных сочетаний LLM и промптов. Вероятно, оптимален комбинированный подход: позволить экспериментировать, но создать условия для выработки сообществом надёжных стандартов.
Разрешение с помощью ИИ меняет одни проблемы (человеческая предвзятость, конфликты интересов, непрозрачность) на другие (ограничения моделей, сложность настройки промптов, уязвимость источников информации), которые, возможно, проще решать. Как двигаться дальше? Платформам стоит:
Экспериментировать, тестируя разрешение с помощью LLM на контрактах с низкими ставками, чтобы накопить опыт. Какие модели показывают лучшие результаты? Какие структуры промптов наиболее устойчивы? Какие сбои проявляются на практике?
Стандартизировать. С появлением лучших практик сообществу стоит стремиться к стандартизации сочетаний LLM и промптов, которые можно использовать по умолчанию. Это не мешает инновациям, но способствует концентрации ликвидности на понятных рынках.
Создавать инструменты прозрачности, например интерфейсы, позволяющие трейдерам изучать всю схему разрешения — модель, промпт, источники — до начала торговли. Механизм разрешения не должен быть спрятан в сносках.
Проводить постоянное управление. Даже с ИИ-судьями людям придётся принимать решения на мета-уровне: какие модели заслуживают доверия, как поступать при очевидных ошибках моделей, когда обновлять стандарты. Цель — не полностью исключить людей, а перевести их роль от ситуативных решений к систематической выработке правил.
Рынки предсказаний обладают огромным потенциалом для понимания сложного мира. Но этот потенциал реализуется только при наличии доверия, а доверие — при честном разрешении контрактов. Мы видели, к чему приводит сбой механизмов разрешения: путаница, недовольство, уход трейдеров. Я видел, как люди полностью уходили с рынков предсказаний после того, как чувствовали себя обманутыми результатом, противоречащим духу их ставки, и отказывались от платформ, которые раньше им нравились. Это упущенная возможность для раскрытия преимуществ и более широких применений рынков предсказаний.
LLM-судьи не идеальны. Но в сочетании с криптотехнологиями они обеспечивают прозрачность, объективность и устойчивость к тем видам манипуляций, которые характерны для систем с человеческим управлением. В условиях, когда рынки предсказаний развиваются быстрее, чем системы управления, возможно, именно это нам и нужно.





