AI-аудит выходит на практическую стадию, OpenAI выпустила EVMbench, укрепляя оценку безопасности смарт-контрактов

CryptoCity

Прогресс проекта Отраслевой отчет

2026-02-20 04:10:56

ETH-4,66%

WELL-3,54%

OpenAI совместно с Paradigm запускает EVMbench, тестирование возможностей AI-агентов в защите и атаке смарт-контрактов EVM, выявляя слабые стороны и сильные стороны.

Фокус на реальных условиях экономики, OpenAI и Paradigm укрепляют безопасность блокчейна

Лидер в области искусственного интеллекта OpenAI объявил о сотрудничестве с известной компанией по рисковым инвестициям в криптовалюты Paradigm и компанией по безопасности OtterSec для запуска EVMbench — инструмента для оценки безопасности AI-агентов в контексте смарт-контрактов Ethereum Virtual Machine (EVM).

По мере углубления интеграции AI и криптотехнологий, смарт-контракты становятся ключевой инфраструктурой для управления более чем триллионом открытых криптоактивов. Появление этого инструмента символизирует начало осознания индустрией практических возможностей AI в условиях «экономически значимой среды».

Команда OpenAI отмечает, что с ростом возможностей AI-агентов в написании и планировании кода, в будущем эти модели будут играть трансформирующую роль в атаках и защите блокчейна. Поэтому создание стандартизированной системы оценки становится критически важным для мониторинга прогресса AI.

Три основных режима тестирования, 120 реальных уязвимостей — испытание на прочность AI

Ядро EVMbench построено на базе 120 уязвимостей, извлечённых из 40 профессиональных аудиторских отчётов, включая известные публичные конкурсы по аудиту Code4rena, что обеспечивает реалистичность сценариев. Стандарт включает три режима оценки AI-агентов:

Источник: OpenAI EVMbench — ядро системы заключается в оценке AI-агентов в трёх режимах работы

Первый — «Обнаружение (Detect)», где AI анализирует код смарт-контракта и выявляет известные уязвимости, оценивая их степень серьёзности;
Второй — «Исправление (Patch)», где AI должен устранить уязвимости и исправить код, сохраняя при этом исходную функциональность;
Третий — «Эксплуатация (Exploit)», где AI в изолированной среде блокчейна выполняет полный цикл атаки с целью кражи средств.

Для обеспечения строгой повторяемости и надёжности тестирования команда разработала архитектуру на базе Rust, использующую детерминированное воспроизведение транзакций для проверки успешности атак или исправлений AI.

Тенденция усиления атак и слабых защит очевидна, GPT-5.3-Codex демонстрирует впечатляющий рост в атакующих способностях

В первых результатах тестирования видно, что AI показывает значительные различия в эффективности в зависимости от задачи. Новое поколение GPT-5.3-Codex показывает отличные результаты в режиме эксплуатации (Exploit Mode), набрав 72,2 %, что значительно превосходит показатели GPT-5, выпущенной всего шесть месяцев назад (31,9 %), демонстрируя поразительный рост возможностей.

Источник: Обзор результатов различных моделей AI OpenAI в трёх режимах

Это свидетельствует о том, что при ясной цели «вывести средства из системы» AI обладает мощными возможностями по планированию и выполнению атак. Однако в защитных сценариях показатели остаются слабее: AI часто останавливается после обнаружения одной уязвимости и не продолжает поиск, а при исправлении сложных логик зачастую не удаётся устранить уязвимость без нарушения работы контракта. Эксперты по безопасности выражают обеспокоенность, что AI может значительно сократить время от обнаружения уязвимости до разработки атаки, что повышает требования к скорости защиты DeFi-проектов.

Привлечение талантов и поддержка защиты, стратегия OpenAI по обеспечению безопасности AI-экосистемы

Помимо разработки инструментов, OpenAI активно занимается привлечением специалистов и укреплением экосистемы защиты. Недавно был нанят основатель проекта открытых AI-агентов OpenClaw Питер Штайнбергер, который возглавит разработку следующего поколения персонализированных агентов и преобразует проект в фонд, поддерживаемый OpenAI.

Для противодействия возможным киберрискам, связанным с AI, OpenAI обещает выделить 10 миллионов долларов на гранты по кибербезопасности через свою программу поддержки, чтобы финансировать разработку открытых инструментов защиты и исследование ключевой инфраструктуры. Эта инициатива особенно актуальна после инцидента с протоколом Moonwell, где из-за ошибки в коде, связанной с AI, было потеряно около 1,78 миллиона долларов.

Дополнительные материалы
Отказ от миллиардных предложений Meta, создатель OpenClaw присоединяется к борьбе за таланты в OpenAI, предсказания о сбоях в протоколе Moonwell — кто заплатит за убытки в 1,78 миллиона долларов?

В будущем, по мере внедрения более автоматизированных и AI-ассистированных платежных решений и автоматизированных кошельков, использование таких инструментов, как EVMbench, для различения моделей, способных только описывать уязвимости, и моделей, способных надёжно обеспечивать защиту, станет ключевым моментом в развитии индустрии блокчейн-безопасности.

Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.

Связанные статьи

Filecoin Onchain Cloud запустил основную сеть, предоставляя программируемый уровень хранения и платежей.

Прогресс проекта

Filecoin 27 марта официально запустил свои облачные услуги на блокчейне, предоставляя разработчикам программируемое хранилище и платежи, поддерживающие дублирование и верификацию данных. Стоимость хранения составляет 25 000 долларов США за ТиБ в месяц. Ожидается запуск расширенной версии SLA для поддержки разработки AI, более 100 команд уже используют эту услугу в различных областях.

GateNews24м назад

Eigen Labs выпустила бета-версию AgentKit, поддерживающую создание автономных AI-агентов с возможностью владения активами.

Прогресс проекта

Eigen Labs 27 марта выпустила первую бета-версию AgentKit, это набор инструментов для разработчиков, сосредоточенный на создании автономных AI-агентов, способных держать активы, производить платежи и управлять идентичностью. Первые приложения сосредоточены на автоматической генерации контента медиа-агентов, в будущем будет добавлена интеграция с социальными платформами и улучшения пользовательского интерфейса.

GateNews26м назад

Прогресс проекта

Eigen Labs выпустила первую бета-версию AgentKit 27 марта, это инструментальный пакет для разработчиков, предназначенный для создания ИИ-агентов, способных самостоятельно управлять идентичностью и активами. Первые сценарии использования включают автономные медиа-агенты, в будущем планируется расширение интеграции с социальными платформами и добавление новых функций.

BlockBeatNews46м назад

Filecoin Onchain Cloud запустил основную сеть, предоставляя разработчикам программируемый уровень хранения и платежей.

Прогресс проекта

Filecoin объявил о запуске своего «облачного сервиса на блокчейне» в основной сети, предоставляя программируемый уровень хранения и платежей, а также поддержку верификации данных. Начальная цена хранения составляет 25,000 долларов США за TiB в месяц. Более 100 команд уже участвуют и хранят 49.41 TiB данных, в будущем будет представлен улучшенный уровень сервиса.

BlockBeatNews47м назад

Масато Сёя стал членом! Ассоциация аптек Японии внедряет токенизированные депозиты, платежи и логистика ускоряются.

USDC news Прогресс проекта Партнёрства и экосистема Геополитика

Японская ассоциация сетевых аптечных магазинов внедряет токенизированные депозиты на базе DCJPY, чтобы снизить комиссионные за платежи и повысить эффективность логистики. Это демонстрирует, что Япония уделяет внимание блокчейну и цифровым финансам, а также совместно с SBI Bank предлагает новые финансовые услуги. Кроме того, DCJPY также планирует выйти на трансграничные платежи, сотрудничая с компаниями из Сингапура, чтобы соединить глобальные рынки.

CryptoCity1ч назад

OpenAI сбросила лимит использования Codex, первой интеграцией стали такие инструменты разработки, как Slack, Figma и другие.

Прогресс проекта

Gate News сообщение, 27 марта, руководитель OpenAI Codex Тибо Соттьё объявил, что лимиты использования Codex для всех пакетов были сброшены в связи с запуском новой системы плагинов. Функция плагинов впервые интегрировала такие популярные инструменты разработчиков, как Slack, Figma, Notion и Gmail, что позволяет пользователям использовать возможности Codex в более широком круге сценариев. Эта мера направлена на то, чтобы побудить пользователей попробовать новые функции плагинов.

GateNews1ч назад

комментарий

0/400

Нет комментариев