Попросил GPT Image 2.0 создать таблицу сравнения Opus 4.7 и GPT 5.5.


Эта модель изображений стала очень хорошей.
GPT-5.5 выигрывает в основном зачёте. Но посмотрите внимательнее.
OSWorld 78.7 против 78.0. GDPval 84.9 против 80.3. Toolathlon 55.6 против 54.6 (более 5.4, не Opus).
Opus всё ещё занимает место в SWE-Bench Pro, MCP Atlas, GPQA Diamond, HLE без инструментов.
OpenAI получает общую победу. Anthropic сохраняет корону в кодировании. На бумаге.
Посмотреть Оригинал
post-image
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • комментарий
  • Репост
  • Поделиться
комментарий
Добавить комментарий
Добавить комментарий
Нет комментариев
  • Закрепить