Співробітники OpenAI публічно звинуватили xAI у тому, що останній штучний інтелект Grok3 має маніпулятивні результати тестування Бенчмарк

robot
Генерація анотацій у процесі

Повідомлення від ChainCatcher, згідно з повідомленням Jinshi, один з працівників OpenAI публічно звинуватив фірму XAI, що належить Маску, у тому, що нова модель штучного інтелекту Grok3 має хибні результати тестів Бенчмарк. Натомість співзасновник XAI Ігор Бабушкін стверджує, що компанія не здійснювала ніяких неправомірних дій. Графік xAI показує, що дві версії Grok3 - Grok3 Reasoning Beta та Grok3 mini Reasoning - виходять за межі поточно доступної моделі o3-mini-high від OpenAI на AIME 2025. Однак співробітники OpenAI швидко зауважили на платформі X, що графік xAI не містить рейтингу o3-mini-high на умові "cons@64" для AIME 2025. Бабушкін на платформі X заявив, що OpenAI також коли-небудь публікував подібні маніпуляційні ГРОК-тести. Навіть якщо ці таблиці використовувалися для порівняння власної моделі.

Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити