Співробітники OpenAI публічно звинуватили xAI у тому, що останній штучний інтелект Grok3 має маніпулятивні результати тестування Бенчмарк

Генерація анотацій у процесі

Повідомлення від ChainCatcher, згідно з повідомленням Jinshi, один з працівників OpenAI публічно звинуватив фірму XAI, що належить Маску, у тому, що нова модель штучного інтелекту Grok3 має хибні результати тестів Бенчмарк. Натомість співзасновник XAI Ігор Бабушкін стверджує, що компанія не здійснювала ніяких неправомірних дій. Графік xAI показує, що дві версії Grok3 - Grok3 Reasoning Beta та Grok3 mini Reasoning - виходять за межі поточно доступної моделі o3-mini-high від OpenAI на AIME 2025. Однак співробітники OpenAI швидко зауважили на платформі X, що графік xAI не містить рейтингу o3-mini-high на умові "cons@64" для AIME 2025. Бабушкін на платформі X заявив, що OpenAI також коли-небудь публікував подібні маніпуляційні ГРОК-тести. Навіть якщо ці таблиці використовувалися для порівняння власної моделі.

XAI0.66%

GROK-3.32%

Переглянути оригінал

Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.

1 лайків

Нагородити
1
Прокоментувати
Поділіться

Прокоментувати

0/400

Немає коментарів

Тема
#BTC#
192k публікації
#ETH#
120k публікації
#PI#
93k публікації
4#GateioInto11#
76k публікації
5#ContentStar#
64k публікації
6#BOME#
59k публікації
7#GT#
56k публікації
8#DOGE#
53k публікації
9#MAGA#
52k публікації
10#SLERF#
51k публікації

Закріпити

карта сайту