Останні результати AI-бенчмарків щойно з’явилися, і одна модель показала приголомшливий результат. Набравши 1483 бали за рейтинговою системою Elo, Grok 4.1 наразі очолює таблицю лідерів із впевненим відривом у 31 бал від найближчого конкурента.
Це не просто перемога — це створення відстані.
Цей розрив багато про що говорить щодо поточного стану розвитку AI. Коли ти випереджаєш інших на таку кількість балів у стандартизованих тестах, це свідчить або про прорив в архітектурі, або про серйозну оптимізацію “під капотом”. У будь-якому разі, цифри не брешуть: ця модель працює на зовсім іншому рівні порівняно з усім, що є на ринку.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Останні результати AI-бенчмарків щойно з’явилися, і одна модель показала приголомшливий результат. Набравши 1483 бали за рейтинговою системою Elo, Grok 4.1 наразі очолює таблицю лідерів із впевненим відривом у 31 бал від найближчого конкурента.
Це не просто перемога — це створення відстані.
Цей розрив багато про що говорить щодо поточного стану розвитку AI. Коли ти випереджаєш інших на таку кількість балів у стандартизованих тестах, це свідчить або про прорив в архітектурі, або про серйозну оптимізацію “під капотом”. У будь-якому разі, цифри не брешуть: ця модель працює на зовсім іншому рівні порівняно з усім, що є на ринку.