Гугл щойно зробив дуже стратегічний хід на конференції Cloud Next у Лас-Вегасі. Вони одночасно запустили два нові процесори TPU восьмого покоління, і це ознаменовує важливий поворот у тому, як компанія бачить ринок ШІ.



Вперше Google повністю відокремив процесори для тренування та інференції. Є TPU 8t, орієнтований на тренування моделей ШІ, і TPU 8i, оптимізований для запуску цих моделей у виробництві. Це чітка тактична зміна — вони визнають, що ці два завдання мають дуже різні потреби.

Показники продуктивності цікаві. TPU 8t забезпечує на 124% більше ефективності на ват порівняно з попереднім поколінням, тоді як TPU 8i має покращення на 117%. Порівняно з Ironwood, який вийшов у листопаді, TPU 8t дає у 2,8 рази більше продуктивності за ту саму ціну, а 8i — на 80% ефективніше. Ці досягнення не є тривіальними.

Що найбільше привертає увагу у TPU 8t — це здатність масштабуватися до 9600 одиниць у одному системі. Google добре усвідомлює, що у таких великих установках енергія стала критичним обмежувачем дата-центрів. Тому енергетична ефективність стала пріоритетом номер один.

Щодо TPU 8i, він має інший підхід. Кожен чип містить 384 МБ SRAM — у три рази більше, ніж Ironwood. Це має великий сенс для інференції, де чипу потрібно обробляти кілька кроків логіки без постійного пошуку даних зовні. Ідеально для запуску складних агентів ШІ.

Обидва процесори з’являться на ринку наприкінці 2026 року. Сундар Пічаї, генеральний директор Alphabet, чітко заявив, що архітектура задумана для «запуску мільйонів агентів одночасно і економічно вигідно». Це ключове — справа не лише у покращених чипах, а у тому, щоб зробити це без перевищення бюджету.

Щодо програмного забезпечення, Google запустив платформу Gemini Enterprise Agent Platform з новими функціями. Memory Bank і Memory Profile дозволяють агентам пам’ятати попередні взаємодії з користувачами — вирішують реальну проблему, яку мали старі інструменти. Також є Agent Simulation для кращого тестування перед запуском.

Платформа Projects інтегрує дані з Workspace, OneDrive і корпоративних чатів, надаючи агентам контекст. Крім того, вони запустили Gemini Enterprise для звичайних співробітників, позиціонуючи її як «ШІ-асистента для кожного», без необхідності писати код.

Все це — подвійна атака — апаратна і програмна — проти Nvidia, OpenAI і Anthropic. Google добре усвідомлює, що інженери з Кремнієвої долини часто перемикаються між Claude від Anthropic і Codex від OpenAI для розробки ШІ, рідко враховуючи інструменти Google. Це явно дратує керівництво.

Впровадження TPU прискорюється. Citadel Securities вже створила квантове програмне забезпечення на TPU Google. 17 національних лабораторій Міністерства енергетики США використовують колаборативні інструменти на базі TPU. Meta підписала довгострокову угоду на використання TPU Google, а Anthropic взяла на себе зобов’язання щодо обчислювальної потужності у масштабі гігават.

Аналітики DA Davidson оцінюють, що сумарна вартість бізнесу TPU і DeepMind Google перевищувала 900 мільярдів доларів у вересні минулого року.

Цікаво, що Google не порівнював прямо свій новий TPU з продуктами Nvidia. Тим часом Nvidia готується запустити нову лінійку з технологією Groq, яку вона придбала за 20 мільярдів доларів, спеціально орієнтовану на інференцію з ультранизькою затримкою. Дженсен Хуанг з Nvidia заявив, що понад 20% навантажень ШІ можна краще обробляти цим типом чипів.

Google тестує впровадження TPU у дата-центрах клієнтів і просуває сумісність із сторонніми інструментами. Але проблеми з постачанням і розрив між швидкими ітераціями моделей і циклами розробки чипів, що тривають роками, залишаються реальними викликами для масштабування.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Закріпити