Google baru saja melakukan langkah strategis yang cukup cerdas di konferensi Cloud Next di Las Vegas. Mereka meluncurkan dua prosesor TPU generasi kedelapan secara bersamaan, dan ini menandai perubahan penting dalam cara perusahaan memandang pasar AI.



Untuk pertama kalinya, Google memisahkan sepenuhnya chip pelatihan dan inferensi. Ada TPU 8t yang fokus pada pelatihan model AI, dan TPU 8i yang dioptimalkan untuk menjalankan model-model ini dalam produksi. Ini adalah perubahan taktis yang jelas - mereka mengakui bahwa kedua tugas ini memiliki kebutuhan yang sangat berbeda.

Angka performa menarik untuk diperhatikan. TPU 8t menawarkan efisiensi 124% lebih tinggi per watt dibandingkan generasi sebelumnya, sementara TPU 8i mengalami peningkatan sebesar 117%. Dibandingkan dengan Ironwood yang dirilis pada November, TPU 8t memberikan 2,8 kali performa lebih banyak dengan harga yang sama, dan 8i lebih efisien sebesar 80%. Peningkatan ini tidaklah sepele.

Yang paling mencolok dari TPU 8t adalah kemampuannya untuk diskalakan hingga 9.600 unit dalam satu sistem. Google sangat sadar bahwa di instalasi sebesar ini, energi menjadi pembatas utama pusat data. Oleh karena itu, efisiensi energi menjadi prioritas utama.

Sementara itu, TPU 8i memiliki pendekatan berbeda. Setiap chip mengandung 384MB SRAM - tiga kali lipat dari Ironwood. Ini sangat masuk akal untuk inferensi, di mana chip perlu memproses beberapa langkah penalaran tanpa harus mencari data dari luar terus-menerus. Ideal untuk menjalankan agen AI yang kompleks.

Kedua prosesor ini akan tersedia di pasar pada akhir 2026. Sundar Pichai, CEO Alphabet, menegaskan bahwa arsitektur ini dirancang untuk "menjalankan jutaan agen secara bersamaan dengan biaya yang masuk akal". Ini adalah poin utamanya - bukan hanya tentang memiliki chip yang lebih baik, tetapi melakukannya tanpa melebihi anggaran.

Di sisi perangkat lunak, Google meluncurkan Gemini Enterprise Agent Platform dengan fitur baru. Memory Bank dan Memory Profile memungkinkan agen mengingat interaksi sebelumnya dengan pengguna - menyelesaikan masalah nyata yang dihadapi alat lama. Ada juga Agent Simulation untuk pengujian yang lebih baik sebelum peluncuran.

Platform Projects mengintegrasikan data dari Workspace, OneDrive, dan chat perusahaan, memberikan konteks kepada agen. Selain itu, mereka meluncurkan Gemini Enterprise untuk karyawan biasa, diposisikan sebagai "asisten AI untuk setiap orang", tanpa perlu menulis kode.

Semua ini merupakan serangan ganda - perangkat keras dan perangkat lunak - terhadap Nvidia, OpenAI, dan Anthropic. Google sangat sadar bahwa insinyur di Silicon Valley sering berganti antara Claude dari Anthropic dan Codex dari OpenAI untuk pengembangan AI, jarang mempertimbangkan alat Google. Ini jelas mengganggu kepemimpinan.

Adopsi TPU semakin cepat. Citadel Securities sudah membangun perangkat lunak kuantitatif di TPU Google. 17 laboratorium nasional Departemen Energi AS menggunakan alat kolaboratif berbasis TPU. Meta menandatangani perjanjian jangka panjang untuk menggunakan TPU Google, dan Anthropic berkomitmen dengan kapasitas komputasi dalam skala gigawatt.

Analis dari DA Davidson memperkirakan bahwa nilai gabungan bisnis TPU dan DeepMind Google melebihi US$ 900 miliar pada September lalu.

Menariknya, Google tidak membandingkan langsung TPU barunya dengan produk Nvidia. Sementara itu, Nvidia akan meluncurkan lini baru yang mengintegrasikan teknologi Groq, yang diakuisisi seharga US$ 20 miliar, khusus untuk inferensi dengan latensi ultra rendah. Jensen Huang dari Nvidia menyatakan bahwa lebih dari 20% beban kerja AI dapat ditangani dengan lebih baik oleh chip jenis ini.

Google sedang menguji implementasi TPU di pusat data pelanggan dan mendorong kompatibilitas dengan alat pihak ketiga. Tetapi hambatan pasokan dan ketidaksesuaian antara iterasi cepat model dan siklus pengembangan chip yang memakan waktu bertahun-tahun tetap menjadi tantangan nyata untuk skala.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan