Ironwood Tensor Processing Unit (TPU)

Ironwood: TPU Generasi ke-7 Google Cloud yang Dirancang untuk Inferensi

Latih, sesuaikan, dan sajikan model dan set data yang lebih besar secara efisien dengan TPU yang paling canggih.

Minta informasi selengkapnya tentang Ironwood.

Nama depan

Nama belakang

Email bisnis

Kode Panggilan

Nomor telepon bisnis

Jabatan

Nama perusahaan

Daftarkan saya untuk menerima berita, info terbaru produk, informasi acara, dan penawaran spesial tentang Google Cloud dari Google.

Saya memahami bahwa data pribadi saya akan diproses sesuai Kebijakan Privasi Google.

Apakah infrastruktur Anda siap untuk era inferensi?

Ironwood adalah Tensor Processing Unit (TPU) Google yang paling canggih, andal, dan hemat energi, yang dirancang untuk mendukung model AI inferensi dalam skala besar. Berbekal pengalaman luas dalam mengembangkan TPU untuk layanan internal Google dan pelanggan Google Cloud, Ironwood dirancang untuk menangani kebutuhan komputasi dan memori model seperti Model Bahasa Besar (LLM), Campuran Pakar (MoE), dan tugas penalaran canggih. Ironwood mendukung workload pelatihan dan penyajian dalam arsitektur AI Hypercomputer Google Cloud.

Dioptimalkan untuk Model Bahasa Besar (LLM): Ironwood dirancang khusus untuk mempercepat peningkatan permintaan LLM dan aplikasi AI generatif.
Enhanced Interconnect Technology: Manfaatkan peningkatan pada teknologi interconnect TPU, yang memungkinkan komunikasi lebih cepat dan latensi lebih rendah.
Komputasi Berperforma Tinggi: Dapatkan peningkatan performa yang signifikan untuk berbagai tugas inferensi.
Sustainable AI: Ironwood melanjutkan komitmen Google Cloud terhadap keberlanjutan, yang memberikan performa luar biasa dengan efisiensi energi yang dioptimalkan

Ironwood mengintegrasikan peningkatan kepadatan komputasi, kapasitas memori, dan bandwidth interkoneksi dengan peningkatan signifikan dalam efisiensi daya. Fitur-fitur ini dirancang untuk memungkinkan throughput yang lebih tinggi dan latensi yang lebih rendah untuk workload pelatihan dan penyajian AI yang menuntut, khususnya yang melibatkan model besar dan kompleks. TPU Ironwood beroperasi dalam arsitektur AI Hypercomputer Google Cloud.

Produk-produk AI Cloud mematuhi kebijakan SLA kami. Produk tersebut mungkin menawarkan jaminan latensi atau ketersediaan yang berbeda dari layanan Google Cloud lainnya.