Melewatkan Next '24? Semua sesinya kini tersedia secara on demand. Tonton sekarang.

Arsitektur supercomputing terintegrasi

Hypercomputer AI

Konsumsi, software, dan hardware yang dioptimalkan AI, yang digabungkan untuk meningkatkan produktivitas dan efisiensi.

Lakukan pemeriksaan cepat tentang kesiapan AI

Blog: Memperkenalkan Cloud TPUv5 dan Hyperkomputer AI

Ringkasan

Hardware dengan performa yang dioptimalkan

Infrastruktur kami yang mengoptimalkan performa, termasuk Google Cloud TPU, Google Cloud GPU, Google Cloud Storage, dan jaringan Jupiter yang mendasarinya secara konsisten menyediakan waktu tercepat untuk melatih model canggih dalam skala besar karena karakteristik penskalaan yang andal dari arsitektur ini yang memberikan harga/performa terbaik untuk inferensi model besar.

Perkuat LLM Anda dengan Google Cloud TPU

Pelajari cara Akselerator AI—Google Cloud TPU yang dirancang khusus oleh Google Cloud mengoptimalkan performa untuk workload LLM Anda.

Tonton secara on-demand

Software terbuka

Arsitektur kami dioptimalkan untuk mendukung alat dan library yang paling umum, seperti Tensorflow, Pytorch, dan JAX. Selain itu, arsitektur ini memungkinkan pelanggan untuk memanfaatkan teknologi seperti konfigurasi Cloud TPU Multislice dan Multihost, serta layanan terkelola seperti Google Kubernetes Engine. Hal ini memungkinkan pelanggan memberikan deployment siap pakai untuk workload umum seperti framework NVIDIA NeMO yang diorkestrasi oleh SLURM.

LLM Terbuka di GKE-Llama 2 dan Seterusnya

Pelajari cara meningkatkan performa game platform AI generatif Anda dengan LLM Terbuka di GKE-Llama 2 dan Seterusnya.

Tonton secara on-demand

Konsumsi fleksibel

Model konsumsi kami yang fleksibel memungkinkan pelanggan memilih biaya tetap dengan diskon abonemen atau model on-demand dinamis untuk memenuhi kebutuhan bisnis mereka. Dynamic Workload Scheduler membantu pelanggan mendapatkan kapasitas yang mereka butuhkan tanpa alokasi yang berlebih sehingga pelanggan hanya membayar sesuai kebutuhan. Selain itu, alat pengoptimalan biaya Google Cloud membantu mengotomatiskan penggunaan resource untuk mengurangi tugas manual bagi engineer.

Mengoptimalkan ekonomi dan akses resource untuk workload AI/ML

Pelajari cara layanan Dynamic Workload Scheduler mengoptimalkan eksekusi workload AI Anda.

Baca blog

Cara Kerjanya

Google dinobatkan sebagai pemimpin dalam kecerdasan buatan dengan penemuan teknologi seperti TensorFlow. Tahukah Anda bahwa Anda dapat memanfaatkan teknologi Google untuk project Anda sendiri? Pelajari histori inovasi Google dalam infrastruktur AI dan cara memanfaatkannya untuk workload Anda.

Tonton secara on-demand

Diagram arsitektur Hypercomputer AI Google Cloud beserta foto product manager Google Cloud, bernama Chelsie

Penggunaan Umum

Jalankan pelatihan AI berskala besar

Pelatihan AI yang andal, skalabel, dan efisien

Arsitektur AI Hypercomputer menawarkan opsi untuk menggunakan infrastruktur dasar yang dapat diskalakan dengan baik guna memenuhi kebutuhan pelatihan Anda.

Cara menentukan infrastruktur penyimpanan untuk workload AI

Tiga Diagram yang Mendeskripsikan Faktor Pertumbuhan AI

Petunjuk

Pelatihan AI yang andal, skalabel, dan efisien

Arsitektur AI Hypercomputer menawarkan opsi untuk menggunakan infrastruktur dasar yang dapat diskalakan dengan baik guna memenuhi kebutuhan pelatihan Anda.

Cara menentukan infrastruktur penyimpanan untuk workload AI

Referensi tambahan

Pelatihan AI yang andal, skalabel, dan efisien

Mengukur efektivitas pelatihan berskala besar agar selaras dengan cara Google menggunakan Goodput Produktivitas ML.

Memperkenalkan Goodput Produktivitas ML: metrik untuk mengukur efisiensi sistem AI

Kecepatan Pelatihan TPUv4(bf16) vs TPUv5(int8)

Contoh pelanggan

Character AI memanfaatkan Google Cloud untuk meningkatkan skala

"Kami membutuhkan GPU untuk memberikan respons kepada pesan pengguna. Seiring bertambahnya pengguna di platform kami, kami memerlukan lebih banyak GPU untuk melayani mereka. Jadi di Google Cloud, kami dapat bereksperimen untuk menemukan platform yang tepat untuk workload tertentu. Sangat menyenangkan memiliki fleksibilitas untuk memilih solusi yang paling berharga." Myle Ott, Founding Engineer, Character.AI

Tonton Sekarang

Myle Ott, Founding Engineer, Character.AI

1:36

Menghadirkan aplikasi yang didukung AI