Orkestrasi AI/ML di dokumentasi GKE
Jalankan workload AI/ML yang dioptimalkan dengan kemampuan orkestrasi platform Google Kubernetes Engine (GKE). Dengan Google Kubernetes Engine (GKE), Anda dapat menerapkan platform AI/ML yang tangguh dan siap produksi dengan semua manfaat Kubernetes terkelola dan kemampuan berikut:
- Orkestrasi infrastruktur yang mendukung GPU dan TPU untuk pelatihan dan penyajian workload dalam skala besar.
- Integrasi yang fleksibel dengan framework komputasi dan pemrosesan data terdistribusi.
- Dukungan untuk beberapa tim pada infrastruktur yang sama untuk memaksimalkan penggunaan resource
Mulai bukti konsep Anda dengan kredit gratis senilai $300
- Dapatkan akses ke Flash Thinking Gemini 2.0
- Penggunaan bulanan gratis untuk produk populer, termasuk AI API dan BigQuery
- Tidak ada tagihan otomatis, tanpa komitmen
Referensi dokumentasi
Menayangkan model terbuka di GKE
-
BARU!
Menayangkan LLM seperti Deepseek-R1 671B atau Llama 3.1 405B di GKE
-
BARU!
Menyajikan LLM menggunakan TPU di GKE dengan KubeRay
-
Tutorial
Menyajikan LLM menggunakan TPU Trillium di GKE dengan vLLM
-
Tutorial
Panduan memulai: Menyajikan LLM menggunakan satu GPU di GKE
-
Tutorial
Menyajikan Gemma menggunakan GPU di GKE dengan Hugging Face TGI
-
Tutorial
Menyajikan Gemma menggunakan GPU di GKE dengan vLLM
Mengorkestrasi TPU dan GPU dalam skala besar
-
BARU!
Mengoptimalkan penggunaan resource GKE untuk workload inferensi dan pelatihan AI/ML campuran
-
Video
Pengantar Cloud TPU untuk machine learning.
-
Video
Membangun machine learning berskala besar di Cloud TPU dengan GKE
-
Video
Menayangkan Model Bahasa Besar dengan KubeRay di TPU
-
Blog
Machine learning dengan JAX di Kubernetes dengan GPU NVIDIA
Pengoptimalan biaya dan orkestrasi tugas
-
BARU!
Arsitektur referensi untuk platform pemrosesan batch di GKE
-
Blog
Penyimpanan AI/ML berperforma tinggi melalui dukungan SSD Lokal di GKE
-
Blog
Menyederhanakan MLOps menggunakan Weights & Biases dengan Google Kubernetes Engine
-
Praktik terbaik
Praktik terbaik untuk menjalankan workload batch di GKE
-
Praktik terbaik
Menjalankan aplikasi Kubernetes yang hemat biaya di GKE
-
Praktik terbaik
Meningkatkan waktu peluncuran Stable Diffusion di GKE hingga 4 kali lipat
Referensi terkait
Video terkait
Why GKE is perfect for running batch workloads
Kubernetes is the top container orchestration platform for batch workloads like data processing, machine learning, and scientific simulations. In this video, Mofi Rahman, Cloud Advocate at Google, discusses why Google Kubernetes Engine (GKE) is the
Designing Google Kubernetes clusters for massive scale and performance
Being an industry leader in running massive scale container workloads is what Google is known for. Learn from us and our customers the key best practices for designing clusters and workloads for large scale and performance on GKE. This session will