Orkestrasi AI/ML di dokumentasi GKE
Jalankan workload AI/ML yang dioptimalkan dengan kemampuan orkestrasi platform Google Kubernetes Engine (GKE). Dengan Google Kubernetes Engine (GKE), Anda dapat menerapkan platform AI/ML yang tangguh dan siap produksi dengan semua manfaat Kubernetes terkelola dan kemampuan berikut:
- Orkestrasi infrastruktur yang mendukung GPU dan TPU untuk pelatihan dan penyajian workload dalam skala besar.
- Integrasi yang fleksibel dengan framework komputasi dan pemrosesan data terdistribusi.
- Dukungan untuk beberapa tim pada infrastruktur yang sama untuk memaksimalkan penggunaan resource
Mulai bukti konsep Anda dengan kredit gratis senilai $300
- Dapatkan akses ke Flash Thinking Gemini 2.0
- Penggunaan bulanan gratis untuk produk populer, termasuk AI API dan BigQuery
- Tidak ada tagihan otomatis, tanpa komitmen
Teruslah menjelajah dengan lebih dari 20 produk yang selalu gratis
Akses 20+ produk gratis untuk kasus penggunaan umum, termasuk API AI, VM, data warehouse, dan lainnya.
Referensi dokumentasi
Menayangkan model terbuka di GKE
-
BARU!
Menayangkan LLM seperti Deepseek-R1 671B atau Llama 3.1 405B di GKE
-
BARU!
Menyajikan LLM menggunakan TPU Trillium di GKE dengan vLLM
-
Tutorial
Panduan memulai: Menyajikan LLM menggunakan satu GPU di GKE
-
Tutorial
Menyajikan Gemma menggunakan GPU di GKE dengan Hugging Face TGI
-
Tutorial
Menyajikan Gemma menggunakan GPU di GKE dengan vLLM
-
Tutorial
Menayangkan Gemma menggunakan GPU di GKE dengan NVIDIA Triton dan TensorRT-LLM
Mengorkestrasi TPU dan GPU dalam skala besar
-
BARU!
Mengoptimalkan penggunaan resource GKE untuk workload inferensi dan pelatihan AI/ML campuran
-
Video
Pengantar Cloud TPU untuk machine learning.
-
Video
Membangun machine learning berskala besar di Cloud TPU dengan GKE
-
Video
Menayangkan Model Bahasa Besar dengan KubeRay di TPU
-
Blog
Machine learning dengan JAX di Kubernetes dengan GPU NVIDIA
Pengoptimalan biaya dan orkestrasi tugas
-
BARU!
Arsitektur referensi untuk platform pemrosesan batch di GKE
-
Blog
Penyimpanan AI/ML berperforma tinggi melalui dukungan SSD Lokal di GKE
-
Blog
Menyederhanakan MLOps menggunakan Weights & Biases dengan Google Kubernetes Engine
-
Praktik terbaik
Praktik terbaik untuk menjalankan workload batch di GKE
-
Praktik terbaik
Menjalankan aplikasi Kubernetes yang hemat biaya di GKE
-
Praktik terbaik
Meningkatkan waktu peluncuran Stable Diffusion di GKE hingga 4 kali lipat