Orkestrasi AI/ML di dokumentasi GKE
Jalankan workload AI/ML yang dioptimalkan dengan kemampuan orkestrasi platform Google Kubernetes Engine (GKE). Dengan Google Kubernetes Engine (GKE), Anda dapat menerapkan platform AI/ML yang tangguh dan siap produksi dengan semua manfaat Kubernetes terkelola dan kemampuan berikut:
- Orkestrasi infrastruktur yang mendukung GPU dan TPU untuk pelatihan dan penyajian workload dalam skala besar.
- Integrasi yang fleksibel dengan framework komputasi dan pemrosesan data terdistribusi.
- Dukungan untuk beberapa tim pada infrastruktur yang sama untuk memaksimalkan penggunaan resource
Mulai project baru Anda dengan kredit gratis senilai $300
Buat dan uji bukti konsep dengan kredit uji coba gratis dan penggunaan gratis bulanan untuk lebih dari 20 produk.
Teruslah menjelajah dengan lebih dari 20 produk yang selalu gratis
Akses 20+ produk gratis untuk kasus penggunaan umum, termasuk API AI, VM, data warehouse, dan lainnya.
Referensi dokumentasi
Menayangkan model terbuka di GKE
-
BARU!
Menyajikan LLM menggunakan TPU Trillium (v6e) di GKE dengan vLLM
-
Tutorial
Panduan memulai: Menyajikan LLM menggunakan satu GPU di GKE
-
Tutorial
Menyajikan Gemma menggunakan GPU di GKE dengan Hugging Face TGI
-
Tutorial
Menyajikan Gemma menggunakan GPU di GKE dengan vLLM
-
Tutorial
Menayangkan Gemma menggunakan GPU di GKE dengan NVIDIA Triton dan TensorRT-LLM
-
Tutorial
Menyajikan Gemma menggunakan TPU di GKE dengan JetStream
Mengorkestrasi TPU dan GPU dalam skala besar
-
Video
Pengantar Cloud TPU untuk machine learning.
-
Video
Membangun machine learning berskala besar di Cloud TPU dengan GKE
-
Video
Menayangkan Model Bahasa Besar dengan KubeRay di TPU
-
Blog
Machine learning dengan JAX di Kubernetes dengan GPU NVIDIA
-
Blog
Membangun platform machine learning (ML) dengan Kubeflow dan Ray di GKE
Pengoptimalan biaya dan orkestrasi tugas
-
BARU!
Arsitektur referensi untuk platform pemrosesan batch di GKE
-
Blog
Penyimpanan AI/ML berperforma tinggi melalui dukungan SSD Lokal di GKE
-
Blog
Menyederhanakan MLOps menggunakan Weights & Biases dengan Google Kubernetes Engine
-
Praktik terbaik
Praktik terbaik untuk menjalankan workload batch di GKE
-
Praktik terbaik
Menjalankan aplikasi Kubernetes yang hemat biaya di GKE
-
Praktik terbaik
Meningkatkan waktu peluncuran Stable Diffusion di GKE hingga 4 kali lipat