Orkestrasi AI/ML di dokumentasi GKE

Jalankan workload AI/ML yang dioptimalkan dengan kemampuan orkestrasi platform Google Kubernetes Engine (GKE). Dengan Google Kubernetes Engine (GKE), Anda dapat menerapkan platform AI/ML yang tangguh dan siap produksi dengan semua manfaat Kubernetes terkelola dan kemampuan berikut:

  • Orkestrasi infrastruktur yang mendukung GPU dan TPU untuk pelatihan dan penyajian workload dalam skala besar.
  • Integrasi yang fleksibel dengan framework komputasi dan pemrosesan data terdistribusi.
  • Dukungan untuk beberapa tim pada infrastruktur yang sama untuk memaksimalkan penggunaan resource
Halaman ini memberikan ringkasan tentang kemampuan AI/ML GKE dan cara mulai menjalankan beban kerja AI/ML yang dioptimalkan di GKE dengan GPU, TPU, dan framework seperti Hugging Face TGI, vLLM, dan JetStream.
  • Mendapatkan akses ke Gemini 2.0 Flash Thinking
  • Penggunaan bulanan gratis untuk produk populer, termasuk AI API dan BigQuery
  • Tidak ada tagihan otomatis, tanpa komitmen
Melihat penawaran produk gratis

Terus jelajahi dengan lebih dari 20 produk yang selalu gratis

Akses 20+ produk gratis untuk kasus penggunaan umum, termasuk API AI, VM, data warehouse, dan lainnya.

Referensi dokumentasi

Temukan panduan dan panduan memulai, tinjau referensi utama, dan dapatkan bantuan terkait masalah umum.
Pelajari pelatihan mandiri dari Google Cloud Skills Boost, kasus penggunaan, arsitektur referensi, dan contoh kode dengan contoh cara menggunakan dan menghubungkan layanan Google Cloud .
pelatihan
Pelatihan dan tutorial

Pelajari cara men-deploy LLM menggunakan Tensor Processing Unit (TPU) di GKE dengan framework penayangan TPU Optimum dari Hugging Face.

Tutorial Inferensi AI/ML TPU

pelatihan
Pelatihan dan tutorial

Pelajari cara membuat penyimpanan yang didukung oleh instance Parallelstore yang dikelola sepenuhnya, dan mengaksesnya sebagai volume. Driver CSI dioptimalkan untuk workload pelatihan AI/ML yang melibatkan ukuran file yang lebih kecil dan pembacaan acak.

Tutorial Pemuatan Data AI/ML

pelatihan
Pelatihan dan tutorial

Pelajari cara menyederhanakan dan mempercepat pemuatan bobot model AI/ML di GKE menggunakan Hyperdisk ML.

Tutorial Pemuatan Data AI/ML

pelatihan
Pelatihan dan tutorial

Pelajari cara menayangkan LLM menggunakan Tensor Processing Unit (TPU) di GKE dengan JetStream melalui PyTorch.

Tutorial Inferensi AI/ML TPU

pelatihan
Pelatihan dan tutorial

Pelajari praktik terbaik untuk mengoptimalkan performa inferensi LLM dengan GPU di GKE menggunakan framework penayangan vLLM dan Text Generation Inference (TGI).

Tutorial Inferensi AI/ML GPU

pelatihan
Pelatihan dan tutorial

Pelajari kapan harus menggunakan operator GPU NVIDIA dan cara mengaktifkan Operator GPU NVIDIA di GKE.

Tutorial GPU

pelatihan
Pelatihan dan tutorial

Pelajari cara menyiapkan infrastruktur penskalaan otomatis menggunakan Autoscaler Pod Horizontal (HPA) GKE untuk men-deploy Gemma LLM menggunakan JetStream satu host.

Tutorial TPU

pelatihan
Pelatihan dan tutorial

Pelajari cara menyesuaikan Gemma LLM menggunakan GPU di GKE dengan library Hugging Face Transformers.

Tutorial Inferensi AI/ML GPU

pelatihan
Pelatihan dan tutorial

Pelajari cara men-deploy dan menayangkan model Diffusion Stabil di GKE menggunakan TPU, Ray Serve, dan add-on Ray Operator.

Tutorial Inferensi AI/ML Ray TPU

pelatihan
Pelatihan dan tutorial

Pelajari cara menyiapkan infrastruktur penskalaan otomatis menggunakan Autoscaler Pod Horizontal (HPA) GKE untuk men-deploy Gemma LLM dengan framework penayangan Antarmuka Pembuatan Teks (TGI) Hugging Face.

Tutorial GPU

pelatihan
Pelatihan dan tutorial

Pelajari cara menjalankan workload PyTorch Megatron-LM berbasis container di A3 Mega.

Tutorial Pelatihan AI/ML GPU

pelatihan
Pelatihan dan tutorial

Pelajari cara meminta akselerator hardware (GPU) di workload Autopilot GKE Anda

Tutorial GPU

pelatihan
Pelatihan dan tutorial

Pelajari cara menayangkan Llama 2 70B atau Falcon 40B menggunakan beberapa GPU NVIDIA L4 dengan GKE.

Tutorial Inferensi AI/ML GPU

pelatihan
Pelatihan dan tutorial

Pelajari cara mudah menggunakan Ray di GKE dengan menjalankan workload di cluster Ray.

Tutorial Ray

pelatihan
Pelatihan dan tutorial

Pelajari cara menayangkan Falcon 7b, Llama2 7b, Falcon 40b, atau Llama2 70b menggunakan framework Ray di GKE.

Tutorial Inferensi AI/ML Ray GPU

pelatihan
Pelatihan dan tutorial

Pelajari cara mengatur workload Jax di beberapa slice TPU di GKE menggunakan JobSet dan Kueue.

Tutorial TPU

pelatihan
Pelatihan dan tutorial

Pelajari cara mengamati workload GPU di GKE dengan NVIDIA Data Center GPU Manager (DCGM).

Tutorial Observabilitas AI/ML GPU

pelatihan
Pelatihan dan tutorial

Panduan memulai ini menunjukkan cara men-deploy model pelatihan dengan GPU di GKE dan menyimpan prediksi di Cloud Storage.

Tutorial Pelatihan AI/ML GPU

pelatihan
Pelatihan dan tutorial

Video ini menunjukkan cara GKE membantu memecahkan tantangan umum dalam melatih model AI besar dalam skala besar, dan praktik terbaik untuk melatih dan menyediakan model machine learning berskala besar di GKE.

Video Pelatihan AI/ML Inferensi AI/ML

pelatihan
Pelatihan dan tutorial

Postingan blog ini adalah panduan langkah demi langkah untuk pembuatan, eksekusi, dan pembongkaran notebook Jupiter dengan dukungan Tensorflow.

Blog Pelatihan AI/ML Inferensi AI ML GPU

pelatihan
Pelatihan dan tutorial

Tutorial ini menggunakan Kueue untuk menunjukkan cara menerapkan sistem antrean Tugas, serta mengonfigurasi resource workload dan pembagian kuota antar-namespace yang berbeda di GKE.

Tutorial Batch AI/ML

pelatihan
Pelatihan dan tutorial

Tutorial ini menunjukkan cara mengintegrasikan aplikasi Model Bahasa Besar berdasarkan pembuatan yang ditingkatkan pengambilan dengan file PDF yang Anda upload ke bucket Cloud Storage.

Tutorial Pemuatan Data AI/ML

pelatihan
Pelatihan dan tutorial

Tutorial ini menunjukkan cara menganalisis set data besar di GKE dengan memanfaatkan BigQuery untuk penyimpanan dan pemrosesan data, Cloud Run untuk penanganan permintaan, dan Gemma LLM untuk analisis dan prediksi data.

Tutorial Pemuatan Data AI/ML

kasus penggunaan
Kasus penggunaan

Pelajari cara memanfaatkan GKE dan Ray untuk memproses data set besar secara efisien untuk machine learning.

MLOps Pelatihan Ray

kasus penggunaan
Kasus penggunaan

Pelajari cara mempercepat waktu pemuatan data untuk aplikasi machine learning Anda di Google Kubernetes Engine.

Inferensi Hyperdisk ML Cloud Storage FUSE

kasus penggunaan
Kasus penggunaan

Pelajari cara mengoptimalkan biaya inferensi GPU dengan menyesuaikan Horizontal Pod Autoscaler GKE untuk efisiensi maksimum.

Inferensi GPU HPA

kasus penggunaan
Kasus penggunaan

Pelajari cara men-deploy microservice NVIDIA NIM canggih di GKE dengan mudah dan mempercepat workload AI Anda.

AI NVIDIA NIM

kasus penggunaan
Kasus penggunaan

Pelajari cara Ray Operator di GKE menyederhanakan deployment produksi AI/ML Anda, sehingga meningkatkan performa dan skalabilitas.

AI TPU Ray

kasus penggunaan
Kasus penggunaan

Pelajari cara memaksimalkan throughput penayangan model bahasa besar (LLM) untuk GPU di GKE, termasuk keputusan infrastruktur dan pengoptimalan server model.

LLM GPU NVIDIA

kasus penggunaan
Kasus penggunaan

Cara mem-build mesin telusur dengan Google Cloud, menggunakan Vertex AI Agent Builder, Vertex AI Search, dan GKE.

Penelusuran Agen Vertex AI

kasus penggunaan
Kasus penggunaan

Cara LiveX AI menggunakan GKE untuk membuat agen AI yang meningkatkan kepuasan pelanggan dan mengurangi biaya.

GenAI NVIDIA GPU

kasus penggunaan
Kasus penggunaan

Arsitektur referensi untuk menjalankan aplikasi AI generatif dengan retrieval-augmented generation (RAG) menggunakan GKE, Cloud SQL, Ray, Hugging Face, dan LangChain.

GenAI RAG Ray

kasus penggunaan
Kasus penggunaan

Cara IPRally menggunakan GKE dan Ray untuk membuat platform ML yang skalabel dan efisien untuk penelusuran paten yang lebih cepat dengan akurasi yang lebih baik.

AI Ray GPU

kasus penggunaan
Kasus penggunaan

Manfaatkan Gemma di Cloud GPU dan Cloud TPU untuk efisiensi inferensi dan pelatihan di GKE.

AI Gemma Performa

kasus penggunaan
Kasus penggunaan

Gunakan model terbuka Gemma terbaik di kelasnya untuk membuat aplikasi AI yang portabel dan dapat disesuaikan, lalu men-deploynya di GKE.

AI Gemma Performa

kasus penggunaan
Kasus penggunaan

Mengorkestrasi aplikasi Ray di GKE dengan KubeRay dan Kueue.

Kueue Ray KubeRay

kasus penggunaan
Kasus penggunaan

Terapkan insight keamanan dan teknik hardening untuk melatih workload AI/ML menggunakan Ray di GKE.

AI Ray Security

kasus penggunaan
Kasus penggunaan

Pilih kombinasi opsi penyimpanan terbaik untuk workload AI dan ML di Google Cloud.

AI ML Penyimpanan

kasus penggunaan
Kasus penggunaan

Menginstal driver GPU Nvidia secara otomatis di GKE.

GPU NVIDIA Penginstalan

kasus penggunaan
Kasus penggunaan

Melatih model AI generatif menggunakan GKE dan framework NVIDIA NeMo.

GenAI NVIDIA NeMo

kasus penggunaan
Kasus penggunaan

Tingkatkan skalabilitas, efisiensi biaya, toleransi error, isolasi, dan portabilitas dengan menggunakan GKE untuk workload Ray.

AI Ray Scale

kasus penggunaan
Kasus penggunaan

Dapatkan dukungan GPU, performa, dan harga yang lebih rendah untuk workload AI/ML dengan GKE Autopilot.

GPU Autopilot Performa

kasus penggunaan
Kasus penggunaan

Startup menskalakan output video yang dipersonalisasi dengan GKE.

GPU Skala Penampung

kasus penggunaan
Kasus penggunaan

Cara Ray mengubah pengembangan ML di Spotify.

ML Ray Container

kasus penggunaan
Kasus penggunaan

Ordaōs Bio, salah satu akselerator AI terkemuka untuk penelitian dan penemuan biomedis, sedang mencari solusi terhadap imunoterapi baru untuk onkologi dan penyakit inflamasi kronis.

Performa TPU Pengoptimalan biaya

kasus penggunaan
Kasus penggunaan

Cara Moloco, sebuah startup Silicon Valley, memanfaatkan kecanggihan GKE dan Tensor Flow Enterprise untuk meningkatkan infrastruktur machine learning (ML)-nya.

ML Skala Pengoptimalan biaya

contoh kode
Contoh Kode

Lihat contoh aplikasi yang digunakan dalam tutorial produk GKE resmi.

contoh kode
Contoh Kode

Lihat contoh eksperimental untuk memanfaatkan GKE guna mempercepat inisiatif AI/ML Anda.

Video terkait