Mulai inferensi model AI menggunakan kemampuan AI Generatif GKE.

Halaman ini diterjemahkan oleh Cloud Translation API.

Orkestrasi AI/ML di dokumentasi GKE

Google Kubernetes Engine (GKE) menyediakan satu platform terpadu untuk mengatur seluruh siklus proses AI/ML Anda. Layanan ini memberi Anda kemampuan dan fleksibilitas untuk meningkatkan performa beban kerja pelatihan, inferensi, dan berbasis agen, sehingga Anda dapat menyederhanakan infrastruktur dan mulai memberikan hasil. Kemampuan orkestrasi canggih GKE memberikan hal berikut:

Akselerator hardware: akses dan kelola GPU dan TPU berperforma tinggi yang Anda butuhkan, untuk pelatihan dan inferensi dalam skala besar.
Fleksibilitas stack: berintegrasi dengan framework komputasi terdistribusi, pemrosesan data, dan penyajian model yang sudah Anda kenal dan percayai.
Kesederhanaan Kubernetes terkelola: dapatkan semua manfaat platform terkelola untuk mengotomatiskan, menskalakan, dan meningkatkan keamanan seluruh siklus proses AI/ML Anda sekaligus mempertahankan fleksibilitas.

Jelajahi blog, tutorial, dan praktik terbaik kami untuk melihat cara GKE dapat mengoptimalkan workload AI/ML Anda. Untuk mengetahui informasi selengkapnya tentang manfaat dan fitur yang tersedia, lihat Pengantar ringkasan workload AI/ML di GKE.

Mulai secara gratis

Mulai bukti konsep Anda dengan kredit gratis senilai $300

Mendapatkan akses ke Gemini 2.0 Flash Thinking
Penggunaan bulanan gratis untuk produk populer, termasuk AI API dan BigQuery
Tidak ada biaya otomatis, tanpa komitmen

Melihat penawaran produk gratis

Terus jelajahi dengan lebih dari 20 produk yang selalu gratis

Akses 20+ produk gratis untuk kasus penggunaan umum, termasuk API AI, VM, data warehouse, dan lainnya.

Referensi dokumentasi

Temukan panduan memulai dan panduan, tinjau referensi utama, dan dapatkan bantuan terkait masalah umum.

Mulai inferensi model AI menggunakan kemampuan AI Generatif GKE.

Orkestrasi AI/ML di dokumentasi GKE

Mulai bukti konsep Anda dengan kredit gratis senilai $300

Terus jelajahi dengan lebih dari 20 produk yang selalu gratis

Mengelola infrastruktur dan akselerator AI

Melatih model AI dalam skala besar

Menyajikan model AI untuk Inferensi

Men-deploy aplikasi AI agentic di GKE dengan Agent Development Kit (ADK) dan LLM yang dihosting sendiri

Men-deploy aplikasi AI agentic di GKE dengan Agent Development Kit (ADK) dan Vertex AI

Menyajikan model open source menggunakan TPU di GKE dengan Optimum TPU

Membuat dan menggunakan volume yang didukung oleh instance Parallelstore di GKE

Menyajikan LLM di GKE dengan strategi penyediaan GPU yang hemat biaya dan memiliki ketersediaan tinggi

Menayangkan Model Bahasa Besar dengan KubeRay di TPU

Mempercepat pemuatan data AI/ML dengan Hyperdisk ML

Menyajikan LLM menggunakan TPU di GKE dengan JetStream dan PyTorch

Praktik terbaik untuk mengoptimalkan inferensi LLM dengan GPU di GKE

Mengelola Stack GPU dengan NVIDIA GPU Operator di GKE

Mengonfigurasi penskalaan otomatis untuk workload LLM di TPU

Menyesuaikan model terbuka Gemma menggunakan beberapa GPU di GKE

Men-deploy aplikasi Ray Serve dengan model Stable Diffusion di GKE dengan TPU

Mengonfigurasi penskalaan otomatis untuk workload LLM di GPU dengan GKE

Melatih Llama2 dengan Megatron-LM di virtual machine A3 Mega

Men-deploy beban kerja GPU di Autopilot

Menyajikan LLM dengan beberapa GPU di GKE

Memulai Ray di GKE

Menyajikan LLM di GPU L4 dengan Ray

Mengorkestrasikan workload TPU Multislice menggunakan JobSet dan Kueue

Memantau workload GPU di GKE dengan NVIDIA Data Center GPU Manager (DCGM)

Panduan memulai: Melatih model dengan GPU di cluster GKE Standard

Menjalankan machine learning berskala besar di GKE

TensorFlow di Autopilot GKE dengan akselerasi GPU

Mengimplementasikan sistem antrean Tugas dengan berbagi kuota antar-namespace di GKE

Membangun chatbot RAG dengan GKE dan Cloud Storage

Menganalisis data di GKE menggunakan BigQuery, Cloud Run, dan Gemma

Pra-pemrosesan data terdistribusi dengan GKE dan Ray: Penskalaan untuk perusahaan

Praktik terbaik pemuatan data untuk inferensi AI/ML di GKE

Hemat GPU: Penskalaan otomatis yang lebih cerdas untuk workload inferensi GKE Anda

Menayangkan model AI yang dioptimalkan secara efisien dengan microservice NVIDIA NIM di GKE

Mempercepat Ray dalam produksi dengan Ray Operator baru di GKE

Memaksimalkan throughput penyajian LLM untuk GPU di GKE — panduan praktis

Praktik terbaik untuk menjalankan workload batch di GKE

Penyimpanan AI/ML berperforma tinggi melalui dukungan SSD Lokal di GKE

Machine learning dengan JAX di Kubernetes dengan GPU NVIDIA

Mesin telusur yang disederhanakan: Pendekatan low-code dengan GKE dan Vertex AI Agent Builder

LiveX AI mengurangi biaya dukungan pelanggan dengan agen AI yang dilatih dan ditayangkan di GKE dan NVIDIA AI

Infrastruktur untuk aplikasi AI generatif berkemampuan RAG menggunakan GKE dan Cloud SQL

Arsitektur referensi untuk platform batch processing di GKE

Berinovasi dalam penelusuran paten: Cara IPRally memanfaatkan AI dengan GKE dan Ray

Pembahasan mendalam performa Gemma di Google Cloud

Pembahasan mendalam tentang Gemma di GKE: Inovasi baru dalam menyajikan model AI generatif terbuka

Penjadwalan lanjutan untuk AI/ML dengan Ray dan Kueue

Cara mengamankan Ray di Google Kubernetes Engine

Mendesain penyimpanan untuk workload AI dan ML di Google Cloud

Penginstalan driver otomatis menyederhanakan penggunaan GPU NVIDIA di GKE

Percepat proses AI generatif Anda dengan framework NVIDIA NeMo di GKEE

Mengapa GKE untuk workload AI Ray Anda?

Menyederhanakan MLOps menggunakan Weights & Biases dengan Google Kubernetes Engine

Menjalankan AI di GKE yang terkelola sepenuhnya, kini dengan opsi komputasi, harga, dan reservasi resource baru

Cara SEEN menskalakan output 89x dan mengurangi biaya GPU sebesar 66% menggunakan GKE

Cara Spotify meluncurkan Inovasi ML dengan Ray dan GKE

Cara Ordaōs Bio memanfaatkan AI generatif di GKE

GKE dari startup yang sedang berkembang yang didukung oleh ML

Meningkatkan waktu peluncuran Stable Diffusion di GKE hingga 4 kali lipat

Contoh Google Kubernetes Engine (GKE)

Contoh GKE AI Labs

Platform yang Dipercepat GKE

Video terkait