Documentation sur l'orchestration IA/ML sur GKE
Exécutez des charges de travail d'IA/de ML optimisées grâce aux fonctionnalités d'orchestration de plates-formes de Google Kubernetes Engine (GKE). Avec Google Kubernetes Engine (GKE), vous pouvez implémenter une plate-forme d'IA et de ML robuste et prête pour la production avec tous les avantages de Kubernetes géré et les fonctionnalités suivantes :
- Orchestration de l'infrastructure compatible avec les GPU et les TPU pour les charges de travail d'entraînement et de diffusion à grande échelle
- Intégration flexible aux frameworks de traitement des données et de calcul distribué
- Prise en charge de plusieurs équipes sur la même infrastructure afin d'optimiser l'utilisation des ressources
Démarrez votre preuve de concept avec 300 $de crédit offerts
- Accédez à Gemini 2.0 Flash Thinking
- Utilisation mensuelle gratuite de produits populaires, y compris les API d'IA et BigQuery
- Aucuns frais automatiques, aucun engagement
Continuez à explorer le monde avec plus de 20 produits toujours gratuits
Accédez à plus de 20 produits gratuits pour des cas d'utilisation courants, y compris des API d'IA, des VM, des entrepôts de données, et plus encore.
Ressources de documentation
Diffuser des modèles ouverts sur GKE
-
NOUVEAU !
Diffuser des LLM tels que Deepseek-R1 671B ou Llama 3.1 405B sur GKE
-
NOUVEAU !
Diffuser un LLM à l'aide de TPU sur GKE avec KubeRay
-
Tutoriel
Diffuser un LLM à l'aide de TPU Trillium sur GKE avec vLLM
-
Tutoriel
Guide de démarrage rapide: Diffuser un LLM à l'aide d'un seul GPU sur GKE
-
Tutoriel
Diffuser Gemma à l'aide de GPU sur GKE avec Hugging Face TGI
-
Tutoriel
Diffuser Gemma à l'aide de GPU sur GKE avec vLLM
Orchestrer les TPU et les GPU à grande échelle
-
NOUVEAU !
Optimiser l'utilisation des ressources GKE pour les charges de travail d'entraînement et d'inférence mixtes d'IA/ML
-
Vidéo
Présentation des Cloud TPU pour le machine learning
-
Vidéo
Créer des modèles de machine learning à grande échelle dans Cloud TPU avec GKE
-
Vidéo
Diffuser des grands modèles de langage avec KubeRay sur TPU
-
Blog
Machine learning à l'aide de JAX sur Kubernetes avec des GPU NVIDIA
Optimisation des coûts et orchestration des jobs
-
NOUVEAU !
Architecture de référence pour une plate-forme de traitement par lot sur GKE
-
Blog
Stockage de modèles d'IA et de ML hautes performances grâce à la compatibilité avec les disques SSD locaux sur GKE
-
Blog
Simplifier le MLOps à l'aide des pondérations et des biais avec Google Kubernetes Engine
-
Bonne pratique
Bonnes pratiques pour l'exécution de charges de travail par lot sur GKE
-
Bonne pratique
Exécuter des applications Kubernetes à coût maîtrisé sur GKE
-
Bonne pratique
Améliorer le temps de lancement de Stable Diffusion sur GKE par quatre