Exécutez des charges de travail d'IA/de ML optimisées grâce aux fonctionnalités d'orchestration de plates-formes de Google Kubernetes Engine (GKE). Avec Google Kubernetes Engine (GKE), vous pouvez implémenter une plate-forme d'IA et de ML robuste et prête pour la production avec tous les avantages de Kubernetes géré et les fonctionnalités suivantes :

  • Orchestration de l'infrastructure compatible avec les GPU et les TPU pour les charges de travail d'entraînement et de diffusion à grande échelle
  • Intégration flexible aux frameworks de traitement des données et de calcul distribué
  • Prise en charge de plusieurs équipes sur la même infrastructure afin d'optimiser l'utilisation des ressources
Cette page présente les fonctionnalités d'IA/ML de GKE et explique comment exécuter des charges de travail d'IA/ML optimisées sur GKE avec des GPU, des TPU et des frameworks tels que Hugging Face TGI, vLLM et JetStream.
Essai gratuit

Démarrez votre preuve de concept avec 300 $de crédit offerts

  • Accédez à Gemini 2.0 Flash Thinking
  • Utilisation mensuelle gratuite de produits populaires, y compris les API d'IA et BigQuery
  • Aucuns frais automatiques, aucun engagement
Afficher les offres produit gratuites.

Continuez à explorer le monde avec plus de 20 produits toujours gratuits

Accédez à plus de 20 produits gratuits pour des cas d'utilisation courants, y compris des API d'IA, des VM, des entrepôts de données, et plus encore.

Ressources de documentation

Consultez des guides de démarrage rapide, des guides et des documents de référence clés, et obtenez de l'aide pour résoudre les problèmes courants.
Explorez les auto-formations de Google Cloud Skills Boost, des cas d'utilisation, des architectures de référence et des exemples de code illustrant comment utiliser et se connecter à des Google Cloud services.

Vidéos similaires