Ejecuta cargas de trabajo de IA/AA optimizadas con las funciones de organización de la plataforma Google Kubernetes Engine (GKE). Con Google Kubernetes Engine (GKE), puedes implementar una plataforma de IA y AA sólida y lista para la producción con todos los beneficios de Kubernetes administrado y estas capacidades:

  • Organización de infraestructura que admite GPU y TPU para el entrenamiento y la entrega de cargas de trabajo a gran escala
  • Integración flexible en frameworks de procesamiento distribuido y procesamiento de datos.
  • Compatibilidad con varios equipos en la misma infraestructura a fin de maximizar el uso de los recursos
En esta página, se proporciona una descripción general de las capacidades de IA/AA de GKE y cómo comenzar a ejecutar cargas de trabajo de IA/AA optimizadas en GKE con GPUs, TPU y frameworks como TGI de Hugging Face, vLLM y JetStream.

Recursos de documentación

Encuentra guías de inicio rápido y otras guías, revisa las referencias clave y obtén ayuda con problemas habituales.
Explora la capacitación de autoaprendizaje de Google Cloud Skills Boost, casos de uso, arquitecturas de referencia y muestras de código con ejemplos de cómo usar y conectar los servicios de Google Cloud.

Videos relacionados

Kubernetes is the top container orchestration platform for batch workloads like data processing, machine learning, and scientific simulations. In this video, Mofi Rahman, Cloud Advocate at Google, discusses why Google Kubernetes Engine (GKE) is the

Learn best practices on how to run batch and high-performance computing workloads on Google Kubernetes Engine (GKE) and how PGS used these to replace their 260,000-core Cray supercomputers. Hear about the latest feature launches in the data

In this episode of GKE Essentials, we continue our 2-part series on building large scale GKE clusters, this time exploring how to think about your usage of GKE and foundational Google Cloud resources you need when building a large GKE cluster. Watch