Clasificación de imágenes
Procesamiento distribuido en un pod
Los modelos de lenguaje grandes
-
Entrena en una TPU de un solo dispositivo con Pax
Guía para entrenar un modelo SPMD con Pax en una Cloud TPU de un solo dispositivo.
-
Inferencia de JetStream MaxText en v5e
Una guía para configurar y usar JetStream con MaxText para la inferencia.
-
Inferencia de JetStream PyTorch en v5e
Una guía para configurar y usar JetStream con PyTorch para la inferencia.
-
Entrega un LLM con TPU en GKE con vLLM
Una guía para usar vLLM para entregar modelos de lenguaje grandes (LLM) con unidades de procesamiento tensorial (TPU) en Google Kubernetes Engine (GKE).