Classification d'images
Traitement distribué sur un pod
Les grands modèles de langage
-
Entraînement sur un TPU individuel à l'aide de Pax
Guide pour entraîner un modèle SPMD avec Pax sur un seul appareil Cloud TPU.
-
Inférence JetStream MaxText sur v5e
Guide de configuration et d'utilisation de JetStream avec MaxText pour l'inférence.
-
Inférence JetStream PyTorch sur v5e
Guide de configuration et d'utilisation de JetStream avec PyTorch pour l'inférence.
-
Diffuser un LLM à l'aide de TPU sur GKE avec vLLM
Guide d'utilisation de vLLM pour diffuser des grands modèles de langage (LLM) à l'aide de TPU (Tensor Processing Units) sur Google Kubernetes Engine (GKE).