Bildklassifizierung
Verteilte Verarbeitung auf einem Pod
Large Language Models
-
Mit Pax auf einer einzelnen TPU trainieren
Leitfaden zum Trainieren eines SPMD-Modells mit Pax auf einer einzelnen Cloud TPU.
-
JetStream MaxText-Inferenz auf v5e
Eine Anleitung zum Einrichten und Verwenden von JetStream mit MaxText für die Inferenz.
-
JetStream-PyTorch-Inferenz auf v5e
Eine Anleitung zum Einrichten und Verwenden von JetStream mit PyTorch für die Inferenz.
-
LLM mithilfe von TPUs in GKE mit vLLM bereitstellen
Leitfaden zur Verwendung von vLLM zum Bereitstellen von Large Language Models (LLMs) mit Tensor Processing Units (TPUs) in der Google Kubernetes Engine (GKE)