Classificação de imagens
Processamento distribuído em um pod
Modelos de linguagem grande
-
Treinar em uma TPU de dispositivo único usando o Pax
Um guia para treinar um modelo SPMD com Pax em um único dispositivo Cloud TPU.
-
Inferência do JetStream MaxText no v5e
Um guia para configurar e usar o JetStream com o MaxText para inferência.
-
Inferência do PyTorch do JetStream na v5e
Um guia para configurar e usar o JetStream com o PyTorch para inferência.
-
Disponibilizar um LLM usando TPUs no GKE com o vLLM
Um guia para usar o vLLM para veicular modelos de linguagem grandes (LLMs) usando Unidades de Processamento de Tensor (TPUs) no Google Kubernetes Engine (GKE).