Klasifikasi Gambar
Pemrosesan Terdistribusi di Pod
Model Bahasa Besar
-
Melatih di TPU perangkat tunggal menggunakan Pax
Panduan untuk melatih model SPMD dengan Pax di Cloud TPU perangkat tunggal.
-
Inferensi MaxText JetStream di v5e
Panduan untuk menyiapkan dan menggunakan JetStream dengan MaxText untuk inferensi.
-
Inferensi PyTorch JetStream di v5e
Panduan untuk menyiapkan dan menggunakan JetStream dengan PyTorch untuk inferensi.
-
Menyajikan LLM menggunakan TPU di GKE dengan vLLM
Panduan untuk menggunakan vLLM guna menayangkan model bahasa besar (LLM) menggunakan Tensor Processing Unit (TPU) di Google Kubernetes Engine (GKE).