English
Deutsch
Español – América Latina
Français
Indonesia
Italiano
Português – Brasil
中文 – 简体
日本語
한국어

Kontakt Jetzt kostenlos testen

Diese Seite wurde von der Cloud Translation API übersetzt.

Anleitungen

Large Language Models

JetStream MaxText-Inferenz in Version 6e

Eine Anleitung zum Einrichten und Verwenden von JetStream mit MaxText für die Inferenz in v6e.
JetStream-PyTorch-Inferenz auf v6e

Eine Anleitung zum Einrichten und Verwenden von JetStream mit PyTorch für die Inferenz in v6e.
vLLM-Inferenz auf v6e

Eine Anleitung zum Einrichten und Verwenden von vLLM für die Inferenz bei v6e.
LLM mithilfe von TPUs in GKE mit vLLM bereitstellen

Leitfaden zur Verwendung von vLLM zum Bereitstellen von Large Language Models (LLMs) mit Tensor Processing Units (TPUs) in der Google Kubernetes Engine (GKE)

Diffusionsmodelle

MaxDiffusion-Inferenz auf v6e

Eine Anleitung zum Einrichten und Verwenden von MaxDiffusion für die Inferenz in v6e.

Bildklassifizierung

ResNet auf Cloud TPU (PyTorch) trainieren

ResNet-Bildklassifizierungsmodell mit PyTorch, optimiert für die Ausführung auf Cloud TPU

Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.