Diese Seite wurde von der Cloud Translation API übersetzt.

Cloud TPU-Umgebung einrichten

Bevor Sie Cloud TPU-Ressourcen zum Trainieren von Modellen oder zum Ausführen von Inferenzen verwenden können, müssen Sie die folgenden Schritte ausführen:

Google Cloud Projekt einrichten
Umgebung für die Verwendung von Cloud TPU einrichten
Vorbereitung auf die Anforderung einer Cloud TPU

Google Cloud Projekt einrichten

Sie benötigen ein Google Cloud Konto und ein Projekt, um Cloud TPU verwenden zu können.

Melden Sie sich in der Google Cloud Console in Ihrem Google-Konto an oder registrieren Sie sich für ein neues Konto.
Erstellen Sie ein Google Cloud Projekt. Weitere Informationen finden Sie unter Projekt erstellen.
Aktivieren Sie die Abrechnung für Ihr Google Cloud Projekt.

Die Abrechnungseinrichtung ist für die gesamte Google Cloud Nutzung erforderlich. Kosten werden Ihnen erst in Rechnung gestellt, wenn Sie Google Cloud -Ressourcen nutzen. Weitere Informationen finden Sie in der Dokumentation zu Cloud Billing.

Die Abrechnung für die Nutzung aller Cloud TPU-Versionen erfolgt gemäß den standardmäßigen regionalen Preisen, die auf der Preisseite für Cloud TPU aufgeführt sind.
Installieren Sie die Google Cloud CLI. Die Google Cloud CLI ist eine Reihe von Bibliotheken und Tools, mit denen Sie auf Ressourcen und Dienste zugreifen und diese verwalten können. Google Cloud

Hinweis: Wenn Sie eine bestimmte Version der gcloud CLI-Komponenten verwenden müssen, installieren Sie diese Komponenten, damit die relevanten Befehle und Flags unterstützt werden. Führen Sie beispielsweise für Alpha-Komponenten gcloud components install alpha aus.
Hinweis: Wenn Sie die gcloud CLI bereits installiert haben, prüfen Sie, ob Sie die neueste Version haben, indem Sie gcloud components update ausführen.
Konfigurieren Sie den Befehl gcloud, den Sie im Rahmen der Google Cloud CLI installiert haben.

Führen Sie die folgenden Befehle aus, um gcloud für die Verwendung Ihres Google Cloud-Projekts zu konfigurieren.
```
$ gcloud config set project PROJECT-ID
```
Die Abrechnung für Ihr Google Cloud -Projekt muss aktiviert sein.

Die Abrechnungseinrichtung ist für die gesamte Google Cloud Nutzung erforderlich. Kosten werden Ihnen erst in Rechnung gestellt, wenn Sie Google Cloud -Ressourcen nutzen. Weitere Informationen finden Sie in der Dokumentation zu Cloud Billing.

Die Abrechnung für die Nutzung aller Cloud TPU-Versionen erfolgt gemäß den standardmäßigen regionalen Preisen, die auf der Preisseite für Cloud TPU aufgeführt sind.

Umgebung für die Verwendung von Cloud TPU einrichten

Bevor Sie eine Cloud TPU anfordern können, müssen Sie die Cloud TPU API aktivieren und dafür sorgen, dass Sie berechtigt sind, den Zugriff in Ihrem Projekt zu verwalten und eine Cloud TPU zu erstellen. Außerdem wird empfohlen, ein nutzerverwaltetes Dienstkonto zu erstellen, das Sie mit Ihrer TPU verknüpfen.

Aktivieren Sie die Cloud TPU API in der Google Cloud Console oder mit der gcloud CLI in der Cloud Shell:
gcloud
```
$ gcloud services enable tpu.googleapis.com
```
Console
1. Rufen Sie in der Google Cloud Console die Seite „Cloud TPU API“ auf.
Seite „Cloud TPU API“ aufrufen
1. Klicken Sie auf Aktivieren.
Sie müssen für das Projekt eine der folgenden Rollen haben:
- Dienstkontoadministrator: Erforderlich zum Erstellen eines Dienstkontos
- Project IAM Admin: Erforderlich, um eine Rolle in einem Projekt zu gewähren
- TPU-Administrator: Erforderlich zum Erstellen einer TPU
Folgen Sie der Anleitung unter Aktuellen Zugriff ansehen, um zu sehen, welche Hauptkonten Zugriff auf Ihr Projekt, Ihren Ordner oder Ihre Organisation haben. Wenn Sie Ihren eigenen Zugriff sehen möchten, suchen Sie in der Spalte Hauptkonto nach der Zeile mit Ihrer E-Mail-Adresse. Ist Ihre E-Mail-Adresse nicht in dieser Spalte enthalten, haben Sie keine Rollen. Prüfen Sie in der Spalte Rolle der Zeile mit Ihrer E-Mail-Adresse, ob die Liste der Rollen die erforderlichen Rollen enthält.

Wenn Sie eine erforderliche Rolle nicht haben, gewähren Sie sich die Rolle oder bitten Sie einen Administrator, dies zu tun.
So erstellen Sie einen Cloud TPU-Dienstmitarbeiter:

Dienst-Agents sind eine Art von Dienstidentität. Sie werden von Google verwaltet und vom Cloud TPU-Dienst verwendet, um Vorgänge in Ihrem Google Cloud -Projekt auszuführen. Der Dienstagent wird beispielsweise zum Erstellen und Verwalten von Cloud TPU-Ressourcen verwendet.
```
  $ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
```
Erstellen Sie ein TPU-Dienstkonto:

Dienstkonten dienen als Anmeldedaten für Ihre TPU-VMs. Rollen, die einem Dienstkonto zugewiesen sind, gewähren Zugriff auf Google Cloud Ressourcen. Wir empfehlen, ein nutzerverwaltetes Dienstkonto zu verwenden und nur die Berechtigungen zu gewähren, die für Ihre TPU-VM erforderlich sind. Wenn Sie ein nutzerverwaltetes Dienstkonto verwenden, müssen Sie es beim Erstellen einer TPU-VM mit dem Flag --service-account angeben.
1. Folgen Sie der Anleitung unter Dienstkonten erstellen, um ein nutzerverwaltetes Dienstkonto zu erstellen.
2. Folgen Sie der Anleitung unter Zugriff auf Projekte, Ordner und Organisationen verwalten, um Ihrem Dienstkonto Zugriff auf Google Cloud Dienste zu gewähren, auf die Ihre TPU zugreifen wird. Die folgenden Rollen werden empfohlen, damit Ihre TPU auf häufig verwendeteGoogle Cloud -Dienste zugreifen kann.
  - TPU-Administrator: Erforderlich für den vollständigen Zugriff auf TPU-Ressourcen
  - Storage Admin: Erforderlich für den Zugriff auf Cloud Storage
  - Logs Writer: Erforderlich zum Schreiben von Protokollen mit der Logging API
  - Monitoring-Messwert-Autor: Erforderlich zum Schreiben von Messwerten in Cloud Monitoring
Hinweis: Wenn Sie kein benutzerdefiniertes Dienstkonto angeben, verwendet Ihre TPU das Compute Engine-Standarddienstkonto.

Cloud TPU erstellen

Bevor Sie eine Cloud TPU erstellen können, müssen Sie ein Kontingent anfordern. Sie sollten auch überlegen, ob Sie Ressourcen in der Warteschlange verwenden möchten und welche Parameter Sie zum Konfigurieren Ihrer TPU verwenden möchten.

Kontingent anfordern:

Damit Sie eine Cloud TPU erstellen können, muss für Ihr Google Cloud Projekt ein Kontingent für die Version und Größe der TPU vorhanden sein, die Sie erstellen möchten, sowie für die Zone, in der Sie sie erstellen möchten. Wenn Sie beispielsweise eine TPU v4-8 in us-central2-b erstellen möchten, müssen Sie ein Kontingent von 8 TPU v4-Kernen in us-central2-b anfordern. Weitere Informationen zu Zonen, in denen Cloud TPU verfügbar ist, finden Sie unter TPU-Regionen und ‑Zonen.

Das Kontingent wird je nach TPU-Version unterschiedlich zugewiesen. Für die verschiedenen Kontingenttypen gelten unterschiedliche Verfügbarkeitsanforderungen. Weitere Informationen zur Kontingentzuweisung, zu Kontingenttypen und zum Anfordern von Kontingenten finden Sie unter Kontingente.
Entscheiden Sie, ob Sie Ressourcen in der Warteschlange verwenden möchten.

Es ist eine Best Practice, eine Cloud TPU als Warteschlangenressource zu erstellen. Mit Ressourcen in der Warteschlange können Sie Kapazität erhalten, sobald sie verfügbar ist. Sie können optional einen Start- und Endzeitpunkt für die Ausführung der Anfrage angeben.

Es gibt verschiedene gcloud-Befehle für die Arbeit mit Ressourcen in der Warteschlange. Weitere Informationen finden Sie im Leitfaden für anstehende Ressourcen.

Legen Sie die Parameter für die Cloud TPU-Erstellung fest:

Zone: Legen Sie für das Flag --zone die Zone fest, in der Sie eine TPU erstellen möchten. Sie müssen in dieser Zone ein Kontingent zugewiesen haben. Weitere Informationen finden Sie unter TPU-Regionen und ‑Zonen.
TPU-Konfiguration: Wenn Sie keine benutzerdefinierte Topologie angeben müssen oder TPU v2 oder v3 verwenden, setzen Sie das Flag --accelerator-type auf vVERSION-TENSORCORES. Ersetzen Sie VERSION durch die TPU-Version, die Sie verwenden möchten. Ersetzen Sie TENSORCORES durch die Anzahl der zu verwendenden TensorCores.

Wenn Sie die physische Topologie Ihrer TPU anpassen möchten, verwenden Sie die Flags --version und --topology. Legen Sie für das Flag --version die TPU-Version fest, die Sie verwenden möchten. Legen Sie das Flag --topology auf die gewünschte Topologie fest.

Weitere Informationen zu TPU-Konfigurationen, einschließlich unterstützter Konfigurationen und Topologievarianten, finden Sie unter TPU-Versionen.
Softwareversion: Wenn du eine in der Warteschlange befindliche Ressource anforderst, setze das Flag --runtime-version auf den Namen der Softwareversion, die du verwenden möchtest. Andernfalls verwenden Sie das Flag --version. TPU-Softwareversionen sind für TensorFlow-, PyTorch- und JAX-Frameworks verfügbar. Weitere Informationen zu unterstützten Softwareversionen finden Sie unter Softwareversionen für TPU-VMs.
Dienstkonto: Legen Sie --service-account auf die E-Mail-Adresse eines Dienstkontos fest, falls Sie eines erstellt haben, um das Dienstkonto mit Ihrer TPU zu verknüpfen. Wenn das Feld leer ist, wird das Compute Engine-Standarddienstkonto verwendet.

Kontingenttyp: Fügen Sie das Flag hinzu, das dem gewünschten Kontingenttyp entspricht:

Kontingenttyp	Flag
Reserviert	`--reserved`
Spot-VMs	`--spot`
Auf Abruf (nicht verfügbar für Ressourcen in der Warteschlange; verwenden Sie stattdessen `--spot`)	`--preemptible`
On demand	Keine zusätzliche Kennzeichnung erforderlich

Erweiterte Konfiguration: Sie können Ihrer Anfrage zusätzliche Flags hinzufügen, um Ihre TPU zu konfigurieren. Weitere Informationen finden Sie in der gcloud compute tpus tpu-vm create-Dokumentation und in den folgenden Abschnitten:

Beispiele zum Erstellen einer Cloud TPU finden Sie unter Einstieg.

Nächste Schritte

VM- und TPU-Ressourcen erstellen und verwalten
Cloud TPU-Kurzanleitung ausführen