Verbindung mit Cloud Storage-Buckets herstellen

Auf dieser Seite wird Cloud Storage als eine Option zum Speichern Ihrer Daten für das maschinelle Lernen und von Trainingseingaben vorgestellt. Außerdem wird beschrieben, wie Sie Ihrer Cloud TPU Zugriff auf die Datenobjekte in Cloud Storage gewähren.

Hinweise

Sie benötigen ein Cloud TPU-Dienstkonto, um auf einen Cloud Storage-Bucket zugreifen zu können.

  1. Erstellen Sie ein Cloud TPU-Dienstkonto für Ihr Projekt.

    gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
    

    Der Befehl gibt ein Cloud TPU-Dienstkonto im folgenden Format zurück:

    service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com
    
  2. Folgen Sie der Anleitung im Cloud TPU-Schnellstart oder im Dokument TPUs erstellen und löschen, um Ihr Google Cloud-Projekt zu konfigurieren und Ihr Cloud TPU-VM und TPU-Ressourcen zu erstellen.

Daten in Cloud Storage schreiben

Console

  1. Rufen Sie in der Google Cloud Console die Seite „Cloud Storage“ auf.

    Zur Cloud Storage-Seite

  2. Erstellen Sie durch die Angabe der folgenden Optionen einen neuen Bucket:

    • Eindeutiger Name Ihrer Wahl
    • Standard-Speicherklasse: Standard
    • Speicherort: us-central1

gsutil

  1. Verwenden Sie den Befehl gsutil mb, um einen Cloud Storage-Bucket zu erstellen:

    gsutil mb -l region gs://bucket-name/

    Dabei gilt:

    • region ist die Region, in der Sie die Cloud TPU erstellt haben. Beispiel: us-central1 Cloud TPU ist in den folgenden Regionen verfügbar:

      USA

      Cloud TPU v2 und Preemptible v2 us-central1
      Cloud TPU v3 und Preemptible v3 us-central1
      Cloud TPU v4 und präemptive v4 us-central2
      Cloud TPU v2 Pod us-central1
      Cloud TPU v4 Pod us-central2

      Europa

      Cloud TPU v2 und Preemptible v2 europe-west4
      Cloud TPU v3 und Preemptible v3 europe-west4
      Cloud TPU v2 Pod europe-west4
      Cloud TPU v3 Pod europe-west4

      Asiatisch-pazifischer Raum

      Cloud TPU v2 und Preemptible v2 asia-east1
    • bucket-name ist der Name des Buckets, den Sie erstellen möchten.

  2. Verwenden Sie den Befehl gsutil cp, um Dateien in den Cloud Storage-Bucket zu schreiben:

    gsutil cp -r local-data-dir gs://bucket-name

    Dabei ist local-data-dir ein lokaler Pfad zu Ihren Daten. Beispiel: $HOME/your-data

Cloud TPU Zugriff auf Cloud Storage gewähren

Ihre Cloud TPU braucht Lese-/Schreibzugriff auf Ihre Cloud Storage-Objekte. Dazu müssen Sie den erforderlichen Zugriff auf das Cloud TPU-Dienstkonto gewähren, das von der Cloud TPU verwendet wird. Führen Sie die folgenden Schritte aus, um das Cloud TPU-Dienstkonto zu suchen und den erforderlichen Zugriff zu gewähren:

Cloud TPU-Dienstkonto autorisieren

Wenn Sie Trainingsdaten in Cloud Storage speichern, benötigt das Cloud TPU-Dienstkonto Lese- und Schreibberechtigungen für den Bucket.

Console

  1. Wechseln Sie zur Cloud Storage-Browserseite, um die Buckets anzuzeigen, deren Inhaber Sie sind.

    Zum Cloud Storage-Browser

  2. Wählen Sie den Bucket aus, dessen ACL Sie ändern möchten.

  3. Wählen Sie den Tab Permissions aus.

  4. Wählen Sie Add aus, um eine neue Berechtigung und Typ hinzuzufügen, und geben Sie den vollständigen Dienstkontonamen in das Bearbeitungsfeld New Principals ein.

  5. Wenn Sie Daten aus diesem Bucket lesen, müssen Sie das TPU-Dienstkonto zum Lesen von Daten aus der Ressource autorisieren. Gewähren Sie dem Dienstkonto dazu die Rolle Storage Legacy > Storage Legacy Bucket Reader.

  6. Wenn Sie Daten in diesen Bucket schreiben, müssen Sie das TPU-Dienstkonto zum Schreiben von Daten in die Ressource autorisieren. Gewähren Sie dem Dienstkonto dazu die Rolle Storage Legacy > Storage Legacy Bucket Writer.

gsutil

  1. Wenn Sie aus diesem Bucket lesen, erteilen Sie Leseberechtigung für das Cloud TPU-Dienstkonto:

     gsutil acl ch -u tpu-service-account:READER gs://bucket-name

  2. Wenn Sie Daten in diesen Bucket schreiben, müssen Sie dem Cloud TPU-Dienstkonto die Schreibberechtigung erteilen:

     gsutil acl ch -u tpu-service-account:WRITER gs://bucket-name

IAM-Berechtigungen für Cloud TPU verwenden (Alternative)

Wenn Sie umfassendere Berechtigungen als den Zugriff auf die weiße Liste für jeden Bucket gewähren möchten, können Sie dem Cloud TPU-Dienstkonto die Rolle der Identitäts- und Zugriffsverwaltung (IAM) Storage-Administrators zuweisen.

  1. Rufen Sie die IAM-Seite für Ihr Projekt auf.

    IAM aufrufen

  2. Klicken Sie auf die Schaltfläche Hinzufügen, um Hauptkonten zum Projekt hinzuzufügen.

  3. Geben Sie die Namen des Cloud TPU-Dienstkontos in das Textfeld Hauptkonten ein.

  4. Klicken Sie auf die Drop-down-Liste Rollen.

  5. Aktivieren Sie die folgenden Rollen:

    • Projekt > Betrachter

    • Storage > Storage-Administrator

Cloud Storage FUSE

Mit Cloud Storage FUSE können Sie Cloud Storage-Buckets als lokale Dateisysteme bereitstellen und darauf zugreifen. Dadurch können Anwendungen Objekte in Ihrem Bucket mit der Standardsemantik des Dateisystems lesen und schreiben.

Weitere Informationen zur Funktionsweise von Cloud Storage FUSE und eine Beschreibung der Zuordnung von Cloud Storage FUSE-Vorgängen zu Cloud Storage-Vorgängen finden Sie in der Cloud Storage FUSE-Dokumentation. Weitere Informationen zur Verwendung von Cloud Storage FUSE, z. B. zum Installieren der gcsfuse-Befehlszeile und zum Bereitstellen von Buckets, finden Sie auf GitHub.

Nächste Schritte