Hello-Textdaten: Projekt und Umgebung einrichten

Wenn Sie das Vertex AI SDK für Python verwenden möchten, muss das Dienstkonto, das den Client initialisiert, die IAM-Rolle Dienst-Agent von Vertex AI (roles/aiplatform.serviceAgent) haben.

In diesem Teil der Anleitung richten Sie Ihr Google Cloud-Projekt für die Verwendung von Vertex AI und einen Cloud Storage-Bucket ein, der die Dokumente zum Trainieren Ihres AutoML-Modells enthält.

Diese Anleitung umfasst mehrere Seiten:

  1. Projekt und Umgebung einrichten

  2. Textklassifizierungs-Dataset erstellen

  3. AutoML-Textklassifizierungsmodell trainieren.

  4. Modell auf einem Endpunkt bereitstellen und eine Vorhersage treffen.

  5. Projekt bereinigen.

Auf jeder Seite wird davon ausgegangen, dass Sie die Anleitung auf den vorherigen Seiten des Leitfadens bereits ausgeführt haben.

Projekt und Umgebung einrichten

Führen Sie die folgenden Schritte aus, bevor Sie die Vertex-AI-Funktionen verwenden.

  1. Rufen Sie in der Google Cloud Console die Seite für die Projektauswahl auf.

    Zur Projektauswahl

  2. Wählen Sie ein Google Cloud-Projekt aus oder erstellen Sie eines.

  3. Die Abrechnung für das Google Cloud-Projekt muss aktiviert sein.

  4. Öffnen Sie Cloud Shell. Cloud Shell ist eine interaktive Shell-Umgebung für Google Cloud, mit der Sie Projekte und Ressourcen über Ihren Webbrowser verwalten können.
  5. Zu Cloud Shell
  6. Legen Sie in Cloud Shell das aktuelle Projekt auf Ihre Google Cloud-Projekt-ID fest und speichern Sie sie in der Shell-Variable projectid:
      gcloud config set project PROJECT_ID &&
      projectid=PROJECT_ID &&
      echo $projectid
    Ersetzen Sie PROJECT_ID durch Ihre Projekt-ID. Sie finden Ihre Projekt-ID in der Google Cloud Console. Weitere Informationen finden Sie unter Projekt-ID ermitteln.
  7. Aktivieren Sie die IAM, Compute Engine, Notebooks, Cloud Storage, and Vertex AI APIs:

    gcloud services enable iam.googleapis.com  compute.googleapis.com notebooks.googleapis.com storage.googleapis.com aiplatform.googleapis.com
  8. Gewähren Sie Ihrem Google-Konto Rollen. Führen Sie den folgenden Befehl für jede der folgenden IAM-Rollen einmal aus: roles/aiplatform.user, roles/storage.admin

    gcloud projects add-iam-policy-binding PROJECT_ID --member="user:EMAIL_ADDRESS" --role=ROLE
    • Ersetzen Sie PROJECT_ID durch Ihre Projekt-ID.
    • Ersetzen Sie EMAIL_ADDRESS durch Ihre E-Mail-Adresse.
    • Ersetzen Sie ROLE durch jede einzelne Rolle.
  9. Die IAM-Rolle „Vertex AI-Nutzer“ (roles/aiplatform.user) bietet Zugriff auf alle Ressourcen in Vertex AI. Mit dem Storage-Administrator (roles/storage.admin) können Sie das Trainings-Dataset des Dokuments in Cloud Storage speichern.

Cloud Storage-Bucket erstellen und das Beispiel-Dataset kopieren

Erstellen Sie einen Cloud Storage-Bucket zum Speichern der Dokumente, die Sie zum Trainieren Ihres AutoML-Modells verwenden.

  1. Öffnen Sie Cloud Shell.

  2. Legen Sie die Variable PROJECT_ID auf die ID Ihres Projekts fest.

    export PROJECT_ID=PROJECT_ID
  3. Legen Sie die Variable BUCKET fest, mit der Sie einen Cloud Storage-Bucket erstellen.

    export BUCKET=${PROJECT_ID}-lcm
  4. Erstellen Sie mit der Variable BUCKET einen Cloud Storage-Bucket in der Region us-central1.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Kopieren Sie das Beispiel-Trainings-Dataset happiness.csv in Ihren Bucket.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

Nächste Schritte

Folgen Sie der nächsten Seite dieser Anleitung, um mit der Vertex AI-Konsole ein Textklassifizierungs-Dataset zu erstellen und die Dokumente zu importieren, die Sie in Ihren Cloud Storage-Bucket kopiert haben.