Hello-Textdaten: Projekt und Umgebung einrichten

Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

In dieser Anleitung wird veranschaulicht, wie Sie ein Modell zum Klassifizieren von Inhalten mit Vertex AI erstellen. In dieser Anleitung wird ein AutoML-Modell trainiert. Dazu wird ein Korpus von „glücklichen Momenten” aus dem Open-Source-Dataset HappyDB von Kaggle verwendet. Das resultierende Modell klassifiziert glückliche Momente in Kategorien, die jeweils die Ursachen von Glück angeben.


Eine detaillierte Anleitung dazu finden Sie direkt in der Google Cloud Console. Klicken Sie dazu einfach auf Anleitung:

Anleitung


In diesem Teil der Anleitung richten Sie Ihr Google Cloud-Projekt für die Verwendung von Vertex AI und einen Cloud Storage-Bucket ein, der die Dokumente zum Trainieren Ihres AutoML-Modells enthält.

Diese Anleitung umfasst mehrere Seiten:

  1. Projekt und Umgebung einrichten

  2. Textklassifizierungs-Dataset erstellen

  3. AutoML-Textklassifizierungsmodell trainieren.

  4. Modell auf einem Endpunkt bereitstellen und eine Vorhersage treffen.

  5. Projekt bereinigen.

Auf jeder Seite wird davon ausgegangen, dass Sie die Anleitung auf den vorherigen Seiten des Leitfadens bereits ausgeführt haben.

Projekt einrichten

Verwenden Sie in dieser Anleitung die Google Cloud Console, um mit Google Cloud zu interagieren. Führen Sie die folgenden Schritte aus, bevor Sie die Vertex-AI-Funktionen verwenden.

  1. Melden Sie sich bei Ihrem Google Cloud-Konto an. Wenn Sie mit Google Cloud noch nicht vertraut sind, erstellen Sie ein Konto, um die Leistungsfähigkeit unserer Produkte in der Praxis sehen und bewerten zu können. Neukunden erhalten außerdem ein Guthaben von 300 $, um Arbeitslasten auszuführen, zu testen und bereitzustellen.
  2. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  3. Die Abrechnung für das Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für ein Projekt aktiviert ist.

  4. Vertex AI API aktivieren.

    Aktivieren Sie die API

  5. Wählen Sie in der Google Cloud Console auf der Seite der Projektauswahl ein Google Cloud-Projekt aus oder erstellen Sie eines.

    Zur Projektauswahl

  6. Die Abrechnung für das Cloud-Projekt muss aktiviert sein. So prüfen Sie, ob die Abrechnung für ein Projekt aktiviert ist.

  7. Vertex AI API aktivieren.

    Aktivieren Sie die API

  8. Aktivieren Sie Cloud Shell in der Google Cloud Console.

    Cloud Shell aktivieren

    Unten in der Google Cloud Console wird eine Cloud Shell-Sitzung gestartet und eine Eingabeaufforderung angezeigt. Cloud Shell ist eine Shell-Umgebung, in der das Google Cloud CLI bereits installiert ist und Werte für Ihr aktuelles Projekt bereits festgelegt sind. Das Initialisieren der Sitzung kann einige Sekunden dauern.

Cloud Storage-Bucket erstellen und das Beispiel-Dataset kopieren

Erstellen Sie einen Cloud Storage-Bucket zum Speichern der Dokumente, die Sie zum Trainieren Ihres AutoML-Modells verwenden.

  1. Öffnen Sie Cloud Shell.

  2. Legen Sie die Variable PROJECT_ID auf die ID Ihres Projekts fest.

    export PROJECT_ID=PROJECT_ID
  3. Legen Sie die Variable BUCKET fest, mit der Sie einen Cloud Storage-Bucket erstellen.

    export BUCKET=${PROJECT_ID}-lcm
  4. Erstellen Sie mit der Variable BUCKET einen Cloud Storage-Bucket in der Region us-central1.

    gsutil mb -p ${PROJECT_ID} -l us-central1 gs://${BUCKET}/
  5. Kopieren Sie das Beispiel-Trainings-Dataset happiness.csv in Ihren Bucket.

    gsutil -m cp -R gs://cloud-ml-data/NL-classification/happiness.csv gs://${BUCKET}/text/

Nächste Schritte

Folgen Sie der nächsten Seite dieser Anleitung, um mit der Vertex AI-Konsole ein Textklassifizierungs-Dataset zu erstellen und die Dokumente zu importieren, die Sie in Ihren Cloud Storage-Bucket kopiert haben.