Hello-Textdaten: Textklassifizierungs-Dataset erstellen und Dokumente importieren

Mit der Vertex-AI-Konsole ein Textklassifizierungs-Dataset erstellen Wenn das Dataset erstellt ist, verwenden Sie die CSV-Datei, die Sie in Ihren Cloud Storage-Bucket kopiert haben, um diese Dokumente in das Dataset zu importieren.

Diese Anleitung umfasst mehrere Seiten:

  1. Projekt und Umgebung einrichten

  2. Textklassifizierungs-Dataset erstellen

  3. AutoML-Textklassifizierungsmodell trainieren.

  4. Modell auf einem Endpunkt bereitstellen und eine Vorhersage treffen.

  5. Projekt bereinigen.

Auf jeder Seite wird davon ausgegangen, dass Sie die Anleitung auf den vorherigen Seiten des Leitfadens bereits ausgeführt haben.

  1. Rufen Sie die Vertex AI-Konsole auf.

  2. Klicken Sie auf der Seite Erste Schritte mit Vertex AI auf Dataset erstellen.

    Vertex AI-Dashboard

  3. Geben Sie Details zu Ihrem Dataset an.

    1. Geben Sie einen Namen für dieses Dataset an, z. B. text_classification_tutorial.

    2. Klicken Sie unter Datentyp und Ziel auswählen auf Text und wählen Sie dann Textklassifizierung (ein Label) aus.

    3. Wählen Sie unter Region us-central1 aus.

      In dieser Anleitung wird us-central1 verwendet, aber Vertex AI unterstützt auch andere Regionen, z. B. europe-west4.

    4. Klicken Sie auf Erstellen, um das leere Dataset zu erstellen, und importieren Sie dann die Dokumente.

      Fenster "Neues Dataset"

  4. Wählen Sie auf der Importseite die Option Importdatei aus Cloud Storage auswählen aus und geben Sie den Cloud Storage-Speicherort Ihrer CSV-Datei an.

    Für diese Anleitung befindet sich die CSV-Datei in gs://${BUCKET}/text/happiness.csv. Der Bucket für diese Anleitung ist in derselben Region wie das Dataset enthalten. Sie können aber Dateien aus Buckets jeder Region angeben.

    Screenshot: Fenster für Dateiimport auswählen

  5. Übernehmen Sie für die Datenaufteilung die Einstellung Automatisch.

    Vertex AI weist Dokumente automatisch Trainings-, Validierungs- und Test-Datasets zu. Weitere Informationen finden Sie unter Datenaufteilungen für AutoML-Modelle.

  6. Klicken Sie auf Weiter, um den Import zu starten.

    Der Importvorgang dauert ein paar Minuten. Wenn der Import abgeschlossen ist, können Sie nach allen importierten Dokumenten und den zugehörigen Labels im Tab Durchsuchen des Datasets suchen.

Nächste Schritte

Folgen Sie der nächsten Seite dieser Anleitung, um einen AutoML-Modelltrainingsjob zu starten.