Auf dieser Seite erfahren Sie, wie Sie eine TensorFlow Keras-Trainingsanwendung in Vertex AI ausführen. Dieses spezifische Modell trainiert ein Bildklassifizierungsmodell, das Blumen nach Typ klassifizieren kann.
Diese Anleitung umfasst mehrere Seiten:Benutzerdefiniertes Bildklassifizierungsmodell trainieren
Vorhersagen aus einem benutzerdefinierten Bildklassifizierungsmodell bereitstellen.
Auf jeder Seite wird davon ausgegangen, dass Sie die Anleitung auf den vorherigen Seiten des Leitfadens bereits ausgeführt haben.
Im weiteren Verlauf dieses Dokuments wird davon ausgegangen, dass Sie dieselbe Cloud Shell-Umgebung verwenden, die Sie erstellt haben, wenn Sie der ersten Seite dieser Anleitung gefolgt sind. Wenn Ihre ursprüngliche Cloud Shell-Sitzung nicht mehr geöffnet ist, können Sie mit folgenden Schritten zur Umgebung zurückkehren:-
In the Google Cloud console, activate Cloud Shell.
-
Führen Sie in der Cloud Shell-Sitzung den folgenden Befehl aus:
cd hello-custom-sample
Benutzerdefinierte Trainingspipeline ausführen
In diesem Abschnitt wird die Verwendung des Trainingspakets beschrieben, das Sie in Cloud Storage hochgeladen haben, um eine benutzerdefinierte Trainingspipeline von Vertex AI auszuführen.
Rufen Sie in der Google Cloud Console im Abschnitt "Vertex AI" die Seite Trainingspipelines auf.
Klicken Sie auf
Erstellen, um den Bereich Neues Modell trainieren zu öffnen.Führen Sie im Schritt Trainingsmethode auswählen die folgenden Schritte aus:
Wählen Sie in der Drop-down-Liste Dataset die Option Kein verwaltetes Dataset aus. Diese spezielle Trainingsanwendung lädt Daten aus der Bibliothek TensorFlow Datasets statt aus einem verwalteten Vertex AI-Dataset.
Achten Sie darauf, dass Benutzerdefiniertes Training (erweitert) ausgewählt ist.
Klicken Sie auf Weiter.
Geben Sie im Schritt Modelldetails im Feld Name
hello_custom
ein. Klicken Sie auf Weiter.Geben Sie im Schritt Trainingscontainer Informationen für Vertex AI zur Verwendung des Trainingspakets an, das Sie in Cloud Storage hochgeladen haben.
Wählen Sie Vordefinierter Container aus.
Wählen Sie in der Drop-down-Liste Modell-Framework die Option TensorFlow aus.
Wählen Sie in der Drop-down-Liste Modell-Framework-Version die Option 2.3 aus.
Geben Sie im Feld Paket den Wert
cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz
ein.Geben Sie im Feld Python-Modul den Wert
trainer.task
ein.trainer
ist der Name des Python-Pakets in Ihrem Tarball undtask.py
den Trainingscode enthält. Daher isttrainer.task
der Name des Moduls, das Vertex AI ausführen soll.Klicken Sie im Feld Modellausgabeverzeichnis auf Durchsuchen. Gehen Sie im Bereich Ordner auswählen so vor:
Wechseln Sie zu Ihrem Cloud Storage-Bucket.
Klicken Sie auf Neuen Ordner erstellen
.Geben Sie dem neuen Ordner den Namen
output
. Klicken Sie auf Erstellen.Klicken Sie auf Auswählen.
Prüfen Sie, ob das Feld den Wert
gs://BUCKET_NAME/output
enthält. Dabei ist BUCKET_NAME der Name Ihres Cloud Storage-Buckets.Dieser Wert wird Vertex AI im API-Feld
baseOutputDirectory
übergeben. Dadurch werden mehrere Umgebungsvariablen festgelegt, auf die Ihre Trainingsanwendung zugreifen kann, wenn sie ausgeführt wird.Wenn Sie beispielsweise dieses Feld auf
gs://BUCKET_NAME/output
setzen, legt Vertex AI die UmgebungsvariableAIP_MODEL_DIR
aufgs://BUCKET_NAME/output/model
fest. Am Ende des Trainings verwendet Vertex AI alle Artefakte im VerzeichnisAIP_MODEL_DIR
, um eine Modellressource zu erstellen.
Klicken Sie auf Weiter.
Achten Sie darauf, dass im optionalen Schritt Hyperparameter das Kästchen Hyperparameter-Abstimmung aktivieren nicht markiert ist. In dieser Anleitung wird keine Hyperparameter-Abstimmung verwendet. Klicken Sie auf Weiter.
Weisen Sie im Schritt Computing und Preise Ressourcen für den benutzerdefinierten Trainingsjob zu:
Wählen Sie im Drop-down-Menü Region die Option us-central1 aus.
Wählen Sie in der Drop-down-Liste Maschinentyp die Option n1-standard-4 aus dem Abschnitt Standard aus.
Fügen Sie für diese Anleitung keine Beschleuniger oder Worker-Pools hinzu. Klicken Sie auf Weiter.
Im Schritt Vorhersagecontainer geben Sie Vertex AI Informationen zum Abrufen von Vorhersagen an:
Wählen Sie Vordefinierter Container aus.
Gehen Sie im Bereich Vordefinierte Containereinstellungen folgendermaßen vor:
Wählen Sie in der Drop-down-Liste Modell-Framework die Option TensorFlow aus.
Wählen Sie in der Drop-down-Liste Modell-Framework-Version die Option 2.3 aus.
Wählen Sie in der Drop-down-Liste Beschleunigertyp die Option Keine aus.
Prüfen Sie, ob das Feld Modellverzeichnis den Wert
gs://BUCKET_NAME/output
enthält. Dabei ist BUCKET_NAME der Name Ihres Cloud Storage-Buckets. Dies entspricht dem Wert Modellausgabeverzeichnis, den Sie in einem vorherigen Schritt bereitgestellt haben.
Lassen Sie die Felder im Abschnitt Schemata vorhersagen leer.
Klicken Sie auf Training starten, um die benutzerdefinierte Trainingspipeline zu starten.
Sie können jetzt Ihre neue Trainingspipeline mit dem Namen hello_custom
auf der Seite Training ansehen. Möglicherweise müssen Sie die Seite aktualisieren. Diese Trainingspipeline hat zwei Hauptaspekte:
Die Trainingspipeline erstellt eine benutzerdefinierte Jobressource mit dem Namen
hello_custom-custom-job
. Nach kurzer Zeit können Sie diese Ressource auf der Seite Benutzerdefinierte Jobs im Abschnitt Training ansehen:Benutzerdefinierte Jobs aufrufen
Der benutzerdefinierte Job führt die Trainingsanwendung mit den Rechenressourcen aus, die Sie in diesem Abschnitt angegeben haben.
Nach Abschluss des benutzerdefinierten Jobs sucht die Trainingspipeline die Artefakte, die Ihre Trainingsanwendung im Verzeichnis
output/model/
Ihres Cloud Storage-Buckets erstellt. Anhand dieser Artefakte wird eine Modellressource erstellt.
Training überwachen
So rufen Sie Trainingslogs auf:
Rufen Sie in der Google Cloud Console im Abschnitt "Vertex AI" die Seite Benutzerdefinierte Jobs auf.
Klicken Sie in der Liste auf
hello_custom-custom-job
, um Details für die gerade erstellteCustomJob
aufzurufen.Klicken Sie auf der Seite mit den Jobdetails auf Logs ansehen.
Trainiertes Modell ansehen
Wenn die benutzerdefinierte Trainingspipeline abgeschlossen ist, finden Sie das trainierte Modell in der Google Cloud Console im Abschnitt „Vertex AI“ auf der Seite Modelle.
Das Modell hat den Namen hello_custom
.
Nächste Schritte
Folgen Sie der nächsten Seite dieser Anleitung, um Vorhersagen aus Ihrem trainierten ML-Modell auszuführen.