Modell mit Vertex AI und Python SDK trainieren

Dies ist eine umfassende Anleitung, die Ihnen zeigt, wie Sie mit dem Vertex AI SDK für Python ein benutzerdefiniert trainiertes Modell erstellen. Sie führen Code in einer Notebookdatei (IPYNB) aus, in der ein Docker-Container zum Trainieren und Erstellen des Modells verwendet wird. Diese Anleitung richtet sich an Data Scientists, die mit Vertex AI noch nicht vertraut sind, sich aber mit Notebooks Python und maschinellem Lernen (ML) auskennen.

Zuerst erstellen Sie in der Google Cloud Console das Projekt, das Ihre Arbeit enthält. In Ihrem Projekt erstellen Sie mit Vertex AI Workbench ein Jupyter-Notebook. In der Notebookumgebung führen Sie Code aus, der ein Dataset herunterlädt und vorbereitet. Dann verwendest du das Dataset zum Erstellen und Trainieren eines Modells. Am Ende des Tutorials werden mit dem trainierten Modell Vorhersagen generiert.

Das Ziel dieser Anleitung ist es, Sie in weniger als einer Stunde durch alle Schritte zu führen, die zum Erstellen von Vorhersagen erforderlich sind. Das verwendete Dataset ist relativ klein, sodass das Training des Modells nicht sehr lange dauert. Wenn Sie fertig sind, können Sie das Gelernte auf größere Datensätze anwenden. Je größer der Datensatz, desto genauer sind die Prognosen.

Anleitungsschritte

  1. Voraussetzungen: Sie müssen ein Google Cloud-Konto und ein Projekt erstellen.

  2. Notebook erstellen: Erstellen und bereiten Sie ein Jupyter-Notebook und dessen Umgebung vor. Sie verwenden das Notebook, um Code auszuführen, der Ihr Dataset erstellt, Ihr Modell erstellt und trainiert und Vorhersagen generiert.

  3. Dataset erstellen: Laden Sie ein öffentlich verfügbares BigQuery-Dataset herunter und erstellen Sie damit ein tabellarisches Vertex AI-Dataset. Das Dataset enthält die Daten, mit denen Sie Ihr Modell trainieren.

  4. Trainingsskript erstellen: Erstellen Sie ein Python-Skript, das Sie an den Trainingsjob übergeben. Das Skript wird ausgeführt, wenn der Trainingsjob trainiert und das Modell erstellt wird.

  5. Modell trainieren: Mit Ihrem tabellarischen Dataset ein Modell trainieren und bereitstellen. Sie verwenden das Modell, um Ihre Vorhersagen zu erstellen.

  6. Vorhersagen treffen: Erstellen Sie mit Ihrem Modell Vorhersagen. In diesem Abschnitt werden Sie auch durch das Löschen von Ressourcen geführt, die Sie im Laufe dieser Anleitung erstellen, sodass keine unnötigen Kosten anfallen.

Was Sie erreichen

In dieser Anleitung erfahren Sie, wie Sie mit dem Vertex AI SDK für Python Folgendes tun:

  • Cloud Storage-Bucket zum Speichern eines Datensatzes erstellen
  • Daten für das Training vorverarbeiten
  • Mit den verarbeiteten Daten ein Dataset in BigQuery erstellen
  • Tabellarisches Vertex AI-Dataset aus BigQuery-Dataset erstellen
  • Benutzerdefiniert trainiertes Modell erstellen und trainieren
  • Benutzerdefiniert trainiertes Modell auf einem Endpunkt bereitstellen
  • Vorhersage generieren
  • Bereitstellung des Modells aufheben
  • Alle im Rahmen der Anleitung erstellten Ressourcen löschen, damit keine weiteren Kosten anfallen.

Verwendete abrechenbare Ressourcen

In dieser Anleitung werden kostenpflichtige Ressourcen verwendet, die mit den Google Cloud-Diensten Vertex AI, BigQuery und Cloud Storage zusammenhängen. Wenn Sie neu bei Google Cloud sind, können Sie möglicherweise einen oder mehrere dieser Dienste kostenlos nutzen. Vertex AI bietet Neukunden ein Guthaben von 300 $ und Cloud Storage und BigQuery haben kostenlose Stufen. Hier finden Sie weitere Informationen:

Um weitere Gebühren zu vermeiden, wird im letzten Schritt dieser Anleitung die Entfernung aller kostenpflichtigen Google Cloud-Ressourcen, die Sie erstellt haben, beschrieben.