Modell mit Vertex AI und Python SDK trainieren

Dies ist eine umfassende Anleitung, die Ihnen zeigt, wie Sie mit dem Vertex AI SDK für Python ein benutzerdefiniert trainiertes Modell erstellen. Sie führen Code in einem Jupyter-Notebook aus, das einen Docker-Container zum Trainieren und Erstellen des Modells verwendet. Diese Anleitung richtet sich an Data Scientists, die mit Vertex AI noch nicht vertraut sind, sich aber mit Notebooks Python und maschinellem Lernen (ML) auskennen.

Der Prozess beginnt mit der Google Cloud Console, um das Projekt zu erstellen, das Ihre Arbeit enthält. In Ihrem Projekt verwenden Sie Vertex AI Workbench, um ein Jupyter-Notebook zu erstellen. In der Notebookumgebung führen Sie Code aus, der ein Dataset herunterlädt und vorbereitet. Dann verwendest du das Dataset zum Erstellen und Trainieren eines Modells. Am Ende der Anleitung generiert das trainierte Modell Vorhersagen.

Das Ziel dieser Anleitung ist es, Sie in weniger als einer Stunde durch alle Schritte zu führen, die zum Erstellen von Vorhersagen erforderlich sind. Das verwendete Dataset ist relativ klein, sodass das Trainieren Ihres Modells nicht sehr lange dauert. Wenn Sie fertig sind, können Sie das Gelernte auf größere Datasets anwenden. Je größer das Dataset ist, desto genauer sind die Vorhersagen.

Anleitungsschritte

  1. Voraussetzungen: Erstellen Sie Ihr Google Cloud-Konto und -Projekt.

  2. Jupyter-Notebook erstellen: Erstellen und bereiten Sie ein Jupyter-Notebook und dessen Umgebung vor. Sie verwenden das Notebook, um Code auszuführen, der Ihr Dataset erstellt, Ihr Modell erstellt und trainiert und Vorhersagen generiert.

  3. Dataset erstellen: Laden Sie ein öffentlich verfügbares BigQuery-Dataset herunter und erstellen Sie damit ein tabellarisches Dataset in Vertex AI. Das Dataset enthält die Daten, die Sie zum Trainieren Ihres Modells verwenden.

  4. Trainingsskript erstellen: Erstellen Sie ein Python-Skript, das Sie an den Trainingsjob übergeben. Das Skript wird ausgeführt, wenn der Trainingsjob trainiert und das Modell erstellt wird.

  5. Modell trainieren: Verwenden Sie Ihr tabellarisches Dataset, um ein Modell zu trainieren und bereitzustellen. Sie verwenden das Modell, um Ihre Vorhersagen zu erstellen.

  6. Vorhersagen treffen: Erstellen Sie mit Ihrem Modell Vorhersagen. In diesem Abschnitt werden Sie auch durch das Löschen von Ressourcen geführt, die Sie im Laufe dieser Anleitung erstellen, sodass keine unnötigen Kosten anfallen.

Leistungsspektrum

In dieser Anleitung erfahren Sie, wie Sie mit dem Vertex AI SDK für Python Folgendes tun:

  • Cloud Storage-Bucket zum Speichern eines Datasets erstellen
  • Daten für das Training vorverarbeiten
  • Mithilfe der verarbeiteten Daten ein Dataset in BigQuery erstellen
  • BigQuery-Dataset verwenden, um ein tabellarisches Vertex AI-Dataset zu erstellen
  • Benutzerdefiniert trainiertes Modell erstellen und trainieren
  • Benutzerdefiniert trainiertes Modell auf einem Endpunkt bereitstellen
  • Vorhersage generieren
  • Bereitstellung des Modells aufheben
  • Alle im Rahmen der Anleitung erstellten Ressourcen löschen, damit keine weiteren Kosten anfallen.

Verwendete abrechenbare Ressourcen

In dieser Anleitung werden kostenpflichtige Ressourcen verwendet, die mit den Google Cloud-Diensten Vertex AI, BigQuery und Cloud Storage zusammenhängen. Wenn Sie neu bei Google Cloud sind, können Sie möglicherweise einen oder mehrere dieser Dienste kostenlos nutzen. Vertex AI bietet Neukunden ein Guthaben von 300 $ und Cloud Storage und BigQuery haben kostenlose Stufen. Hier finden Sie weitere Informationen:

Um weitere Gebühren zu vermeiden, wird im letzten Schritt dieser Anleitung die Entfernung aller kostenpflichtigen Google Cloud-Ressourcen, die Sie erstellt haben, beschrieben.