AI Platform Pipelines bietet eine Plattform, mit der Sie Ihren ML-Workflow als Pipeline automatisieren können. Wenn Sie den ML-Prozess als Pipeline ausführen, haben Sie folgende Möglichkeiten:
- Führen Sie Pipelines auf Ad-hoc-Basis aus.
- Planen Sie wiederkehrende Ausführungen, um Ihr Modell regelmäßig neu zu trainieren.
- Testen Sie, indem Sie Ihre Pipeline mit verschiedenen Gruppen von Hyperparametern, einer unterschiedlichen Anzahl von Trainingsschritten oder Iterationen usw. ausführen. Vergleichen Sie dann die Ergebnisse Ihrer Tests.
In diesem Leitfaden wird beschrieben, wie Sie eine Pipeline ausführen und wiederkehrende Ausführungen planen. Dieser Leitfaden enthält auch Ressourcen, mit denen Sie mehr über die Benutzeroberfläche von Kubeflow Pipelines erfahren können.
Hinweis
In diesem Leitfaden wird beschrieben, wie Sie mit der Benutzeroberfläche von Kubeflow Pipelines eine Pipeline ausführen. Bevor Sie eine Pipeline ausführen können, müssen Sie Ihren AI Platform Pipelines-Cluster einrichten und prüfen, ob Sie ausreichende Berechtigungen für den Zugriff auf den AI Platform Pipelines-Cluster haben.
ML-Pipeline ausführen
Verwenden Sie die folgende Anleitung, um eine ML-Pipeline auf Ihrem AI Platform Pipelines-Cluster auszuführen.
Öffnen Sie AI Platform Pipelines in der Google Cloud -Konsole.
Klicken Sie für den gewünschten Kubeflow Pipelines-Cluster auf Pipelines-Dashboard öffnen. Die Benutzeroberfläche von Kubeflow Pipelines wird in einem neuen Tab geöffnet.
Klicken Sie im linken Navigationssteuerfeld auf Pipelines.
Klicken Sie auf den Namen der Pipeline, die Sie ausführen möchten. Wenn Sie noch keine Pipeline geladen haben, klicken Sie auf den Namen einer Beispielpipeline wie [Demo] TFX – Taxi Tip Prediction Model Trainer. Eine Grafik mit den Schritten in der Pipeline wird geöffnet.
Klicken Sie zum Ausführen oder Planen der Pipeline auf Ausführung erstellen. Ein Formular, in dem Sie die Ausführungsdetails eingeben können, wird geöffnet.
Bevor Sie eine Pipeline ausführen, müssen Sie die Ausführungsdetails, den Ausführungstyp und die Ausführungsparameter angeben.
Geben Sie im Abschnitt Ausführungsdetails Folgendes an:
- Pipeline: Wählen Sie die Pipeline aus, die Sie ausführen möchten.
- Pipeline-Version: Wählen Sie die Version der Pipeline aus, die Sie ausführen möchten.
- Ausführungsname:: Geben Sie einen eindeutigen Namen für diese Ausführung ein. Anhand dieses Namens können Sie die Ausführung später wieder auffinden.
- Beschreibung (optional): Geben Sie eine Beschreibung ein, um weitere Informationen zu dieser Ausführung bereitzustellen.
- Test (optional) : Wählen Sie einen Test aus, um zusammengehörige Läufe zu gruppieren.
Geben Sie im Abschnitt Ausführungstyp an, wie häufig dieser Lauf ausgeführt werden soll.
- Wählen Sie aus, ob dies eine einmalige oder wiederkehrende Ausführung ist.
Wenn es sich um eine wiederkehrende Ausführung handelt, geben Sie den Ausführungstrigger an:
- Triggertyp: Wählen Sie aus, ob diese Ausführung periodisch oder basierend auf einem cron-Plan ausgeführt werden soll.
- Maximale Anzahl an gleichzeitigen Ausführungen: Geben Sie die maximale Anzahl an Ausführungen ein, die gleichzeitig aktiv sein können.
- Hat Startdatum: Prüfen Sie Hat Startdatum und geben Sie dann das Startdatum und die Startzeit ein, um festzulegen, wann mit diesem Trigger Ausführungen erstellt werden sollen.
- Hat Enddatum: Prüfen Sie Hat Enddatum und geben Sie dann das Enddatum und die Endzeit ein, um festzulegen, wann dieser Trigger keine Ausführungen mehr erstellen soll.
- Ausführungshäufigkeit: Wählen Sie die Häufigkeit aus, mit der neue Ausführungen ausgelöst werden sollen. Wenn diese Ausführung basierend auf einem Cron-Plan ausgelöst wird, aktivieren Sie Bearbeiten von Cron-Ausdrücken zulassen, um direkt einen Cron-Ausdruck einzugeben.
Passen Sie in den Ausführungsparametern die Pipeline-Parameter für diese Ausführung an. Sie können Parameter verwenden, um Werte wie Pfade zum Laden von Trainingsdaten oder zum Speichern von Artefakten, Hyperparametern, der Anzahl der Trainingswiederholungen usw. festzulegen. Die Pipeline-Parameter werden beim Erstellen der Pipeline definiert.
Wenn Sie die Pipeline [Demo] TFX - Taxi Tip Prediction Model Trainer ausführen, geben Sie Folgendes an:
pipeline-root: Der pipeline-root-Parameter gibt an, wo die Ausgabe der Pipeline gespeichert werden soll. Diese Pipeline speichert Ausführungsartefakte im Cloud Storage-Bucket von AI Platform Pipelines.
Sie können diesen Wert überschreiben, um den Pfad zu einem anderen Cloud Storage-Bucket anzugeben, auf den Ihr Cluster zugreifen kann. Weitere Informationen zum Erstellen eines Cloud Storage-Bucket
data-root: Der Parameter data-root gibt den Pfad zu den Trainingsdaten der Pipeline an. Verwenden Sie den Standardwert.
module-file: Der Parameter module-file gibt den Pfad zum Quellcode für ein Modul an, das in dieser Pipeline verwendet wird. Verwenden Sie den Standardwert.
Durch das Laden von Code aus einem Cloud Storage-Bucket können Sie das Verhalten einer Komponente schnell ändern, ohne das Container-Image der Komponente neu erstellen zu müssen.
Klicken Sie auf Start. Das Pipeline-Dashboard zeigt eine Liste der Pipeline-Ausführungen an.
Klicken Sie in der Liste der Pipeline-Ausführungen auf den Namen der Ausführung. Das Diagramm Ihrer Ausführung wird angezeigt. Während Ihre Ausführung noch läuft, ändert sich die Grafik mit jedem ausgeführten Schritt.
Klicken Sie auf die Pipeline-Schritte, um die Eingaben, Ausgaben und Logs Ihrer Ausführung zu untersuchen.
Informationen zur Benutzeroberfläche von Kubeflow Pipelines
Hier erhalten Sie weitere Informationen zur Benutzeroberfläche von Kubeflow Pipelines.
- Weitere Informationen über die Ziele und wichtigsten Konzepte von Kubeflow Pipelines
- Übersicht über die Oberflächen von Kubeflow Pipelines
- Weitere Informationen zur in Kubeflow Pipelines verwendeten Terminologie
Nächste Schritte
- ML-Prozess als Pipeline orchestrieren
- Erfahren Sie, wie Sie mithilfe des Kubeflow Pipelines SDK eine Verbindung zu Ihrem AI Platform Pipelines-Cluster herstellen.