Einführung in die Komponenten der Google Cloud-Pipeline

Das Google Cloud Pipeline Components (GCPC) SDK bietet eine Reihe vordefinierter Kubeflow Pipelines-Komponenten, die produktionsbereit, leistungsfähig und einfach zu verwenden sind. Sie können Google Cloud-Pipeline-Komponenten verwenden, um ML-Pipelines in Vertex AI Pipelines und anderen Ausführungs-Back-Ends der ML-Pipeline zu definieren und auszuführen, die mit Kubeflow Pipelines kompatibel sind.

Sie können diese Komponenten beispielsweise für Folgendes verwenden:

Neues Dataset erstellen und verschiedene Datentypen in das Dataset laden (Bild, Tabelle, Text oder Video)
Daten aus einem Dataset in Cloud Storage exportieren
AutoML zum Trainieren eines Modells mit Bild-, Tabellen-, Text- oder Videodaten verwenden
Einen benutzerdefinierten Trainingsjob mit einem benutzerdefinierten Container oder einem Python-Paket ausführen
Vorhandenes Modell zur Batchvorhersage in Vertex AI hochladen
Neuen Endpunkt erstellen und darin ein Modell für Onlinevorhersagen bereitstellen

Darüber hinaus werden diese vordefinierten Google Cloud-Pipeline-Komponenten in Vertex AI-Pipelines unterstützt und bieten folgende Vorteile:

Einfachere Fehlerbehebung: Zeigt die zugrunde liegenden Ressourcen an, die von der Komponente gestartet wurden, um das Debugging zu vereinfachen.
Standardisierte Artefakttypen: Stellen Sie Es werden konsistente Schnittstellen zur Verwendung von Standardartefakttypen für die Eingabe und Ausgabe bereitgestellt. Diese Standardartefakte werden in Vertex ML Metadata erfasst, was die Analyse der Herkunft der Artefakte Ihrer Pipeline erleichtert. Weitere Informationen zur Herkunft von Artefakten finden Sie unter Herkunft von Pipeline-Artefakten verfolgen.
Pipelinekosten mit Abrechnungslabels verstehen: Ressourcenlabels werden automatisch an Google Cloud-Dienste weitergegeben, die von den Google Cloud-Pipelinekomponenten in der Pipelineausführung generiert werden. Sie können Abrechnungslabels zusammen mit dem Cloud Billing-Export nach BigQuery verwenden, um die Kosten Ihrer Pipelineausführung zu prüfen. Weitere Informationen zur Verwendung von Labels, um die Kosten einer Pipelineausführung zu verstehen, finden Sie unter Informationen zu den Kosten für die Pipelineausführung. Weitere Informationen dazu, wie Labels von einer Pipelineausführung auf Ressourcen übertragen werden, die von Google Cloud-Pipelinekomponenten generiert werden, finden Sie unter Ressourcen-Labeling von Vertex AI Pipelines.
Kosteneinsparungen:^* Vertex AI-Pipelines optimieren die Ausführung dieser Komponenten, indem die Google Cloud-Ressourcen gestartet werden, ohne den Container starten zu müssen. Dadurch werden die Startlatenz und die Kosten für den Busy-Waiting-Container verringert.

Nächste Schritte

Prüfen Sie alle Anleitungen, die das google_cloud_pipeline_components SDK verwenden.
Weitere Informationen zu bestimmten Google Cloud-Pipeline-Komponenten finden Sie im Referenzabschnitt.
Lesen Sie die offizielle google_cloud_pipeline_components SDK-Referenz.
Weitere Informationen finden Sie im Abschnitt zu den Google Cloud-Pipeline-Komponenten im Kubeflow Pipelines SDK-Repository.