Composants Dataproc sans serveur

Les composants sans serveur Dataproc vous permettent d'exécuter des charges de travail par lot Apache Spark à partir d'un pipeline dans Vertex AI Pipelines. Dataproc sans serveur exécute les charges de travail par lot sur une infrastructure de calcul gérée en effectuant un autoscaling des ressources selon les besoins.

Apprenez-en davantage sur Dataproc sans serveur et les charges de travail Spark compatibles.

Dans Dataproc sans serveur, une ressource Batch représente une charge de travail par lot. Le SDK des composants du pipeline Google Cloud contient les opérateurs suivants permettant de créer des ressources Batch et surveiller leur exécution :

Documentation de référence de l'API

Tutoriels

Historique des versions et notes de version

Pour en savoir plus sur l'historique des versions et les modifications apportées au SDK des composants du pipeline Google Cloud, consultez les notes de version du SDK des composants du pipeline Google Cloud.

Contacts pour l'assistance technique

Si vous avez des questions, veuillez contacter kfp-dataproc-components@google.com.