Cette page a été traduite par l'API Cloud Translation.

Présentation de Dataproc sur GKE

Dataproc sur GKE vous permet d'exécuter des applications de big data à l'aide de l'API Dataproc jobs sur les clusters GKE. Utilisez la console Google Cloud , Google Cloud CLI ou l'API Dataproc (requête HTTP ou bibliothèques clientes Cloud) pour créer un cluster virtuel Dataproc sur GKE, puis envoyez une tâche Spark, PySpark, SparkR ou Spark-SQL au service Dataproc.

Dataproc sur GKE est compatible avec les versions 3.5 de Spark.

Fonctionnement de Dataproc sur GKE

Dataproc sur GKE déploie des clusters virtuels Dataproc sur un cluster GKE. Contrairement aux clusters Dataproc sur Compute Engine, les clusters virtuels Dataproc sur GKE n'incluent pas de VM maîtres ni de VM de nœud de calcul distinctes. En revanche, lorsque vous créez un cluster virtuel Dataproc sur GKE, Dataproc sur GKE crée des pools de nœuds dans un cluster GKE. Les tâches Dataproc sur GKE sont exécutées en tant que pods sur ces pools de nœuds. Les pools de nœuds et la planification des pods sur les pools de nœuds sont gérés par GKE.

Présentation de Dataproc sur GKE Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.

Fonctionnement de Dataproc sur GKE

Présentation de Dataproc sur GKE