Documentation Dataproc
Dataproc est un service géré Apache Spark et Apache Hadoop qui vous permet de bénéficier d'outils de données Open Source pour le traitement par lot, l'émission de requêtes, le streaming et le machine learning. L'automatisation Dataproc vous permet de créer des clusters rapidement, de les gérer facilement et de faire des économies en désactivant ceux que vous n'utilisez plus. Vous consacrez moins de temps et d'argent aux fonctions d'administration, ce qui vous permet de vous concentrer sur les tâches et les données. En savoir plus
Ressources de documentation
Guides
-
Guides de démarrage rapide: Console Ligne de commande Bibliothèques clientes, APIs Explorer : créer un cluster, ou Explorateur d'API : envoi d'un job Spark
-
Présentation des modèles de workflow Dataproc
-
Guide de démarrage rapide de Dataproc sur GKE
-
Configurer Dataproc Hub
-
Créer une image Dataproc personnalisée
-
Écrire une tâche MapReduce avec le connecteur BigQuery
-
Utiliser le connecteur Cloud Storage avec Apache Spark
-