Documentazione di Dataproc
Dataproc è un servizio Apache Spark e Apache Hadoop gestito che consente di sfruttare strumenti di dati open source per l'elaborazione batch, l'esecuzione di query, l'inserimento di flussi e il machine learning. L'automazione di Dataproc consente di creare i cluster rapidamente, gestirli con facilità e risparmiare disattivando i cluster quando non ti servono. Risparmiando tempo e denaro nell'amministrazione, puoi concentrarti sui tuoi job e sui tuoi dati. Scopri di più
Risorse di documentazione
Guide
-
Guide rapide: console, riga di comando, librerie client, Explorer API: crea un cluster, oppure Explorer API: invia un job Spark
-
Panoramica dei modelli di flusso di lavoro Dataproc
-
Guida rapida di Dataproc su GKE
-
Configurazione di Dataproc Hub
-
Creazione di un'immagine personalizzata Dataproc
-
Scrittura di un job MapReduce con il connettore BigQuery
-
Utilizzo del connettore Cloud Storage con Apache Spark
-
Risorse correlate
Video correlati
Java è un marchio registrato di Oracle e/o delle sue affiliate.