Attività principali e comuni
-
Autenticazione in Dataproc
Scopri come eseguire l'autenticazione in Dataproc.
-
Crea un cluster
Crea un cluster utilizzando la console Google Cloud o Google Cloud CLI.
-
Crea un cluster parziale
Crea un cluster parziale con un numero minimo di worker principali.
-
Creare un'immagine personalizzata
Scopri come creare un'immagine personalizzata e installarla su un cluster Dataproc.
-
Creazione e gestione delle etichette
Creare e gestire le etichette utente di Dataproc.
-
Gestione delle dipendenze Java e Scala per Spark
Scopri come gestire le dipendenze Java e Scala e risolvere i conflitti per le applicazioni Apache Spark.
-
Gestione di un cluster
Aggiorna o arresta un cluster.
-
Esecuzione di notebook Vertex AI Workbench su cluster Dataproc
Esegui il file di blocco note di un'istanza gestita su un cluster Dataproc.
-
Configura un progetto
Configura un nuovo progetto per utilizzare Dataproc.
-
Avvio e arresto dei cluster
Avviare e arrestare un cluster Dataproc.
-
invia un job
Invia diversi tipi di job utilizzando la console Google Cloud, Google Cloud CLI o tramite SSH in un'istanza del cluster.
Dataproc su GKE
-
Panoramica di Dataproc su GKE
Una panoramica di Dataproc su GKE .
-
Guida rapida: esecuzione di un job Spark su Dataproc su GKE
Crea un cluster virtuale Dataproc su GKE, quindi esegui un job Spark sul cluster virtuale.
-
Ricrea e aggiorna un cluster virtuale Dataproc su GKE
Ricrea e aggiorna un cluster virtuale Dataproc su GKE.
-
Elimina un cluster virtuale Dataproc su GKE
Eliminare un cluster virtuale Dataproc su GKE.
-
Immagini container Dataproc on GKE personalizzate
Come creare immagini container di Dataproc on GKE.
-
Esegui la diagnostica di un cluster Dataproc su GKE
Come diagnosticare un cluster Dataproc su GKE.
-
Ruoli e identità IAM di Dataproc su GKE
Autorizzazioni IAM di Dataproc su GKE.
-
Logging di Dataproc su GKE
Visualizza i log di Dataproc on GKE.
-
Dataproc su pool di nodi GKE
Gestire i pool di nodi di Dataproc su GKE.
-
Versioni release Dataproc su GKE
Informazioni sulla versione della release di Dataproc su GKE.
-
Scala un cluster Dataproc su GKE
Scalare un cluster Dataproc su GKE.
Dataproc Hub
-
Panoramica di Dataproc Hub
Comprendere le nozioni di base di Dataproc Hub.
-
Configura un Dataproc Hub
Configura Dataproc Hub per aprire l'UI JupyterLab su cluster Dataproc per utente singolo.
-
Utilizzo di un Dataproc Hub
Utilizza un'istanza Dataproc Hub per aprire l'UI JupyterLab su un cluster Dataproc per utente singolo.
Gruppi di nodi Dataproc
Modelli Dataproc
-
Modelli Dataproc
Utilizza i modelli Dataproc per configurare ed eseguire carichi di lavoro e job di Dataproc.
-
Log Dataproc
Utilizza Cloud Logging per visualizzare i log dei job e del cluster Dataproc.
-
Output e log del job di Dataproc
Configura e visualizza l'output del job di Dataproc.
-
Visualizza audit log di Dataproc
Come visualizzare gli audit log di Dataproc.
-
Cloud Monitoring
Utilizza Cloud Monitoring per visualizzare le metriche dei cluster Dataproc.
-
Creazione di avvisi per le metriche Dataproc
Creazione di avvisi sulle metriche dei cluster e dei job Dataproc.
-
Cloud Profiler
usa Cloud Profiler per profilare l'utilizzo e l'allocazione della memoria dei job Spark e Hadoop.
-
Migrazione dei dati HDFS
Esegui la migrazione dei dati da un file system di Hadoop (HDFS) a Cloud Storage per utilizzarli con Dataproc e altri servizi.
-
Migrazione dei cluster
Esegui la migrazione dei cluster Apache Spark e Apache Hadoop in Dataproc.
-
Migrazione dei job
Sposta Spark, Hadoop, Hive, Pig e altri tipi di job in Dataproc.