Questo tutorial include una procedura dettagliata di Cloud Shell che utilizza le librerie client di Google Cloud per Python per chiamare a livello di programmazione le API gRPC di Dataproc per creare un cluster e inviare un job al cluster.
Le sezioni seguenti spiegano il funzionamento del codice della procedura dettagliata contenuto nel repository GitHub GoogleCloudPlatform/python-dataproc.
Esegui la procedura dettagliata di Cloud Shell
Fai clic su Apri in Cloud Shell per eseguire la procedura dettagliata.
comprendi il codice
Credenziali predefinite dell'applicazione
La procedura dettagliata di Cloud Shell in questo tutorial fornisce l'autenticazione utilizzando le credenziali del progetto Google Cloud . Quando esegui il codice localmente, la prassi consigliata è utilizzare le credenziali del service account per autenticare il codice.
Crea un cluster Dataproc
Per creare il cluster vengono impostati i seguenti valori:
- Il progetto in cui verrà creato il cluster
- La regione in cui verrà creato il cluster
- Il nome del cluster
- La configurazione del cluster, che specifica un master e due worker principali
Per le impostazioni del cluster rimanenti vengono utilizzate le impostazioni di configurazione predefinite. Puoi eseguire l'override delle impostazioni di configurazione predefinite del cluster. Ad esempio, puoi aggiungere VM secondarie (valore predefinito = 0) o specificare una rete VPC non predefinita per il cluster. Per saperne di più, vedi CreateCluster.
Invia un job
Per inviare il job sono impostati i seguenti valori:
- Il progetto in cui verrà creato il cluster
- La regione in cui verrà creato il cluster
- La configurazione del job, che specifica il nome del cluster e il percorso del file (URI) Cloud Storage del job PySpark
Per saperne di più, consulta SubmitJob.
Elimina il cluster
I seguenti valori sono impostati per eliminare il cluster:
- Il progetto in cui verrà creato il cluster
- La regione in cui verrà creato il cluster
- Il nome del cluster
Per saperne di più, consulta la sezione DeleteCluster.