Questo tutorial include una procedura dettagliata di Cloud Shell che utilizza la classe Librerie client di Google Cloud per Python per chiamare in modo programmatico API Dataproc gRPC per creare un cluster e inviare un job al cluster.
Le seguenti sezioni spiegano il funzionamento del codice della procedura dettagliata contenuto nel GitHub Repository GoogleCloudPlatform/python-dataproc.
Esegui la procedura dettagliata di Cloud Shell
Fai clic su Apri in Cloud Shell per eseguire la procedura dettagliata.
comprendi il codice
Credenziali predefinite dell'applicazione
La procedura dettagliata di Cloud Shell in questo tutorial fornisce l'autenticazione utilizzando le credenziali del progetto Google Cloud. Quando esegui il codice localmente, la best practice è utilizzare le credenziali dell'account di servizio per autenticare il codice.
Crea un cluster Dataproc
Per creare il cluster vengono impostati i seguenti valori:
- Il progetto in cui verrà creato il cluster
- La regione in cui verrà creato il cluster
- Il nome del cluster
- La configurazione del cluster, che specifica un master e due primari worker
Per le restanti impostazioni del cluster vengono utilizzate le impostazioni di configurazione predefinite. Puoi eseguire l'override delle impostazioni di configurazione del cluster predefinite. Ad esempio, puoi aggiungere VM secondarie (valore predefinito = 0) o specificare un valore non predefinito rete VPC per il cluster. Per ulteriori informazioni, consulta CreateCluster.
Invia un job
Per l'invio del job sono impostati i seguenti valori:
- Il progetto in cui verrà creato il cluster
- La regione in cui verrà creato il cluster
- La configurazione del job, che specifica il nome del cluster e il percorso (URI) Cloud Storage del job PySpark
Vedi SubmitJob per ulteriori informazioni.
Elimina il cluster
Per eliminare il cluster, sono impostati i seguenti valori:
- Il progetto in cui verrà creato il cluster
- La regione in cui verrà creato il cluster
- Il nome del cluster
Per ulteriori informazioni, consulta DeleteCluster.