Posizionamento automatico della zona Dataproc

Quando crei un cluster Dataproc, le risorse del cluster utilizzano endpoint a livello di regione basati sulle zone di Compute Engine. Quando scegli una regione, puoi selezionare una zona al suo interno oppure ometterla per fare in modo che la funzionalità Zona automatica di Dataproc selezioni una zona per te nella regione scelta. Una volta selezionata una zona, verrà eseguito il deployment di tutti i nodi del cluster in quella zona.

Prenotazioni Selezione automatica della zona e risorse

Selezione automatica della zona assegna la priorità alla creazione di un cluster in una zona con prenotazioni di risorse, come segue:

  • Se le risorse del cluster richieste possono essere completamente soddisfatte dalle risorse prenotate e, se necessario, dalle risorse on demand in una zona,Selezione automatica della zonae utilizzerà le risorse riservate e on demand e creerà il cluster in quella zona.

  • Selezione automatica della zona assegna la priorità alle zone per la selezione in base al totale delle prenotazioni dei core della CPU (vCPU) in una zona.

    Esempio:una richiesta di creazione di cluster specifica 20 n2-standard-2 e 1 n2-standard-64 (40 + 64 vCPUs richiesti). Selezione automatica della zona darà la priorità alle seguenti zone per la selezione in base alle prenotazioni totali di vCPU disponibili nella zona:

    1. zone-c prenotazioni disponibili: 3 n2-standard-2 e 1 n2-standard-64 (70 vCPUs)
    2. zone-b prenotazioni disponibili: 1 n2-standard-64 (64 vCPUs)
    3. zone-a prenotazioni disponibili: 25 n2-standard-2 (50 vCPUs)

      Presumendo che ciascuna delle zone precedenti disponga di vCPU on demand e di altre risorse aggiuntive sufficienti per soddisfare la richiesta di cluster, la Selezione automatica della zona selezionerà zone-c per la creazione del cluster.

  • Se le risorse del cluster richieste non possono essere completamente soddisfatte dalle risorse prenotate e on demand in una zona, la funzionalità Selezione automatica della zona creerà il cluster in una zona che con maggiore probabilità soddisferà la richiesta utilizzando le risorse on demand.

Utilizzo del posizionamento automatico della zona

Console

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona:

  • Nella console Google Cloud, apri la pagina Creare un cluster Dataproc su Compute Engine di Dataproc. Il riquadro Configura cluster è selezionato.
  • Nella sezione Località:
    • Seleziona una regione per il cluster.
    • In Zona, seleziona "Qualsiasi".

Comando g-cloud

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona, utilizza il comando gcloud dataproc clusters create. Imposta il flag --region su una regione e ometti il flag --zone (oppure lascia il flag vuoto: --zone= o zone="").

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API REST

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona, crea una richiesta API clusters.create JSON, lasciando vuoto il campo gceClusterConfig.zoneUri. Nell'endpoint REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, inserisci il nome di una regione. La zona automatica Dataproc sceglierà una zona per il cluster all'interno della regione specificata.

Utilizza nomi brevi delle risorse con il posizionamento Selezione automatica della zona zona: quando specifichi un URI della risorsa, come machineTypeUri o acceleratorTypeUri, in una richiesta di creazione di cluster dell'API REST per il posizionamento Selezione automatica della zona, utilizza un nome di risorsa breve senza specifica della zona, ad esempio "n1-standard-2" o "nvidia-tesla-t4".