Posizionamento automatico della zona Dataproc

Quando crei un cluster Dataproc, le risorse cluster utilizzano endpoint a livello di regione in base Zone Compute Engine. Quando scegli una regione, puoi selezionare una zona al suo interno oppure omettere la zona in modo che la funzionalità Zona automatica Dataproc selezioni una zona alla regione che scegli. Una volta selezionata una zona, tutti i nodi per quel cluster di cui è stato eseguito il deployment in quella zona.

Prenotazioni Selezione automatica della zona e risorse

Selezione automatica della zona assegna la priorità alla creazione di un cluster in una zona con prenotazioni di risorse, come segue:

  • Se le risorse del cluster richieste possono essere completamente soddisfatte tramite prenotazione, inoltre se necessario, le risorse on demand in una zona, Selezione automatica della zona utilizzeranno risorse prenotate e on demand e di creare il cluster in quella zona.

  • La funzionalità Selezione automatica della zona assegna priorità alle zone per la selezione in base al totale dei core CPU (vCPU) in una zona.

    Esempio:una richiesta di creazione di cluster specifica 20 n2-standard-2 e 1 n2-standard-64. (40 + 64 vCPUs richiesti). La funzionalità Selezione automatica della zona darà la priorità alle zone seguenti per la selezione in base alle prenotazioni totali di vCPU disponibili nella zona:

    1. zone-c prenotazioni disponibili: 3 n2-standard-2 e 1 n2-standard-64 (70 vCPUs)
    2. zone-b prenotazioni disponibili: 1 n2-standard-64 (64 vCPUs)
    3. zone-a prenotazioni disponibili: 25 n2-standard-2 (50 vCPUs)

      Supponendo che ciascuna delle zone precedenti abbia ulteriori vCPU on demand e altre sufficienti per soddisfare la richiesta di cluster, la funzionalità Selezione automatica della zona seleziona zone-c per la creazione del cluster.

  • Se le risorse del cluster richieste non possono essere completamente soddisfatte tramite il servizio Più riservato risorse on demand in una zona, Selezione automatica della zona creerà il cluster in una zona che è più probabile che soddisfi la richiesta utilizzando risorse on demand.

Utilizzo del posizionamento automatico della zona

Console

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona:

  • Nella console Google Cloud, apri Dataproc Crea un cluster Dataproc su Compute Engine . Il riquadro Configura cluster è selezionato.
  • Nella sezione Posizione:
      .
    • Seleziona una regione per il cluster.
    • In Zona, seleziona "Qualsiasi".

Comando g-cloud

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona, utilizza gcloud dataproc clusters create . Imposta il flag --region su una regione e ometti il flag --zone (o lascia il flag vuoto: --zone= o zone="").

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API REST

Per creare un cluster Dataproc che utilizza il posizionamento Selezione automatica della zona, crea un file JSON clusters.create API, lasciando il parametro gceClusterConfig.zoneUri vuoto. Nell'endpoint REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, inserisci un nome per la regione. La zona automatica di Dataproc sceglierà una zona per il cluster all'interno della regione specificata.

Utilizza nomi brevi delle risorse con il Selezione automatica della zona zona: quando specifichi un URI della risorsa, ad esempio machineTypeUri o acceleratorTypeUri, in una richiesta di creazione di cluster API REST con posizionamento automatico, utilizza un nome risorsa breve senza specifica della zona, ad esempio "n1-standard-2" o "nvidia-tesla-t4".