Posicionamento automático de zonas do Dataproc

Quando cria um cluster do Dataproc, os recursos do cluster usam endpoints regionais com base nas zonas do Compute Engine. Quando escolhe uma região, pode selecionar uma zona nessa região ou omitir a zona para que a funcionalidade de zona automática do Dataproc selecione uma zona para si na região que escolher. Depois de selecionar uma zona, todos os nós desse cluster são implementados nessa zona.

Zona automática e reservas de recursos

A zona automática dá prioridade à criação de um cluster numa zona com reservas de recursos, da seguinte forma:

  • Se os recursos do cluster pedidos puderem ser totalmente satisfeitos pelos recursos reservados, mais, se necessário, recursos a pedido numa zona, a zona automática consome os recursos reservados e a pedido, e cria o cluster nessa zona.

  • A zona automática prioriza as zonas para seleção de acordo com as reservas totais de núcleos da CPU (vCPU) numa zona.

    Exemplo: um pedido de criação de cluster especifica 20 n2-standard-2 e 1 n2-standard-64 (40 + 64 vCPUs pedidos). A zona automática vai dar prioridade às seguintes zonas para seleção de acordo com as reservas de vCPU totais disponíveis na zona:

    1. zone-c reservas disponíveis: 3 n2-standard-2 e 1 n2-standard-64 (70 vCPUs)
    2. zone-b reservas disponíveis: 1 n2-standard-64 (64 vCPUs)
    3. zone-a reservas disponíveis: 25 n2-standard-2 (50 vCPUs)

      Partindo do princípio de que cada uma destas zonas tem vCPU recursos adicionais a pedido e outros suficientes para satisfazer o pedido do cluster, a zona automática seleciona zone-c para a criação do cluster.

  • Se os recursos de cluster pedidos não puderem ser totalmente satisfeitos pelos recursos a pedido reservados numa zona, a zona automática cria o cluster numa zona que tem maior probabilidade de satisfazer o pedido através de recursos a pedido.

Use o posicionamento automático de zonas

Consola

Para criar um cluster do Dataproc que use o posicionamento automático de zonas:

  1. Na Google Cloud consola, abra a página Crie um cluster do Dataproc no Compute Engine. O painel Configurar cluster está selecionado.
  2. Na secção Localização, faça o seguinte:
    • Selecione uma região para o seu cluster.
    • Em Zona, selecione "Qualquer".

comando gcloud

Para criar um cluster do Dataproc que use o posicionamento automático de zonas, use o comando gcloud dataproc clusters create. Defina o sinalizador --region para uma região e omita o sinalizador --zone (ou deixe o sinalizador vazio: --zone= ou zone="").

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API REST

Para criar um cluster do Dataproc que use o posicionamento automático de zonas, crie um pedido da API clusters.create em JSON, deixando o campo gceClusterConfig.zoneUri vazio. No ponto final REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, insira o nome de uma região. A zona automática do Dataproc escolhe uma zona para o cluster na região especificada.

Use nomes de recursos curtos com o posicionamento de zonas automáticas: quando especificar um URI de recurso, como machineTypeUri ou acceleratorTypeUri, num pedido de criação de cluster da API REST de posicionamento de zonas automáticas, use um nome de recurso curto sem uma especificação de zona, por exemplo, "n1-standard-2" ou "nvidia-tesla-t4".