Colocação em zona automática do Dataproc

Quando você cria um cluster do Dataproc, os recursos do cluster usam endpoints regionais com base em Zonas do Compute Engine. Ao escolher uma região, é possível selecionar uma zona dentro dela ou omitir a zona em que o recurso Zona automática do Dataproc selecionará uma para você na região escolhida. Quando uma zona é selecionada, todos os nós desse cluster são implantados nela.

Zona automática e reservas de recursos

A zona automática prioriza a criação de um cluster em uma zona com reservas de recursos, da seguinte forma:

  • Se os recursos de cluster solicitados puderem ser totalmente satisfeitos com os recursos reservados, se necessário, os recursos sob demanda em uma zona, a zona automática vai consumir recursos reservados e sob demanda e criar o cluster nessa zona.

  • A zona automática prioriza zonas para seleção de acordo com o núcleo total da CPU (vCPU) reservas em uma zona.

    Exemplo: uma solicitação de criação de cluster especifica 20 n2-standard-2 e 1 n2-standard-64 (40 + 64 vCPUs solicitados). A zona automática priorizará as seguintes zonas para seleção de acordo com o total de reservas de vCPU disponíveis na zona:

    1. zone-c reservas disponíveis: 3 n2-standard-2 e 1 n2-standard-64 (70 vCPUs)
    2. zone-b reservas disponíveis: 1 n2-standard-64 (64 vCPUs)
    3. zone-a reservas disponíveis: 25 n2-standard-2 (50 vCPUs)

      Considerando que cada uma das zonas acima tem vCPU sob demanda adicionais e outros suficientes para atender à solicitação do cluster, a zona automática selecione zone-c para a criação do cluster.

  • Se os recursos do cluster solicitados não puderem ser totalmente atendidos pelos recursos reservados e sob demanda em uma zona, a zona automática vai criar o cluster em uma zona que tenha mais chances de atender à solicitação usando recursos sob demanda.

Como usar a colocação em zona automática

Console

Para criar um cluster do Dataproc que use a colocação em zona automática:

  • No console do Google Cloud, abra a página Criar um cluster do Dataproc no Compute Engine do Dataproc. O painel Configurar cluster está selecionado.
  • Na seção Local:
    • Selecione uma região para o cluster.
    • Em Zona, selecione "Qualquer".

Comando gcloud

Para criar um cluster do Dataproc que use a colocação em zona automática, use o comando gcloud dataproc clusters create. Defina a flag --region para uma região e omita a flag --zone (ou deixe a flag em branco: --zone= ou zone="").

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API REST

Para criar um cluster do Dataproc que use a colocação em zona automática, crie uma solicitação de API clusters.create JSON, deixando o campo gceClusterConfig.zoneUri vazio. No endpoint REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, insira o nome da região. A zona automática do Dataproc escolherá uma zona para o cluster dentro da região especificada.

Usar nomes de recursos curtos com a colocação em zona automática: ao especificar um URI de recurso, como machineTypeUri ou acceleratorTypeUri, em uma solicitação de criação de cluster da API REST de colocação em zona automática, use um nome de recurso curto sem uma especificação de zona, por exemplo, "n1-standard-2" ou "nvidia-tesla-t4".