Colocação em zona automática do Dataproc

Quando você cria um cluster do Dataproc, os recursos dele usam endpoints regionais com base em zonas do Compute Engine. Ao escolher uma região, é possível selecionar uma zona dentro dessa região ou omitir a zona para que o recurso Zona automática do Dataproc selecione uma para você na região escolhida. Quando uma zona é selecionada, todos os nós desse cluster são implantados nela.

Zona automática e reservas de recursos

A zona automática prioriza a criação de um cluster em uma zona com reservas de recursos da seguinte maneira:

  • Se os recursos de cluster solicitados puderem ser totalmente satisfeitos por recursos reservados e, se necessário, por recursos sob demanda em uma zona, a zona automática vai consumir os recursos reservados e sob demanda e criar o cluster nessa zona.

  • A zona automática prioriza zonas para seleção de acordo com as reservas totais de núcleo da CPU (vCPU) em uma zona.

    Exemplo: uma solicitação de criação de cluster especifica 20 n2-standard-2 e 1 n2-standard-64 (40 + 64 vCPUs solicitados). A zona automática prioriza as seguintes zonas para seleção de acordo com o total de reservas de vCPU disponíveis na zona:

    1. zone-c reservas disponíveis: 3 n2-standard-2 e 1 n2-standard-64 (70 vCPUs)
    2. zone-b reservas disponíveis: 1 n2-standard-64 (64 vCPUs)
    3. zone-a reservas disponíveis: 25 n2-standard-2 (50 vCPUs)

      Supondo que cada uma das zonas acima tenha mais vCPU sob demanda e recursos suficientes para atender à solicitação de cluster, a zona automática selecionará zone-c para a criação do cluster.

  • Se os recursos de cluster solicitados não puderem ser totalmente satisfeitos por recursos reservados e sob demanda em uma zona, a zona automática criará o cluster em uma zona com maior probabilidade de satisfazer a solicitação usando recursos sob demanda.

Como usar a colocação em zona automática

Console

Para criar um cluster do Dataproc que usa a colocação em zona automática:

  • No console do Google Cloud, abra a página Criar um cluster do Dataproc no Compute Engine do Dataproc. O painel Configurar cluster está selecionado.
  • Na seção Local:
    • Selecione uma Região para o cluster.
    • Em Zona, selecione "Qualquer".

Comando gcloud

Para criar um cluster do Dataproc que use a colocação em zona automática, use o comando gcloud dataproc clusters create. Defina a sinalização --region como uma região e omita a sinalização --zone (ou deixe a sinalização vazia: --zone= ou zone="").

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API REST

Para criar um cluster do Dataproc que use a colocação em zona automática, crie uma solicitação de API clusters.create JSON, deixando o campo gceClusterConfig.zoneUri vazio. No endpoint REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, insira um nome de região. A zona automática do Dataproc escolherá uma zona para o cluster dentro da região especificada.

Usar nomes de recursos curtos com colocação em zona automática: ao especificar um URI de recurso, como machineTypeUri ou acceleratorTypeUri, em uma solicitação de criação de cluster da API REST da colocação na zona automática, use um nome de recurso curto sem uma especificação de zona, por exemplo, "n1-standard- 2 "ou" nvidia-tesla-k80".