Colocação em zona automática do Dataproc

Quando você cria um cluster do Dataproc, os recursos do cluster usam um endpoint regional com base nas zonas do Compute Engine. Ao escolher uma região, você pode selecionar uma zona dentro dela ou omitir a zona para que o recurso Zona automática do Dataproc selecione uma zona para você na região escolhida. Quando uma zona é selecionada, todos os nós desse cluster são implantados nela.

Zona automática e reservas de recursos

A zona automática prioriza a criação de um cluster em uma zona com reservas de recursos, da seguinte maneira:

  • Se os recursos do cluster solicitados puderem ser totalmente atendidos por recursos reservados e, se necessário, sob demanda em uma zona, a zona automática vai consumir os recursos reservados e sob demanda e criar o cluster nessa zona.

  • A Zona automática prioriza as zonas para seleção de acordo com as reservas de núcleo de CPU total (vCPU) em uma zona.

    Exemplo:uma solicitação de criação de cluster especifica 20 n2-standard-2 e 1 n2-standard-64 (40 + 64 vCPUs solicitados). A Zona automática vai priorizar as seguintes zonas para seleção de acordo com o total de reservas de vCPU disponíveis na zona:

    1. zone-c reservas disponíveis: 3 n2-standard-2 e 1 n2-standard-64 (70 vCPUs)
    2. zone-b reservas disponíveis: 1 n2-standard-64 (64 vCPUs)
    3. zone-a reservas disponíveis: 25 n2-standard-2 (50 vCPUs)

      Supondo que cada uma das zonas acima tenha vCPUs adicionais sob demanda e outros recursos suficientes para atender à solicitação do cluster, a zona automática vai selecionar zone-c para a criação do cluster.

  • Se os recursos do cluster solicitados não puderem ser totalmente atendidos pelos recursos reservados e sob demanda em uma zona, a zona automática vai criar o cluster em uma zona que tenha mais chances de atender à solicitação usando recursos sob demanda.

Como usar a colocação em zona automática

Console

Para criar um cluster do Dataproc que use a colocação em zona automática:

  • No console do Google Cloud, abra a página Criar um cluster do Dataproc no Compute Engine do Dataproc. O painel Configurar cluster está selecionado.
  • Na seção Local:
    • Selecione uma região para o cluster.
    • Em Zona, selecione "Qualquer uma".

Comando gcloud

Para criar um cluster do Dataproc que use a colocação em zona automática, use o comando gcloud dataproc clusters create. Defina a flag --region para uma região e omita a flag --zone (ou deixe a flag em branco: --zone= ou zone="").

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API REST

Para criar um cluster do Dataproc que use a colocação em zona automática, crie uma solicitação de API clusters.create JSON, deixando o campo gceClusterConfig.zoneUri vazio. No endpoint REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, insira um nome de região. A Zona automática do Dataproc vai escolher uma zona para o cluster na região especificada.

Usar nomes de recursos curtos com a colocação em zona automática: ao especificar um URI de recurso, como machineTypeUri ou acceleratorTypeUri, em uma solicitação de criação de cluster da API REST de colocação em zona automática, use um nome de recurso curto sem uma especificação de zona, por exemplo, "n1-standard-2" ou "nvidia-tesla-t4".