Ubicación de zona automática de Dataproc

Cuando creas un clúster de Dataproc, los recursos del clúster usan los extremos regionales basados en Zonas de Compute Engine. Cuando eliges una región, puedes seleccionar una zona dentro de esa región o puedes omitir la zona para que la función Zona automática de Dataproc seleccione una zona por ti en la región que elijas. Una vez que se selecciona una zona, todos los nodos de ese clúster se implementarán en esa zona.

Zona automática y reservas de recursos

La zona automática prioriza la creación de un clúster en una zona con reservas de recursos de la siguiente manera:

  • Si los recursos del clúster solicitados pueden cumplirse completamente con las de ser necesario, según demanda en una zona, Zona automática consumirá la reservados y a pedido, y crear el clúster en esa zona.

  • La zona automática prioriza las zonas para la selección según el núcleo de CPU total (vCPU) las reservas en una zona.

    Ejemplo: Una solicitud de creación de clúster especifica 20 n2-standard-2 y 1 n2-standard-64 (40 + 64 vCPUs solicitados). La zona automática priorizará las siguientes zonas Para la selección según las reservas totales de CPU virtuales disponibles en la zona:

    1. zone-c reservas disponibles: 3 n2-standard-2 y 1 n2-standard-64 (70 vCPUs)
    2. zone-b reservas disponibles: 1 n2-standard-64 (64 vCPUs)
    3. zone-a reservas disponibles: 25 n2-standard-2 (50 vCPUs)

      Si suponemos que cada una de las zonas anteriores tiene vCPU adicionales a pedido y otros recursos suficientes para satisfacer la solicitud del clúster, Zona automática Selecciona zone-c para crear el clúster.

  • Si los recursos del clúster solicitados no se pueden satisfacer por completo con las funciones a pedido de una zona, Zona automática creará el clúster en una zona que tenga más probabilidades de satisfacer la solicitud con recursos a pedido.

Usa la posición de zona automática de Cloud Dataproc

Console

Para crear un clúster de Dataproc que use la posición de zona automática, sigue estos pasos:

  • En la consola de Google Cloud, abre Dataproc Crea un clúster de Dataproc en Compute Engine . Se selecciona el panel Configurar clúster.
  • En la sección Ubicación, haz lo siguiente:
    • Selecciona una Región para el clúster.
    • En Zona, selecciona “Cualquiera”.

Comando de gcloud

Para crear un clúster de Dataproc que use la ubicación de zona automática, utiliza el comando gcloud dataproc clusters create. Establece la marca --region en una región. omitir la marca --zone (o dejar la marca vacía: --zone= o zone="")

gcloud dataproc clusters create cluster-name \
    --region=region \
    --zone="" \
    other args ...

API de REST

Para crear un clúster de Dataproc que use la posición de zona automática, construye una solicitud JSON clusters.create a la API y deja el campo gceClusterConfig.zoneUri vacío. En el extremo de REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters, inserta el nombre de una región. La zona automática de Dataproc elegirá una zona para el clúster dentro de la región especificada.

Usar nombres cortos de recursos con la posición de zona automática: Cuando se especifica un URI de recurso, como machineTypeUri o acceleratorTypeUri, en una solicitud de creación de clústeres de la API de REST de posición de zona automática, usa un nombre de recurso corto sin una especificación de zona, por ejemplo, “n1-standard-2” o “nvidia-tesla-t4”.