Cuando creas un clúster de Dataproc, sus recursos usan extremos regionales basados en las zonas de Compute Engine. Cuando eliges una región, puedes seleccionar una zona dentro de ella, o bien omitir la zona para que la función de zona automática de Dataproc seleccione una zona en la región que elijas. Una vez que se selecciona una zona, todos los nodos de ese clúster se implementarán en esa zona.
Zona automática y reservas de recursos
La zona automática prioriza la creación de un clúster en una zona con reservas de recursos, de la siguiente manera:
Si los recursos del clúster solicitados se pueden satisfacer por completo mediante reservas y, si es necesario, recursos a pedido en una zona, la zona automática consumirá los recursos reservados y a pedido, y creará el clúster en esa zona.
La zona automática prioriza las zonas para la selección en función de las reservas totales de núcleo de CPU (
vCPU
) en una zona.Ejemplo: Una solicitud de creación de clúster especifica 20
n2-standard-2
y 1n2-standard-64
(40 + 64vCPUs
solicitados). La zona automática priorizará las siguientes zonas para su selección de acuerdo con el total de reservas de CPU virtual disponibles en la zona:zone-c
reservas disponibles: 3n2-standard-2
y 1n2-standard-64
(70vCPUs
)zone-b
reservas disponibles: 1n2-standard-64
(64vCPUs
)zone-a
reservas disponibles: 25n2-standard-2
(50vCPUs
)Si suponemos que cada una de las zonas anteriores tiene
vCPU
a pedido adicional y otros recursos suficientes para satisfacer la solicitud del clúster, la zona automática seleccionarázone-c
para la creación del clúster.
Si los recursos del clúster solicitados no se pueden satisfacer por completo con recursos reservados y bajo demanda en una zona, la zona automática creará el clúster en una zona que tenga más probabilidades de satisfacer la solicitud mediante recursos a pedido.
Usa la posición de zona automática de Cloud Dataproc
Console
Para crear un clúster de Dataproc que use la posición de zona automática, sigue estos pasos:
- En la consola de Google Cloud, abre la página Crear un clúster de Dataproc en Compute Engine de Dataproc. Se seleccionará el panel Configurar clúster.
- En la sección Ubicación, haz lo siguiente:
- Selecciona una Región para el clúster.
- En Zona, selecciona “Cualquiera”.
Comando de gcloud
Para crear un clúster de Dataproc que use la ubicación de zona automática, utiliza el comando gcloud dataproc clusters create. Establece la marca --region
en una región y omite la marca --zone
(o deja la marca vacía: --zone=
o zone=""
).
gcloud dataproc clusters create cluster-name \ --region=region \ --zone="" \ other args ...
API de REST
Para crear un clúster de Dataproc que use la posición de zona automática, construye una solicitud JSON clusters.create a la API y deja el campo gceClusterConfig.zoneUri vacío. En el extremo de REST, https://dataproc.googleapis.com/v1/projects/projectId/regions/region/clusters
, inserta un nombre de región. La zona automática de Dataproc elegirá una zona para el clúster dentro de la región especificada.
Usa nombres cortos de recursos con la posición de zona automática: Cuando especifiques un URI de recurso, como machineTypeUri o acceleratorTypeUri, en una solicitud de creación de clúster de API de REST para posición automática, usa un nombre de recurso corto sin especificación de zona, por ejemplo, “n1-standard-2” o “nvidia-tesla-t4”.