Extremos regionales

Dataproc admite extremos regionales basados en regiones de Compute Engine. Cuando creas un clúster de Dataproc, debes especificar una región, como "us-east1" o "europe-west1". Dataproc aislará los recursos del clúster, como las instancias de VM, Cloud Storage y el almacenamiento de metadatos, dentro de una zona de la región especificada.

De manera opcional, puedes especificar una zona dentro de la región del clúster especificada, como "us-east1-a" o "europe-west1-b", cuando creas un clúster. Si no especificas la zona, la Ubicación de zona automática de Dataproc elegirá una zona dentro de la región del clúster especificada para ubicar los recursos del clúster.

El espacio de nombres regional corresponde al segmento /regions/REGION de los URIs de recursos de Dataproc (consulta, por ejemplo, el clúster networkUri).

Semántica de los extremos regionales

Los nombres de los extremos regionales siguen una convención de nombres estándar que se basa en las regiones de Compute Engine. Por ejemplo, el nombre de la región central de EE.UU. es us-central1 y el nombre de la región de Europa Occidental es europe-west1. Ejecuta el comando gcloud compute regions list para ver una lista de las regiones disponibles.

Crea un clúster

gcloud

Cuando crees un clúster, especifica una región con la marca --region obligatoria.

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    other args ...

API de REST

Usa el parámetro de URL REGION en una solicitud clusters.create para especificar la región del clúster.

gRPC

Establece la dirección de transporte del cliente en el extremo regional con el siguiente patrón:

REGION-dataproc.googleapis.com

Ejemplo de Python (google-cloud-python):

from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport

transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
    address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)

project_id = 'my-project'
region = 'us-central1'
cluster = {...}

Ejemplo de Java (google-cloud-java):

ClusterControllerSettings settings =
     ClusterControllerSettings.newBuilder()
        .setEndpoint("us-central1-dataproc.googleapis.com:443")
        .build();
 try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
   String projectId = "my-project";
   String region = "us-central1";
   Cluster cluster = Cluster.newBuilder().build();
   Cluster response =
       clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
 }

Console

Especifica una región de Dataproc en la sección Ubicación del panel Configurar clúster de la página Crear un clúster de Dataproc en la consola de Google Cloud.

¿Qué sigue?