Dataproc admite extremos regionales según Regiones de Compute Engine. Debes especificar una región, como “us-east1” o "europe-west1", cuando creas un clúster de Dataproc. Dataproc aislará los recursos del clúster, como instancias de VM y Cloud Storage y de metadatos, en una zona de la región especificada.
De manera opcional, puedes especificar una zona dentro de la región del clúster especificada, como "us-east1-a" o "europe-west1-b", cuando creas un clúster. Si no especificar la zona, Posición de zona automática de Dataproc elegirá una zona dentro de la región de tu clúster especificado para ubicar los clústeres de Google Cloud.
El espacio de nombres regional corresponde al segmento /regions/REGION
de los URIs de recursos de Dataproc (consulta, por ejemplo, el clúster networkUri
).
Semántica de los extremos regionales
Los nombres de los extremos regionales siguen una convención de nombres estándar que se basa en las regiones de Compute Engine.
Por ejemplo, el nombre de la región central de EE.UU. es us-central1
y el nombre de la región de Europa Occidental es europe-west1
. Ejecuta el comando gcloud compute regions list
para ver una lista de las regiones disponibles.
Crea un clúster
gcloud
Cuando crees un clúster, especifica una región con la marca --region
obligatoria.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API de REST
Usa el parámetro de URL REGION
en una solicitud clusters.create para especificar la región del clúster.
gRPC
Configura la dirección de transporte del cliente en el extremo regional usando el siguiente patrón:
REGION-dataproc.googleapis.com
Ejemplo de Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}
Ejemplo de Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}
Console
Especifica una región de Dataproc en la sección Ubicación del Panel Set up cluster en Dataproc Página Crea un clúster en la consola de Google Cloud.
¿Qué sigue?
- Geografía y regiones
- Motor de Compute Engine→Regiones y zonas
- Compute Engine→Recursos globales, regionales y zonales
- Ubicación de zona automática de Dataproc