Dataproc admite endpoints regionales basados en las regiones de Compute Engine. Cuando creas un clúster de Dataproc, debes especificar una región, como "us-east1" o "europe-west1". Dataproc aislará los recursos del clúster, como las instancias de VM y el almacenamiento de Cloud Storage y de metadatos, en una zona de la región especificada.
Cuando creas un clúster, puedes especificar una zona dentro de la región del clúster, como "us-east1-a" o "europe-west1-b". Si no especificas la zona, Colocación automática de zonas de Dataproc elegirá una zona de la región del clúster que hayas especificado para ubicar los recursos del clúster.
El espacio de nombres regional corresponde al /regions/REGION
segmento de los URIs de los recursos de Dataproc (por ejemplo, el networkUri
de los clústeres).
Semántica de los endpoints regionales
Los nombres de los endpoints regionales siguen una convención de nomenclatura estándar basada en las regiones de Compute Engine.
Por ejemplo, el nombre de la región Centro de EE. UU. es us-central1
y el de la región Europa Occidental es europe-west1
. Ejecuta el comando gcloud compute regions list
para ver una lista de las regiones disponibles.
Crear un clúster
gcloud
Cuando crees un clúster, especifica una región con la marca obligatoria --region
.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API REST
Usa el parámetro de URL REGION
en una solicitud clusters.create para especificar la región del clúster.
gRPC
Define la dirección de transporte del cliente en el endpoint regional con el siguiente patrón:
REGION-dataproc.googleapis.com
Ejemplo de Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}
Ejemplo de Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}
Consola
Especifica una región de Dataproc en la sección Ubicación del panel Configurar clúster de la página Crear un clúster de Dataproc en la consola de Google Cloud .
Siguientes pasos
- Geografía y regiones
- Compute Engine → Regiones y zonas
- Compute Engine → Recursos globales, regionales y de zona
- Colocación automática de zonas de Dataproc