Dataproc supporta gli endpoint regionali in base alle regioni di Compute Engine. Devi specificare una regione, ad esempio "us-east1" o "europe-west1", quando crei un cluster Dataproc. Dataproc isolerà le risorse del cluster, come le istanze VM, Cloud Storage e l'archiviazione dei metadati, all'interno di una zona della regione specificata.
Se vuoi, puoi specificare una zona all'interno della regione del cluster specificata, ad esempio "us-east1-a" o "europe-west1-b", quando crei un cluster. Se non specifichi la zona, Dataproc Auto Zone Placement sceglierà una zona all'interno della regione del cluster specificata per individuare le risorse dei cluster.
Lo spazio dei nomi regionale corrisponde al segmento /regions/REGION
degli URI delle risorse Dataproc (vedi, ad esempio, il
cluster
networkUri
).
Semantica degli endpoint regionali
I nomi degli endpoint regionali seguono una convenzione di denominazione standard basata sulle
regioni Compute Engine.
Ad esempio, il nome della regione Stati Uniti centrali è us-central1
e il nome della regione Europa occidentale è europe-west1
. Esegui il comando gcloud compute regions list
per visualizzare un elenco delle regioni disponibili.
Crea un cluster
gcloud
Quando crei un cluster, specifica una regione utilizzando il flag obbligatorio--region
.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API REST
Utilizza il parametro URL REGION
in una richiesta clusters.create per specificare la regione del cluster.
gRPC
Imposta l'indirizzo di trasporto del client sull'endpoint regionale utilizzando il seguente pattern:
REGION-dataproc.googleapis.com
Esempio di Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}
Esempio di Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}
Console
Specifica una regione Dataproc nella sezione Posizione del pannello Configura cluster nella pagina Dataproc Crea un cluster nella console Google Cloud.
Passaggi successivi
- Geografia e regioni
- Compute Engine→Regioni e zone
- Compute Engine→Risorse globali, regionali e di zona
- Posizionamento in base alla zona automatica di Dataproc