Dataproc supporta gli endpoint regionali in base alle regioni Compute Engine. Devi specificare una regione, ad esempio "us-east1" o "europe-west1", quando crei un cluster Dataproc. Dataproc le risorse del cluster, come le istanze VM e Cloud Storage, verranno isolate e archiviazione dei metadati, all'interno di una zona all'interno della regione specificata.
Facoltativamente, puoi specificare una zona all'interno della regione specificata per il cluster, ad esempio "us-east1-a" o "europe-west1-b", quando crei un cluster. Se non specifichi la zona, Dataproc Auto Zone Placement sceglierà una zona all'interno della regione del cluster specificata per individuare le risorse dei cluster.
Lo spazio dei nomi regionale corrisponde al segmento /regions/REGION
degli URI delle risorse Dataproc (vedi ad esempio il
cluster
networkUri
).
Semantica degli endpoint regionali
I nomi degli endpoint regionali seguono una convenzione di denominazione standard basata sulle regioni Compute Engine.
Ad esempio, il nome della regione degli Stati Uniti centrali è us-central1
e il nome
della regione dell'Europa occidentale è europe-west1
. Esegui gcloud compute regions list
per vedere un elenco delle regioni disponibili.
Crea un cluster
gcloud
Quando crei un cluster, specifica una regione utilizzando il campo
--region
flag.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API REST
Utilizza il parametro URL REGION
in una
clusters.create
per specificare la regione del cluster.
gRPC
Imposta l'indirizzo di trasporto del client sull'endpoint regionale utilizzando il seguente pattern:
REGION-dataproc.googleapis.com
Esempio di Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}
Esempio Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}
Console
Specifica una regione Dataproc nella sezione Località del Riquadro Configura cluster su Dataproc Pagina Crea un cluster nella console Google Cloud.
Passaggi successivi
- Area geografica e regioni
- Compute Engine →Regioni e zone
- Compute Engine→Risorse globali, regionali e di zona
- Posizionamento in base alla zona automatica di Dataproc