Regionale Endpunkte

Dataproc unterstützt regionale Endpunkte, die auf Compute Engine-Regionen basieren. Sie müssen beim Erstellen eines Dataproc-Clusters eine Region angeben, z. B. „us-east1“ oder „europe-west1“. Dataproc isoliert Clusterressourcen wie VM-Instanzen, Cloud Storage und Metadatenspeicher innerhalb einer Zone innerhalb der angegebenen Region.

Sie können beim Erstellen eines Clusters optional eine Zone innerhalb der angegebenen Clusterregion angeben, z. B. „us-east1-a“ oder „europe-west1-b“. Wenn Sie die Zone nicht angeben, wählt die automatische Zonenplatzierung in Dataproc eine Zone innerhalb der angegebenen Clusterregion aus, um Clusterressourcen zu platzieren.

Der regionale Namespace entspricht dem Segment /regions/REGION von Dataproc-Ressourcen-URIs (siehe z. B. den Cluster networkUri).

Semantik regionaler Endpunkte

Namen regionaler Endpunkte folgen einer Standard-Namenskonvention basierend auf Compute Engine-Regionen. Beispiel: Der Name für die zentrale Region der USA lautet us-central1 und der Name der Region Westeuropa ist europe-west1. Führen Sie den Befehl gcloud compute regions list aus, um eine Liste der verfügbaren Regionen anzuzeigen.

Cluster erstellen

gcloud

Geben Sie beim Erstellen eines Clusters eine Region mit dem erforderlichen Flag --region an.

gcloud dataproc clusters create CLUSTER_NAME \
    --region=REGION \
    other args ...

REST API

Verwenden Sie den URL-Parameter REGION in einer clusters.create-Anfrage, um die Clusterregion anzugeben.

gRPC

Legen Sie die Client-Transportadresse mit dem folgenden Muster auf den regionalen Endpunkt fest:

REGION-dataproc.googleapis.com

Python (google-cloud-python) Beispiel:

from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport

transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
    address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)

project_id = 'my-project'
region = 'us-central1'
cluster = {...}

Java (google-cloud-java) Beispiel:

ClusterControllerSettings settings =
     ClusterControllerSettings.newBuilder()
        .setEndpoint("us-central1-dataproc.googleapis.com:443")
        .build();
 try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
   String projectId = "my-project";
   String region = "us-central1";
   Cluster cluster = Cluster.newBuilder().build();
   Cluster response =
       clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
 }

Console

Geben Sie in der Google Cloud Console auf der Dataproc-Seite Cluster erstellen im Bereich „Standort“ eine Dataproc-Region an.

Nächste Schritte