O Dataproc suporta pontos finais regionais com base nas regiões do Compute Engine. Tem de especificar uma região, como "us-east1" ou "europe-west1", quando cria um cluster do Dataproc. O Dataproc isola os recursos do cluster, como instâncias de VMs e armazenamento de metadados e do Cloud Storage, numa zona dentro da região especificada.
Opcionalmente, pode especificar uma zona na região do cluster especificada, como "us-east1-a" ou "europe-west1-b", quando cria um cluster. Se não especificar a zona, o posicionamento automático de zonas do Dataproc escolhe uma zona na região do cluster especificada para localizar recursos dos clusters.
O espaço de nomes regional corresponde ao segmento /regions/REGION
dos URIs de recursos do Dataproc (consulte, por exemplo, o
cluster
networkUri
).
Semântica do ponto final regional
Os nomes dos pontos finais regionais seguem uma convenção de nomenclatura padrão baseada nas
regiões do Compute Engine.
Por exemplo, o nome da região central dos EUA é us-central1
e o nome da região da Europa Ocidental é europe-west1
. Execute o comando gcloud compute regions list
para ver uma lista das regiões disponíveis.
Crie um cluster
gcloud
Quando cria um cluster, especifique uma região através da flag --region
obrigatória.
gcloud dataproc clusters create CLUSTER_NAME \ --region=REGION \ other args ...
API REST
Use o parâmetro de URL REGION
num pedido
clusters.create
para especificar a região do cluster.
gRPC
Defina o endereço de transporte do cliente para o ponto final regional usando o seguinte padrão:
REGION-dataproc.googleapis.com
Exemplo de Python (google-cloud-python):
from google.cloud import dataproc_v1
from google.cloud.dataproc_v1.gapic.transports import cluster_controller_grpc_transport
transport = cluster_controller_grpc_transport.ClusterControllerGrpcTransport(
address='us-central1-dataproc.googleapis.com:443')
client = dataproc_v1.ClusterControllerClient(transport)
project_id = 'my-project'
region = 'us-central1'
cluster = {...}
Exemplo de Java (google-cloud-java):
ClusterControllerSettings settings =
ClusterControllerSettings.newBuilder()
.setEndpoint("us-central1-dataproc.googleapis.com:443")
.build();
try (ClusterControllerClient clusterControllerClient = ClusterControllerClient.create(settings)) {
String projectId = "my-project";
String region = "us-central1";
Cluster cluster = Cluster.newBuilder().build();
Cluster response =
clusterControllerClient.createClusterAsync(projectId, region, cluster).get();
}
Consola
Especifique uma região do Dataproc na secção Localização do painel Configurar cluster na página Criar um cluster do Dataproc na Google Cloud consola.
O que se segue?
- Geografia e regiões
- Compute Engine→Regiões e zonas
- Compute Engine→Recursos globais, regionais e zonais
- Posicionamento automático de zonas do Dataproc