Regiões

O Google Cloud usa regiões subdivididas em zonas para definir a localização geográfica dos recursos físicos de computação. Ao executar um job no AI Platform Prediction, você especifica a região em que quer que ela seja executada.

O ideal é usar a região mais próxima do local onde você ou os usuários pretendidos se encontram. Veja a seguir as regiões disponíveis para cada serviço.

Regiões disponíveis

O AI Platform Prediction está disponível nas seguintes regiões:

Américas

Região Oregon
us-west1
Los Angeles
us-west2
Salt Lake City
us-west3
Iowa
us-central1
Carolina do Sul
us-east1
Norte da Virgínia
us-east4
Montreal
northamerica-northeast1
São Paulo
southamerica-east1
Previsão on-line (tipos de máquina legados MLS1)
Previsão on-line (tipos de máquinas N1)
Previsão em lote * * * * *

Europa

Região Londres
europe-west2
Bélgica
europe-west1
Países Baixos
europe-west4
Zurique
europe-west6
Frankfurt
europe-west3
Finlândia
europe-north1
Previsão on-line (tipos de máquina legados MLS1)
Previsão on-line (tipos de máquinas N1)
Previsão em lote * * * * *

Ásia-Pacífico

Região Mumbai
asia-south1
Singapura
asia-southeast1
Hong Kong
asia-east2
Taiwan
asia-east1
Tóquio
asia-northeast1
Osaka
asia-northeast2
Sydney
australia-southeast1
Seul
asia-northeast3
Previsão on-line (tipos de máquina legados MLS1)
Previsão on-line (tipos de máquinas N1)
Previsão em lote * * * * * * *

O Google Cloud também fornece regiões extras para produtos que não sejam a previsão da AI Platform.

Considerações sobre regiões

Recursos insuficientes

A demanda de GPUs e recursos de computação na região us-central1 é alta. Talvez você receba a mensagem de erro a seguir nos registros do job: Resources are insufficient in region: <region>. Please try a different region..

Para resolver esse erro, use uma região diferente ou tente novamente mais tarde.

Cloud Storage

  • Execute seu job do AI Platform Prediction na mesma região do bucket do Cloud Storage que você está usando para ler e gravar dados do job.

  • Use a classe de armazenamento padrão para todos os buckets do Cloud Storage que estiver usando para ler e gravar dados do seu job do AI Platform Prediction.

Previsão on-line

Como usar GPUs na previsão on-line

O uso de GPUs para previsão on-line está disponível apenas em regiões específicas, em endpoints regionais. Não é possível usar GPUs no endpoint global. A tabela a seguir lista todos os aceleradores disponíveis para previsão on-line, para cada endpoint regional:

Américas

Região Oregon
us-west1
Iowa
us-central1
Carolina do Sul
us-east1
Norte da Virgínia
us-east4
Montreal
northamerica-northeast1
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

Europa

Região Londres
europe-west2
Bélgica
europe-west1
Holanda
europe-west4
Frankfurt
europe-west3
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

Ásia-Pacífico

Região Singapura
asia-southeast1
Taiwan
asia-east1
Tóquio
asia-northeast1
Sydney
australia-southeast1
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

Previsão em lote

  • Para realizar a previsão em lote, você precisa usar o endpoint da API global, não um endpoint regional.

  • Só é possível implantar modelos e versões de modelo para previsão em lote nas seguintes regiões:

    • us-central1
    • us-east1
    • us-east4
    • europe-west1
    • asia-northeast1

    Para realizar a previsão em lote em outras regiões disponíveis, marcadas com asteriscos na tabela "Regiões disponíveis", é preciso usar um SavedModel do TensorFlow armazenado no Cloud Storage.

  • Para conseguir o melhor desempenho na previsão em lote, execute o job de previsão e armazene os dados de entrada e saída na mesma região, principalmente no caso de conjuntos de dados muito grandes.

  • Ao implantar um modelo para predição em lote, especifique a região padrão em que a predição será executada. Ao iniciar um job de previsão em lote, é possível especificar uma região para executar o job modificando a região padrão.

Como restringir locais dos recursos

Os administradores de políticas da organização podem restringir as regiões disponíveis para modelos e jobs de previsão em lote criando uma restrição de locais de recursos. Leia sobre como uma restrição de locais de recursos se aplica ao AI Platform Prediction.