O Google Cloud usa regiões subdivididas em zonas para definir a localização geográfica dos recursos físicos de computação. Ao executar um job no AI Platform Prediction, você especifica a região em que quer que ela seja executada.
O ideal é usar a região mais próxima do local onde você ou os usuários pretendidos se encontram. Veja a seguir as regiões disponíveis para cada serviço.
Regiões disponíveis
O AI Platform Prediction está disponível nas seguintes regiões:
Américas
Região | Oregon us-west1 |
Los Angeles us-west2 |
Salt Lake City us-west3 |
Iowa us-central1 |
Carolina do Sul us-east1 |
Norte da Virgínia us-east4 |
Montreal northamerica-northeast1 |
São Paulo southamerica-east1 |
---|---|---|---|---|---|---|---|---|
Previsão on-line (tipos de máquina legados MLS1) | ||||||||
Previsão on-line (tipos de máquinas N1) | ||||||||
Previsão em lote | * | * | * | * | * |
Europa
Região | Londres europe-west2 |
Bélgica europe-west1 |
Países Baixos europe-west4 |
Zurique europe-west6 |
Frankfurt europe-west3 |
Finlândia europe-north1 |
---|---|---|---|---|---|---|
Previsão on-line (tipos de máquina legados MLS1) | ||||||
Previsão on-line (tipos de máquinas N1) | ||||||
Previsão em lote | * | * | * | * | * |
Ásia-Pacífico
Região | Mumbai asia-south1 |
Singapura asia-southeast1 |
Hong Kong asia-east2 |
Taiwan asia-east1 |
Tóquio asia-northeast1 |
Osaka asia-northeast2 |
Sydney australia-southeast1 |
Seul asia-northeast3 |
---|---|---|---|---|---|---|---|---|
Previsão on-line (tipos de máquina legados MLS1) | ||||||||
Previsão on-line (tipos de máquinas N1) | ||||||||
Previsão em lote | * | * | * | * | * | * | * |
O Google Cloud também fornece regiões extras para produtos que não sejam a previsão da AI Platform.
Considerações sobre regiões
Recursos insuficientes
A demanda de GPUs e recursos de computação na região us-central1
é alta.
Talvez você receba a mensagem de erro a seguir nos registros do job: Resources are
insufficient in region: <region>. Please try a different region.
.
Para resolver esse erro, use uma região diferente ou tente novamente mais tarde.
Cloud Storage
Execute seu job do AI Platform Prediction na mesma região do bucket do Cloud Storage que você está usando para ler e gravar dados do job.
Use a classe de armazenamento padrão para todos os buckets do Cloud Storage que estiver usando para ler e gravar dados do seu job do AI Platform Prediction.
Previsão on-line
Ao implantar um modelo para previsão on-line, especifique a região em que você quer que ela seja executada. Independentemente de você interagir com a previsão on-line por meio do endpoint global (
ml.googleapis.com
) ou de um endpoint regional (REGION-ml.googleapis.com
), as previsões on-line são sempre exibidas na região padrão especificada para o modelo. Usar um endpoint regional para previsão on-line fornece proteção extra para seu modelo contra interrupções em outras regiões, porque isola seus recursos de modelo e versão de outras regiões. Saiba mais sobre as diferenças entre o uso de um endpoint regional e o uso do endpoint global.Os tipos de máquina N1 do Compute Engine para previsão on-line estão disponíveis somente em endpoints regionais. Os tipos de máquina N1 do Compute Engine não estão disponíveis quando você usa o endpoint global.
Como usar GPUs na previsão on-line
O uso de GPUs para previsão on-line está disponível apenas em regiões específicas, em endpoints regionais. Não é possível usar GPUs no endpoint global. A tabela a seguir lista todos os aceleradores disponíveis para previsão on-line, para cada endpoint regional:
Américas
Região | Oregon us-west1 |
Iowa us-central1 |
Carolina do Sul us-east1 |
Norte da Virgínia us-east4 |
Montreal northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
Europa
Região | Londres europe-west2 |
Bélgica europe-west1 |
Holanda europe-west4 |
Frankfurt europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Ásia-Pacífico
Região | Singapura asia-southeast1 |
Taiwan asia-east1 |
Tóquio asia-northeast1 |
Sydney australia-southeast1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Previsão em lote
Para realizar a previsão em lote, você precisa usar o endpoint da API global, não um endpoint regional.
Só é possível implantar modelos e versões de modelo para previsão em lote nas seguintes regiões:
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
Para realizar a previsão em lote em outras regiões disponíveis, marcadas com asteriscos na tabela "Regiões disponíveis", é preciso usar um SavedModel do TensorFlow armazenado no Cloud Storage.
Para conseguir o melhor desempenho na previsão em lote, execute o job de previsão e armazene os dados de entrada e saída na mesma região, principalmente no caso de conjuntos de dados muito grandes.
Ao implantar um modelo para predição em lote, especifique a região padrão em que a predição será executada. Ao iniciar um job de previsão em lote, é possível especificar uma região para executar o job modificando a região padrão.
Como restringir locais dos recursos
Os administradores de políticas da organização podem restringir as regiões disponíveis para modelos e jobs de previsão em lote criando uma restrição de locais de recursos. Leia sobre como uma restrição de locais de recursos se aplica ao AI Platform Prediction.