Esta versão legada do AI Platform Prediction está descontinuada e não estará mais disponível no Google Cloud após 31 de janeiro de 2025. Todos os modelos, metadados associados e implantações serão excluídos após 31 de janeiro de 2025. Migre seus recursos para a Vertex AI a fim de acessar novos recursos de machine learning que estão indisponíveis no AI Platform.

Regiões

O Google Cloud usa regiões subdivididas em zonas para definir a localização geográfica dos recursos físicos de computação. Ao executar um job no AI Platform Prediction, você especifica a região em que quer que ela seja executada.

O ideal é usar a região mais próxima do local onde você ou os usuários pretendidos se encontram. Veja a seguir as regiões disponíveis para cada serviço.

Regiões disponíveis

O AI Platform Prediction está disponível nas seguintes regiões:

Américas

Região	Oregon us-west1	Los Angeles us-west2	Salt Lake City us-west3	Montreal northamerica-northeast1	São Paulo southamerica-east1
Previsão on-line (tipos de máquina legados MLS1)
Previsão on-line (tipos de máquinas N1)
Previsão em lote	*	*	*	*	*

Europa

Região	Londres europe-west2	Países Baixos europe-west4	Zurique europe-west6	Frankfurt europe-west3	Finlândia europe-north1
Previsão on-line (tipos de máquina legados MLS1)
Previsão on-line (tipos de máquinas N1)
Previsão em lote	*	*	*	*	*

Ásia-Pacífico

Região	Mumbai asia-south1	Singapura asia-southeast1	Hong Kong asia-east2	Taiwan asia-east1	Osaka asia-northeast2	Sydney australia-southeast1	Seul asia-northeast3
Previsão on-line (tipos de máquina legados MLS1)
Previsão on-line (tipos de máquinas N1)
Previsão em lote	*	*	*	*	*	*	*

O Google Cloud também fornece regiões extras para produtos que não sejam a previsão da AI Platform.

Considerações sobre regiões

Recursos insuficientes

A demanda de GPUs e recursos de computação na região us-central1 é alta. Talvez você receba a mensagem de erro a seguir nos registros do job: Resources are insufficient in region: <region>. Please try a different region..

Para resolver esse erro, use uma região diferente ou tente novamente mais tarde.

Cloud Storage

Execute seu job do AI Platform Prediction na mesma região do bucket do Cloud Storage que você está usando para ler e gravar dados do job.
Use a classe de armazenamento padrão para todos os buckets do Cloud Storage que estiver usando para ler e gravar dados do seu job do AI Platform Prediction.

Previsão on-line

Ao implantar um modelo para previsão on-line, especifique a região em que você quer que ela seja executada. Independentemente de você interagir com a previsão on-line por meio do endpoint global (ml.googleapis.com) ou de um endpoint regional (REGION-ml.googleapis.com), as previsões on-line são sempre exibidas na região padrão especificada para o modelo. Usar um endpoint regional para previsão on-line fornece proteção extra para seu modelo contra interrupções em outras regiões, porque isola seus recursos de modelo e versão de outras regiões. Saiba mais sobre as diferenças entre o uso de um endpoint regional e o uso do endpoint global.
Os tipos de máquina N1 do Compute Engine para previsão on-line estão disponíveis somente em endpoints regionais. Os tipos de máquina N1 do Compute Engine não estão disponíveis quando você usa o endpoint global.

Como usar GPUs na previsão on-line

O uso de GPUs para previsão on-line está disponível apenas em regiões específicas, em endpoints regionais. Não é possível usar GPUs no endpoint global. A tabela a seguir lista todos os aceleradores disponíveis para previsão on-line, para cada endpoint regional:

Américas

Região	Oregon us-west1	Iowa us-central1	Carolina do Sul us-east1	Norte da Virgínia us-east4	Montreal northamerica-northeast1
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

Europa

Região	Londres europe-west2	Bélgica europe-west1	Holanda europe-west4	Frankfurt europe-west3
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

Ásia-Pacífico

Região	Singapura asia-southeast1	Taiwan asia-east1	Tóquio asia-northeast1	Sydney australia-southeast1
NVIDIA Tesla K80
NVIDIA Tesla P4
NVIDIA Tesla P100
NVIDIA Tesla T4
NVIDIA Tesla V100

Previsão em lote

Para realizar a previsão em lote, você precisa usar o endpoint da API global, não um endpoint regional.
Só é possível implantar modelos e versões de modelo para previsão em lote nas seguintes regiões:
- us-central1
- us-east1
- us-east4
- europe-west1
- asia-northeast1
Para realizar a previsão em lote em outras regiões disponíveis, marcadas com asteriscos na tabela "Regiões disponíveis", é preciso usar um SavedModel do TensorFlow armazenado no Cloud Storage.
Para conseguir o melhor desempenho na previsão em lote, execute o job de previsão e armazene os dados de entrada e saída na mesma região, principalmente no caso de conjuntos de dados muito grandes.
Ao implantar um modelo para predição em lote, especifique a região padrão em que a predição será executada. Ao iniciar um job de previsão em lote, é possível especificar uma região para executar o job modificando a região padrão.

Como restringir locais dos recursos

Os administradores de políticas da organização podem restringir as regiões disponíveis para modelos e jobs de previsão em lote criando uma restrição de locais de recursos. Leia sobre como uma restrição de locais de recursos se aplica ao AI Platform Prediction.