Google Cloud usa regiones, subdivididas en zonas, para definir la ubicación geográfica de los recursos de procesamiento físicos. Cuando ejecutas un trabajo en AI Platform Prediction, debes especificar la región en la que deseas que se ejecute.
Por lo general, debes usar la región más cercana a tu ubicación física o a la ubicación física de los usuarios previstos, pero ten en cuenta las regiones disponibles para cada servicio que se indican a continuación.
Regiones disponibles
AI Platform Prediction está disponible en las siguientes regiones:
América
Región | Oregón us-west1 |
Los Ángeles us-west2 |
Salt Lake City us-west3 |
Iowa us-central1 |
Carolina del Sur us-east1 |
Virginia del Norte us-east4 |
Montreal northamerica-northeast1 |
São Paulo southamerica-east1 |
---|---|---|---|---|---|---|---|---|
Predicción en línea (tipos de máquinas MLS1 heredados) | ||||||||
Predicción en línea (tipos de máquinas N1) | ||||||||
Predicción por lotes | * | * | * | * | * |
Europa
Región | Londres europe-west2 |
Bélgica europe-west1 |
Países Bajos europe-west4 |
Zúrich europe-west6 |
Fráncfort europe-west3 |
Finlandia europe-north1 |
---|---|---|---|---|---|---|
Predicción en línea (tipos de máquinas MLS1 heredados) | ||||||
Predicción en línea (tipos de máquinas N1) | ||||||
Predicción por lotes | * | * | * | * | * |
Asia-Pacífico
Región | Bombay asia-south1 |
Singapur asia-southeast1 |
Hong Kong asia-east2 |
Taiwán asia-east1 |
Tokio asia-northeast1 |
Osaka asia-northeast2 |
Sídney australia-southeast1 |
Seúl asia-northeast3 |
---|---|---|---|---|---|---|---|---|
Predicción en línea (tipos de máquinas MLS1 heredados) | ||||||||
Predicción en línea (tipos de máquinas N1) | ||||||||
Predicción por lotes | * | * | * | * | * | * | * |
Google Cloud también proporciona regiones adicionales para productos distintos de AI Platform Prediction.
Consideraciones sobre la región
Recursos insuficientes
La demanda es alta para las GPU y los recursos de procesamiento en la región us-central1
.
Es posible que obtengas un mensaje de error en tus registros de trabajo que diga: Resources are
insufficient in region: <region>. Please try a different region.
.
Para resolver esto, prueba usar una región diferente o vuelve a intentar más tarde.
Cloud Storage
Debes ejecutar tu trabajo de AI Platform Prediction en la misma región del depósito de Cloud Storage que usas con el fin de leer y escribir datos para el trabajo.
Deberías usar la clase Standard Storage para cualquier depósito de Cloud Storage que uses a fin de leer y escribir datos destinados al trabajo de AI Platform Prediction.
Predicción en línea
Cuando implementas un modelo para la predicción en línea, especifica la región en la que deseas que se ejecute la predicción. Ya sea que interactúes con la predicción en línea a través del extremo global (
ml.googleapis.com
) o un extremo regional (REGION-ml.googleapis.com
), las predicciones en línea siempre se entregan desde la región predeterminada que se especificó para el modelo. Usar un extremo regional en la predicción en línea proporciona protección adicional para el modelo frente a interrupciones en otras regiones, ya que aísla los recursos del modelo y de la versión de otras regiones. Obtén más información sobre las diferencias entre usar un extremo regional y un extremo global.Los tipos de máquina (N1) de Compute Engine para la predicción en línea solo están disponibles en los extremos regionales. Los tipos de máquina (N1) de Compute Engine no están disponibles cuando usas el extremo global.
Usa GPU para la predicción en línea
El uso de las GPU para la predicción en línea solo está disponible en regiones específicas, en los extremos regionales. No puedes usar las GPU en el extremo global. En la siguiente tabla, se enumeran todos los aceleradores disponibles para la predicción en línea de cada extremo regional:
América
Región | Oregón us-west1 |
Iowa us-central1 |
Carolina del Sur us-east1 |
Virginia del Norte us-east4 |
Montreal northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
Europa
Región | Londres europe-west2 |
Bélgica europe-west1 |
Países Bajos europe-west4 |
Fráncfort europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Asia-Pacífico
Región | Singapur asia-southeast1 |
Taiwán asia-east1 |
Tokio asia-northeast1 |
Sídney australia-southeast1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Predicción por lotes
Para realizar una predicción por lotes, debes usar el extremo de API global, no un extremo regional.
Solo puedes implementar modelos y versiones de modelos para la predicción por lotes en las siguientes regiones:
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
Para realizar predicciones por lotes en otras regiones disponibles, marcadas con asteriscos en la tabla de regiones disponibles, debes usar un modelo guardado de TensorFlow almacenado en Cloud Storage.
Si quieres obtener el mejor rendimiento en la predicción por lotes, debes ejecutar el trabajo de predicción y almacenar tus datos de entrada y salida en la misma región, en especial, para conjuntos de datos muy grandes.
Cuando implementas un modelo para la predicción por lotes, especifica la región predeterminada en la que deseas que se ejecute la predicción. Cuando comienzas un trabajo de predicción por lotes, puedes especificar una región en la que ejecutar el trabajo, lo que anula la región predeterminada.
Restringir las ubicaciones de recursos
Los administradores de políticas de la organización pueden restringir las regiones disponibles para trabajos de predicción por lotes y modelos mediante la creación de una restricción de ubicaciones de recursos. Obtén información sobre Cómo una restricción de ubicaciones de recursos se aplica a AI Platform Prediction