Google Cloud définit l'emplacement géographique des ressources de calcul physiques à l'aide de régions subdivisées en zones. Lorsque vous exécutez une tâche sur AI Platform Prediction, vous spécifiez la région dans laquelle vous souhaitez l'exécuter.
En règle générale, utilisez la région la plus proche de votre emplacement physique ou de celui des utilisateurs prévus, mais notez les régions disponibles pour chaque service, comme indiqué ci-dessous.
Régions disponibles
AI Platform Prediction est disponible dans les régions suivantes :
Amériques
Région | Oregon us-west1 |
Los Angeles us-west2 |
Salt Lake City us-west3 |
Iowa us-central1 |
Caroline du Sud us-east1 |
Virginie du Nord us-east4 |
Montréal northamerica-northeast1 |
São Paulo southamerica-east1 |
---|---|---|---|---|---|---|---|---|
Prédiction en ligne (anciens types de machines MLS1) | ||||||||
Prédiction en ligne (types de machines N1) | ||||||||
Prédiction par lot | * | * | * | * | * |
Europe
Région | Londres europe-west2 |
Belgique europe-west1 |
Pays-Bas europe-west4 |
Zurich europe-west6 |
Francfort ( europe-west3) |
Finlande europe-north1 |
---|---|---|---|---|---|---|
Prédiction en ligne (anciens types de machines MLS1) | ||||||
Prédiction en ligne (types de machines N1) | ||||||
Prédiction par lot | * | * | * | * | * |
Asie-Pacifique
Région | Mumbai asia-south1 |
Singapour asia-southeast1 |
Hong Kong asia-east2 |
Taïwan asia-east1 |
Tokyo asia-northeast1 |
Osaka asia-northeast2 |
Sydney australia-southeast1 |
Séoul asia-northeast3 |
---|---|---|---|---|---|---|---|---|
Prédiction en ligne (anciens types de machines MLS1) | ||||||||
Prédiction en ligne (types de machines N1) | ||||||||
Prédiction par lot | * | * | * | * | * | * | * |
Google Cloud fournit également des régions supplémentaires pour les produits autres que AI Platform Prediction.
Considérations relatives à la région
Ressources insuffisantes
La demande en GPU et ressources de calcul est importante dans la région us-central1
.
Il est possible que le message d'erreur suivant s'affiche dans les journaux de votre tâche : Resources are
insufficient in region: <region>. Please try a different region.
.
Pour contourner ce problème, essayez d’utiliser une autre région ou réessayez plus tard.
Cloud Storage
Vous devez exécuter votre tâche AI Platform Prediction dans la même région que le bucket Cloud Storage que vous utilisez pour lire et écrire les données associées à cette tâche.
Vous devez utiliser la classe de stockage standard pour tous les buckets Cloud Storage que vous utilisez pour lire et écrire des données de votre tâche AI Platform Prediction.
Prédiction en ligne
Lorsque vous déployez un modèle pour la prédiction en ligne, vous devez spécifier la région dans laquelle exécuter la prédiction. Que vous interagissiez avec la prédiction en ligne via le point de terminaison mondial (
ml.googleapis.com
) ou un point de terminaison régional (REGION-ml.googleapis.com
), les prédictions en ligne sont toujours diffusées à partir de la région par défaut spécifiée pour le modèle. L'utilisation d'un point de terminaison régional pour la prédiction en ligne offre une protection supplémentaire contre les interruptions dans d'autres régions, car il isole les ressources de modèle et de version des autres régions. En savoir plus sur les différences entre utiliser un point de terminaison régional et le point de terminaison mondial.Les types de machines Compute Engine (N1) pour la prédiction en ligne ne sont disponibles que sur les points de terminaison régionaux. Ils ne sont pas disponibles lorsque vous utilisez le point de terminaison mondial.
Utiliser des GPU pour la prédiction en ligne
L'utilisation de GPU pour la prédiction en ligne n'est disponible que dans des régions spécifiques, sur des points de terminaison régionaux. Vous ne pouvez pas utiliser de GPU sur le point de terminaison mondial. Le tableau suivant répertorie tous les accélérateurs disponibles pour la prédiction en ligne, pour chaque point de terminaison régional :
Amériques
Région | Oregon us-west1 |
Iowa us-central1 |
Caroline du Sud us-east1 |
Virginie du Nord us-east4 |
Montréal northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
Europe
Région | Londres europe-west2 |
Belgique europe-west1 |
Pays-Bas europe-west4 |
Francfort europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Asie-Pacifique
Région | Singapour asia-southeast1 |
Taïwan asia-east1 |
Tokyo asia-northeast1 |
Sydney australia-southeast1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Prédiction par lot
Pour effectuer une prédiction par lot, vous devez utiliser le point de terminaison mondial de l'API, et non un point de terminaison régional.
Vous ne pouvez déployer des modèles et des versions de modèle pour la prédiction par lot que dans les régions suivantes :
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
Pour effectuer une prédiction par lot dans d'autres régions disponibles, marquées d'un astérisque dans la table des régions disponibles, vous devez utiliser un modèle SavedModel TensorFlow stocké dans Cloud Storage.
Pour bénéficier de performances optimales de prédiction par lot, vous pouvez exécuter votre tâche de prédiction et stocker vos données d'entrée et de sortie dans la même région, en particulier pour les ensembles de données très volumineux.
Lorsque vous déployez un modèle pour la prédiction par lot, vous spécifiez la région par défaut dans laquelle exécuter la prédiction. Lorsque vous démarrez une tâche de prédiction par lot, vous pouvez spécifier une région dans laquelle exécuter la tâche, en remplaçant la région par défaut.
Limiter les emplacements de ressources
Les administrateurs de règles d'administration peuvent restreindre les régions disponibles pour les modèles et les tâches de prédiction par lot en créant une contrainte d'emplacement des ressources. Découvrez comment une contrainte d'emplacement des ressources s'applique à AI Platform Prediction.