Google Cloud utilizza le regioni, suddivise in zone, per definire la posizione geografica delle risorse di calcolo fisiche. Quando esegui un job su AI Platform Prediction, specifichi la regione in cui deve essere eseguito.
In genere è consigliabile utilizzare l'area geografica più vicina alla tua località fisica o alla località fisica degli utenti di destinazione, ma prendi nota delle regioni disponibili per ogni servizio, come indicato di seguito.
Aree geografiche disponibili
Il AI Platform Prediction è disponibile nelle seguenti regioni:
Americhe
Regione | Oregon us-west1 |
Los Angeles us-west2 |
Salt Lake City us-west3 |
Iowa us-central1 |
Carolina del Sud us-east1 |
N. Virginia us-east4 |
Montréal northamerica-northeast1 |
San Paolo southamerica-east1 |
---|---|---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||||
Previsione online (tipi di macchine N1) | ||||||||
Previsione batch | * | * | * | * | * |
Europa
Regione | Londra europe-west2 |
Belgio europe-west1 |
Paesi Bassi europe-west4 |
Zurigo europe-west6 |
Francoforte europe-west3 |
Finlandia europe-north1 |
---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||
Previsione online (tipi di macchine N1) | ||||||
Previsione batch | * | * | * | * | * |
Asia Pacifico
Regione | Mumbai asia-south1 |
Singapore asia-southeast1 |
Hong Kong asia-east2 |
Taiwan asia-east1 |
Tokyo asia-nord-est1 |
Osaka asia-northeast2 |
Sydney Australia-sud-est1 |
Seul asia-northeast3 |
---|---|---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||||
Previsione online (tipi di macchine N1) | ||||||||
Previsione batch | * | * | * | * | * | * | * |
Google Cloud fornisce inoltre regioni aggiuntive per prodotti diversi da AI Platform Prediction.
Considerazioni geografiche
Risorse insufficienti
La domanda è elevata per GPU e risorse di calcolo nella regione us-central1
.
Nei log del job potresti ricevere un messaggio di errore che dice: Resources are
insufficient in region: <region>. Please try a different region.
.
Per risolvere il problema, prova a utilizzare un'altra regione o riprova più tardi.
Cloud Storage
Esegui il job di AI Platform Prediction nella stessa regione del bucket Cloud Storage che utilizzi per leggere e scrivere i dati per il job.
Devi utilizzare la classe Standard Storage per qualsiasi bucket Cloud Storage usato per leggere e scrivere dati per il job di AI Platform Prediction.
Previsione online
Quando esegui il deployment di un modello per la previsione online, devi specificare la regione in cui eseguire la previsione. Indipendentemente dal fatto che tu interagisca con la previsione online tramite l'endpoint globale (
ml.googleapis.com
) o un endpoint a livello di regione (REGION-ml.googleapis.com
), le previsioni online vengono sempre fornite dalla regione predefinita specificata per il modello. L'utilizzo di un endpoint a livello di regione per la previsione online fornisce ulteriore protezione per il tuo modello contro le interruzioni in altre regioni, poiché isola le risorse del modello e della versione da altre regioni. Scopri di più sulle differenze tra l'uso di un endpoint a livello di regione e l'uso dell'endpoint globale.I tipi di macchine di Compute Engine (N1) per la previsione online sono disponibili solo sugli endpoint a livello di regione. I tipi di macchina di Compute Engine (N1) non sono disponibili quando si utilizza l'endpoint globale.
Utilizzo di GPU per la previsione online
L'utilizzo delle GPU per la previsione online è disponibile solo in regioni specifiche su endpoint a livello di regione. Non puoi utilizzare GPU sull'endpoint globale. La seguente tabella elenca tutti gli acceleratori disponibili per la previsione online, per ogni endpoint a livello di regione:
Americhe
Regione | Oregon us-west1 |
Iowa us-central1 |
Carolina del Sud us-east1 |
N. Virginia us-east4 |
Montréal northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
Europa
Regione | Londra europe-west2 |
Belgio europe-west1 |
Paesi Bassi europe-west4 |
Francoforte europe-west3 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Asia Pacifico
Regione | Singapore asia-southeast1 |
Taiwan asia-east1 |
Tokyo asia-nord-est1 |
Sydney Australia-sud-est1 |
---|---|---|---|---|
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Previsione batch
Per eseguire la previsione batch, devi utilizzare l'endpoint API globale, non un endpoint a livello di regione.
Puoi eseguire il deployment di modelli e versioni dei modelli per la previsione batch solo nelle seguenti regioni:
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
Per eseguire la previsione batch in altre regioni disponibili, contrassegnate con asterischi nella tabella Regioni disponibili, devi utilizzare un modello TensorFlow Salvato archiviato in Cloud Storage.
Per ottenere le migliori prestazioni nella previsione batch, devi eseguire il job di previsione e archiviare i dati di input e di output nella stessa regione, soprattutto per set di dati di grandi dimensioni.
Quando esegui il deployment di un modello per la previsione batch, specifichi la regione predefinita in cui vuoi che venga eseguita la previsione. Quando avvii un job di previsione batch, puoi specificare una regione in cui eseguire il job, sostituendo quella predefinita.
Limitazione delle località delle risorse
Gli amministratori dei criteri dell'organizzazione possono limitare le regioni disponibili per i modelli e i job di previsione batch creando un vincolo per le località delle risorse. Scopri di più su come un vincolo di località delle risorse si applica ad AI Platform Prediction