Google Cloud utilizza le regioni, suddivise in zone, per definire la posizione geografica delle risorse di calcolo fisiche. Quando esegui un job su AI Platform Prediction, specifichi la regione in cui vuoi che venga eseguito.
In genere è consigliabile utilizzare l'area geografica più vicina alla tua posizione fisica o alla località fisica degli utenti di destinazione, ma tieni presente le regioni disponibili per ogni servizio, come indicato di seguito.
Aree geografiche disponibili
AI Platform Prediction è disponibile nelle seguenti regioni:
Americhe
Regione | Oregon us-west1 |
Los Angeles us-west2 |
Salt Lake City us-west3 |
Iowa us-central1 |
Carolina del Sud us-east1 |
N. Virginia us-east4 |
Montréal northamerica-northeast1 |
San Paolo sudamerica-east1 |
---|---|---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||||
Previsione online (tipi di macchina N1) | ||||||||
Previsione batch | * | * | * | * | * |
Europa
Regione | Londra europe-west2 |
Belgio europe-west1 |
Paesi Bassi europe-west4 |
Zurigo europe-west6 |
Francoforte europe-west3 |
Finlandia europe-north1 |
---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||
Previsione online (tipi di macchina N1) | ||||||
Previsione batch | * | * | * | * | * |
Asia Pacifico
Regione | Mumbai asia-sud1 |
Singapore asia-sud-est1 |
Hong Kong asia-east2 |
Taiwan asia-orientale1 |
Tokyo asia-nord-est1 |
Osaka asia-northeast2 |
Sydney australia-sud-est1 |
Seul asia-northeast3 |
---|---|---|---|---|---|---|---|---|
Previsione online (tipi di macchine MLS1 legacy) | ||||||||
Previsione online (tipi di macchina N1) | ||||||||
Previsione batch | * | * | * | * | * | * | * |
Google Cloud fornisce inoltre regioni aggiuntive per prodotti diversi dal AI Platform Prediction.
Considerazioni sulle regioni
Risorse insufficienti
La domanda è elevata per GPU e risorse di calcolo nella regione us-central1
.
Nei log del job potrebbe essere visualizzato un messaggio di errore che indica: Resources are
insufficient in region: <region>. Please try a different region.
.
Per risolvere il problema, prova a utilizzare un'altra regione o riprova più tardi.
Cloud Storage
Devi eseguire il job di AI Platform Prediction nella stessa regione del bucket Cloud Storage che stai utilizzando per leggere e scrivere i dati per il job.
Devi utilizzare la classe Standard Storage per tutti i bucket Cloud Storage che usi per leggere e scrivere dati per il job di AI Platform Prediction.
Previsione online
Quando esegui il deployment di un modello per la previsione online, specifichi la regione in cui vuoi eseguire la previsione. Sia che tu interagisca con la previsione online tramite l'endpoint globale (
ml.googleapis.com
) o un endpoint a livello di regione (REGION-ml.googleapis.com
), le previsioni online vengono sempre pubblicate dalla regione predefinita specificata per il modello. L'utilizzo di un endpoint a livello di regione per la previsione online fornisce ulteriore protezione per il tuo modello contro le interruzioni in altre regioni, poiché isola le risorse del modello e della versione da altre regioni. Scopri di più sulle differenze tra l'uso di un endpoint a livello di regione e l'utilizzo dell'endpoint globale.I tipi di macchine di Compute Engine (N1) per la previsione online sono disponibili solo sugli endpoint a livello di regione. I tipi di macchina di Compute Engine (N1) non sono disponibili quando utilizzi l'endpoint globale.
Utilizzo di GPU per la previsione online
L'utilizzo delle GPU per la previsione online è disponibile solo in aree geografiche specifiche, su endpoint a livello di regione. Non puoi utilizzare GPU sull'endpoint globale. La tabella seguente elenca tutti gli acceleratori disponibili per la previsione online, per ogni endpoint a livello di regione:
Americhe
Regione | Oregon us-west1 |
Iowa us-central1 |
Carolina del Sud us-east1 |
N. Virginia us-east4 |
Montréal northamerica-northeast1 |
---|---|---|---|---|---|
NVIDIA Tesla K80 | |||||
NVIDIA Tesla P4 | |||||
NVIDIA Tesla P100 | |||||
NVIDIA Tesla T4 | |||||
NVIDIA Tesla V100 |
Europa
Regione | Londra europe-west2 |
Belgio europe-west1 |
Paesi Bassi europe-west4 |
Francoforte europe-west3 |
---|---|---|---|---|
NVIDIA Tesla K80 | ||||
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Asia Pacifico
Regione | Singapore asia-sud-est1 |
Taiwan asia-orientale1 |
Tokyo asia-nord-est1 |
Sydney australia-sud-est1 |
---|---|---|---|---|
NVIDIA Tesla K80 | ||||
NVIDIA Tesla P4 | ||||
NVIDIA Tesla P100 | ||||
NVIDIA Tesla T4 | ||||
NVIDIA Tesla V100 |
Previsione batch
Per eseguire la previsione batch, devi utilizzare l'endpoint API globale, non un endpoint a livello di regione.
Puoi eseguire il deployment di modelli e versioni del modello per la previsione batch solo nelle seguenti regioni:
us-central1
us-east1
us-east4
europe-west1
asia-northeast1
Per eseguire la previsione batch in altre regioni disponibili, contrassegnate con asterischi nella tabella Regioni disponibili, devi utilizzare un TensorFlow saveModel archiviato in Cloud Storage.
Per ottenere le migliori prestazioni nella previsione batch, devi eseguire il job di previsione e archiviare i dati di input e di output nella stessa regione, soprattutto nel caso di set di dati di grandi dimensioni.
Quando esegui il deployment di un modello per la previsione batch, specifichi la regione predefinita in cui vuoi che venga eseguita la previsione. Quando avvii un job di previsione batch, puoi specificare una regione in cui eseguire il job, sostituendo la regione predefinita.
Limitazione delle località delle risorse
Gli amministratori dei criteri dell'organizzazione possono limitare le regioni disponibili per i modelli e i job di previsione batch creando un vincolo delle località delle risorse. Scopri come si applica un vincolo delle località delle risorse ad AI Platform Prediction