Durante il processo di addestramento e di deployment dei modelli e di generazione di previsioni, devi gestire le risorse sulla Google Cloud Platform. Questa pagina descrive come lavorare con modelli, versioni e job.
Denominazione delle risorse di AI Platform Prediction
Devi specificare un nome per ogni job creato. Le regole per la denominazione sono coerenti per tutti e tre i tipi di risorse. Ogni nome:
- Può contenere solo lettere, numeri e trattini bassi.
- È sensibile alle maiuscole.
- Deve iniziare con una lettera.
- Non deve contenere più di 128 caratteri.
- Deve essere univoco all'interno del relativo spazio dei nomi (il progetto per i modelli e i job, il modello principale per le versioni).
Devi creare nomi facili da distinguere negli elenchi di risorse, come i log dei job. Ecco alcuni suggerimenti:
- Assegna un nome a tutti i job per lo stesso modello utilizzando il nome del modello e un indice job (il timestamp della creazione del job funziona bene).
- Assegna ai modelli un nome in modo che siano facilmente identificabili dal set di dati che utilizzano (ad esempio,
census_wide_deep
è in genere migliore dimy_new_model
). - Le versioni sono ideali se sono facilmente leggibili. Anziché utilizzare un timestamp o un valore univoco simile, ti consigliamo di utilizzare semplici indicatori di versione come
v1
.
Gestione dei modelli
Le risorse del modello in AI Platform Prediction sono contenitori logici per le singole implementazioni del modello di machine learning. Sono le risorse più semplici con cui lavorare perché non hanno operazioni complesse o risorse aggiuntive da allocare e gestire.
La tabella seguente riassume le operazioni del modello ed elenca le interfacce che puoi utilizzare per eseguirle:
Operazione | Interfacce | Note |
---|---|---|
create |
projects.models.create
|
|
gcloud
ai-platform models create
|
||
Crea modello nella pagina Modelli di Previsione di AI Platform. | ||
delete |
projects.models.delete
|
L'eliminazione di un modello è un'operazione che richiede molto tempo. Il modello non deve avere versioni associate prima di poterlo eliminare. |
gcloud
ai-platform models delete
|
||
Elimina nell'elenco Modelli o nella pagina Dettagli modello. | ||
get |
projects.models.get
|
Le informazioni che ricevi sono descritte nel
|
gcloud
ai-platform models describe
|
||
Pagina Dettagli del modello (accedi tramite un link dall'elenco Modelli. | ||
list |
projects.models.list
|
|
gcloud
ai-platform models list
|
||
Pagina Modelli di AI Platform Prediction. |
Gestione delle versioni
Le versioni sono iterazioni specifiche dei modelli. Il nucleo di una versione del modello è un SavedModel di TensorFlow.
La tabella seguente riassume le operazioni sulle versioni ed elenca le interfacce che puoi utilizzare per eseguirle:
Operazione | Interfacce | Note |
---|---|---|
create |
projects.models.versions.create
|
La creazione di una versione comporta il deployment di un SavedModel in AI Platform Prediction. Per ulteriori informazioni, consulta la guida al deployment del modello. |
gcloud
ai-platform versions create
|
||
Crea versione nella pagina Dettagli del modello (accedi con un link dall'elenco Modelli). | ||
delete |
projects.models.versions.delete
|
L'eliminazione di una versione è un'operazione a lunga esecuzione. Non puoi eliminare la versione predefinita di un modello, a meno che non sia l'unica versione assegnata al modello. |
gcloud
ai-platform versions delete
|
||
Elimina nell'elenco Versioni della pagina Dettagli modello. | ||
get |
projects.models.versions.get
|
Le informazioni che ricevi sono descritte nel
|
gcloud
ai-platform versions describe
|
||
Pagina Dettagli della versione (da un link nell'elenco Versioni nella pagina Dettagli del modello. | ||
list |
projects.models.versions.list
|
|
gcloud
ai-platform versions list
|
||
Elenco Versioni nella pagina Dettagli del modello. | ||
setDefault |
projects.models.versions.setDefault
|
Questo è l'unico modo per assegnare una nuova versione predefinita per un modello. Dopo la prima, la creazione di una versione non rende la nuova versione predefinita. |
gcloud
ai-platform versions set-default
|
||
Imposta come predefinito nell'elenco Versioni della pagina Dettagli modello. |
Gestione dei job
AI Platform Prediction supporta due tipi di job: addestramento e previsione batch. I dettagli di ciascuno sono diversi, ma l'operazione di base è la stessa.
La seguente tabella riassume le operazioni dei job ed elenca le interfacce che puoi utilizzare per eseguirle:
Operazione | Interfacce | Note |
---|---|---|
create |
projects.jobs.create
|
La creazione di un job è descritta in dettaglio nelle guide sull'addestramento e sulla previsione batch. |
Nessuna implementazione della console. | ||
annulla |
projects.jobs.cancel
|
Annullamento di un job in esecuzione. |
Annulla nella pagina Dettagli job. | ||
get |
projects.jobs.get
|
Le informazioni che ricevi sono descritte nel
Jobs riferimento alla risorsa.
|
Pagina Dettagli job (da inserire con un link dall'elenco di job). | ||
list |
projects.jobs.list
|
Verranno visualizzati solo i job creati negli ultimi 90 giorni. |
Elenco di offerte di lavoro. |
Gestione delle operazioni asincrone
La maggior parte delle operazioni di gestione delle risorse di AI Platform Prediction restituisce il risultato il più rapidamente possibile e fornisce una risposta completa. Tuttavia, esistono due tipi di operazioni asincrone che devi conoscere: job e operazioni a lungo termine.
Quando avvii un'operazione asincrona, in genere vuoi sapere quando viene completata. La procedura per ottenere lo stato è diversa per i job e le operazioni di lunga durata:
Visualizzazione dello stato di un job
Puoi utilizzare projects.jobs.get per recuperare lo stato di un job. Questo metodo è fornito anche come
gcloud ai-platform jobs describe
e nella pagina Job della console
Google Cloud . Indipendentemente da come ottieni lo stato, le informazioni si basano sui membri della risorsa job. Saprai che il compito è stato completato quando Job.state
nella risposta è uguale a uno di questi valori:
SUCCEEDED
FAILED
CANCELLED
Visualizzazione dello stato di un'operazione a lunga esecuzione
AI Platform Prediction dispone di tre operazioni di lunga durata:
- Creazione di una versione
- Eliminazione di un modello
- Eliminazione di una versione
Tra le operazioni che richiedono molto tempo, solo la creazione di una versione potrebbe richiedere molto tempo. L'eliminazione di modelli e versioni viene in genere eseguita in quasi tempo reale.
Se crei una versione utilizzando Google Cloud CLI o la consoleGoogle Cloud , l'interfaccia ti informa automaticamente al termine dell'operazione. Se crei una versione con l'API, puoi monitorare autonomamente lo stato dell'operazione:
Recupera il nome dell'operazione assegnato dal servizio dall'oggetto Operation nella risposta alla chiamata a projects.models.versions.create. La chiave per il valore del nome è
"name"
.Utilizza projects.operations.get per eseguire periodicamente il polling dello stato dell'operazione.
Utilizza il nome dell'operazione del primo passaggio per formare una stringa di nome del forma:
'projects/my_project/operations/operation_name'
Il messaggio di risposta contiene un oggetto Operation.
Ottieni il valore per la chiave
"done"
. Si tratta di un indicatore booleano del completamento dell'operazione. È true se l'operazione è completata.
Al termine, l'oggetto Operation includerà una delle due chiavi:
La chiave
"response"
è presente se l'operazione è andata a buon fine. Il suo valore deve essere google.protobuf.Empty, poiché nessuna delle operazioni di lunga durata di AI Platform Prediction ha oggetti di risposta.La chiave
"error"
è presente se si è verificato un errore. Il suo valore è un oggetto Status.
Passaggi successivi
- Addestra un modello.
- Scopri come utilizzare le etichette per organizzare le tue risorse.