Gestione di modelli e job

Durante il processo di addestramento e deployment dei modelli e per ottenere previsioni, e gestire le risorse su Google Cloud Platform. Questa pagina descrive come lavorare con modelli, versioni e job.

Denominazione delle risorse di AI Platform Prediction

Devi specificare un nome per ogni job che crei. Le regole per la denominazione sono coerenti in tutti e tre i tipi di risorse. Ogni nome:

  • Può contenere solo lettere, numeri e trattini bassi.
  • Fa distinzione tra maiuscole e minuscole.
  • Deve iniziare con una lettera.
  • Non deve contenere più di 128 caratteri.
  • Deve essere univoco all'interno del suo spazio dei nomi (il progetto per i modelli e i job, modello principale per le versioni).

Dovresti creare nomi facili da distinguere negli elenchi di risorse, come come log dei job. Ecco alcuni suggerimenti:

  • Assegna un nome a tutti i job per lo stesso modello utilizzando il nome del modello e un indice dei job (il parametro il timestamp in cui viene creato il job).
  • Assegna un nome ai modelli in modo che siano facilmente identificabili tramite il set di dati (census_wide_deep di solito è migliore di my_new_model, per esempio).
  • Le versioni sono migliori se sono facilmente leggibili. Invece di utilizzare un timestamp o un valore univoco simile, consigliamo di usare semplici indicatori di versione come v1.

Gestione dei modelli

Le risorse del tuo modello in AI Platform Prediction sono container logici per le singole implementazioni del modello di machine learning. Sono le più semplici le risorse con cui lavorare perché non hanno operazioni complesse o risorse da distribuire e gestire.

La tabella seguente riassume le operazioni del modello ed elenca le interfacce che che puoi utilizzare per eseguirle:

Operazione Interfacce Note
create projects.models.create
gcloud ai-platform models create
Crea modello nella AI Platform Prediction Modelli.
delete projects.models.delete

L'eliminazione di un modello operazione a lunga esecuzione.

Prima di poter eliminare il modello, non deve essere associata alcuna versione li annotino.

gcloud ai-platform models delete
Elimina nell'elenco Modelli o nella pagina Dettagli modello.
get projects.models.get

Le informazioni che ricevi vengono descritte nella sezione Riferimento risorsa Model.

gcloud ai-platform models describe
Dettagli modello (inseriscilo con un link dal Modelli dall'elenco di lettura.
list projects.models.list
gcloud ai-platform models list
Pagina Modelli di AI Platform Prediction.

Gestione delle versioni

Le versioni sono iterazioni specifiche dei tuoi modelli. Il nucleo di un modello è un SavedModel di TensorFlow.

La tabella seguente riassume le operazioni relative alla versione ed elenca le interfacce che puoi utilizzare per eseguirle

Operazione Interfacce Note
create projects.models.versions.create

La creazione di una versione comporta il deployment di un SavedModel in AI Platform Prediction. Consulta il deployment del modello Google Cloud per ulteriori informazioni.

gcloud ai-platform versions create
Crea versione in Dettagli modello pagina (inserisci con un link dal Modelli elenco predefinito).
delete projects.models.versions.delete

L'eliminazione di una versione è un'operazione a lunga esecuzione.

Non puoi eliminare la versione predefinita di un modello se non è l'unica una versione assegnata al modello.

gcloud ai-platform versions delete
Elimina nell'elenco Versioni sulla Pagina Dettagli modello.
get projects.models.versions.get

Le informazioni che ricevi vengono descritte nella sezione Riferimento risorsa Version.

gcloud ai-platform versions describe
Pagina Dettagli della versione (da un link nella sezione Elenco Versioni nella pagina Dettagli modello.
list projects.models.versions.list
gcloud ai-platform versions list
Elenco Versioni nella pagina Dettagli modello.
setDefault projects.models.versions.setDefault

Questo è l'unico modo per assegnare una nuova versione predefinita a un modello. dopo La prima è che la creazione di una versione non rende quella predefinita.

gcloud ai-platform versions set-default
Imposta come predefinita nell'elenco Versioni della Pagina Dettagli modello.

Gestione dei job

AI Platform Prediction supporta due tipi di job: addestramento e batch la previsione. I dettagli sono diversi, ma l'operazione di base è in modo analogo.

La tabella seguente riassume le operazioni del job ed elenca le interfacce che che puoi utilizzare per eseguirle:

Operazione Interfacce Note
create projects.jobs.create

La creazione di un job viene descritta in dettaglio nella addestramento e previsione batch guide.

gcloud ai-platform jobs submit training

gcloud ai-platform jobs submit prediction

Nessuna implementazione della console.
annulla projects.jobs.cancel

Annullamento di un job in esecuzione.

gcloud ai-platform jobs cancel

Annulla nella pagina Dettagli job.
get projects.jobs.get Le informazioni che ricevi sono descritte nel Jobsriferimento alla risorsa.

gcloud ai-platform jobs describe

Dettagli lavoro (inserisci con un link dal Offerte di lavoro elenco predefinito).
list projects.jobs.list Verranno visualizzati solo i job creati negli ultimi 90 giorni.

gcloud ai-platform jobs list

Job dall'elenco di lettura.

Gestione delle operazioni asincrone

La maggior parte delle operazioni di gestione delle risorse di AI Platform Prediction restituisce come il più rapidamente possibile e fornire una risposta completa. Tuttavia, ci sono due di operazioni asincrone che dovresti conoscere: job e per le operazioni a lunga esecuzione.

Quando avvii un'operazione asincrona, di solito vuoi sapere quando vengono completate. Il processo per ottenere lo stato è diverso per i job e per i job a lunga esecuzione operazioni:

Visualizzazione dello stato di un job

Puoi utilizzare projects.jobs.get per ottenere lo stato di un job. Questo metodo viene fornito anche gcloud ai-platform jobs describe e nella pagina Job del nella console Google Cloud. Indipendentemente da come viene visualizzato lo stato, le informazioni sono basate su membri del Risorsa job. Scoprirai Il job è completato quando Job.state nella risposta corrisponde a uno di questi valori:

  • SUCCEEDED
  • FAILED
  • CANCELLED

Recuperare lo stato di un'operazione a lunga esecuzione

AI Platform Prediction prevede tre operazioni a lunga esecuzione:

  • Creazione di una versione
  • Eliminazione di un modello
  • Eliminazione di una versione

Tra le operazioni che richiedono molto tempo, solo la creazione di una versione potrebbe richiedere molto tempo. L'eliminazione di modelli e versioni avviene in genere quasi in tempo reale.

Se crei una versione utilizzando Google Cloud CLI o la console Google Cloud, l'interfaccia ti informa automaticamente al termine dell'operazione. Se crei una versione con l'API, puoi monitorare stato dell'operazione:

  1. Ottieni il nome dell'operazione assegnato al servizio Operazione nella risposta alla tua chiamata a projects.models.versions.create. La chiave per il valore del nome è "name".

  2. Utilizza le funzionalità di projects.operations.get per verificare periodicamente lo stato dell'operazione.

    1. Utilizza il nome dell'operazione del primo passaggio per formare una stringa di nome del forma:

      'projects/my_project/operations/operation_name'
      

      Il messaggio di risposta contiene Operazione .

    2. Ottieni il valore della chiave "done". Si tratta di un indicatore booleano del completamento dell'operazione. È vero se l'operazione è completata.

  3. Al completamento, l'oggetto Operazione includerà una delle due chiavi:

    • Se l'operazione è riuscita, è presente la chiave "response". Il suo valore deve essere google.protobuf.Empty, poiché nessuna delle operazioni di lunga durata di Previsione di AI Platform ha oggetti di risposta.

    • La chiave "error" è presente in caso di errore. Il suo valore è un Stato .

Passaggi successivi