Introduzione all'addestramento personalizzato: addestramento di un modello di classificazione delle immagini personalizzato

Questa pagina mostra come eseguire un'applicazione di addestramento TensorFlow Keras Vertex AI. Questo modello specifico addestra un modello di classificazione delle immagini in grado di classificare i fiori in base al tipo.

Questo tutorial è composto da varie pagine:

  1. Configurare il progetto e l'ambiente.

  2. Addestramento di un modello di classificazione delle immagini personalizzato.

  3. Pubblicazione di previsioni da una classificazione delle immagini personalizzata modello.

  4. È in corso la pulizia del progetto.

Per ogni pagina si presuppone che tu abbia già eseguito le istruzioni dalla pagine precedenti del tutorial.

La parte restante di questo documento presuppone che tu stia utilizzando lo stesso Cloud Shell creato quando hai seguito la prima pagina di questo di Google Cloud. Se la sessione Cloud Shell originale non è più aperta, puoi tornare all'ambiente nel seguente modo:

  1. In the Google Cloud console, activate Cloud Shell.

    Activate Cloud Shell

  2. Nella sessione di Cloud Shell, esegui questo comando:

    cd hello-custom-sample

Eseguire una pipeline di addestramento personalizzata

Questa sezione descrive l'utilizzo del pacchetto di addestramento che hai caricato su Cloud Storage per eseguire una pipeline di addestramento personalizzato Vertex AI.

  1. Nella console Google Cloud, nella sezione Vertex AI, vai alla pagina Pipeline di addestramento.

    Vai a Pipeline di addestramento

  2. Fai clic su Crea per aprire il riquadro Addestra nuovo modello.

  3. Nel passaggio Scegli il metodo di addestramento, svolgi i seguenti passaggi:

    1. Nell'elenco a discesa Set di dati, seleziona Nessun set di dati gestito. Questa particolareggiata applicazione di addestramento carica i dati dalla libreria TensorFlow Datasets anziché da un set di dati Vertex AI gestito.

    2. Assicurati che sia selezionata l'opzione Addestramento personalizzato (avanzato).

    Fai clic su Continua.

  4. Nel passaggio Dettagli del modello, inserisci hello_custom nel campo Nome. Fai clic su Continua.

  5. Nel passaggio Container di addestramento, fornisci a Vertex AI le informazioni di cui ha bisogno per utilizzare il pacchetto di addestramento che hai caricato su Cloud Storage:

    1. Seleziona Container predefinito.

    2. Nell'elenco a discesa Framework modello, seleziona TensorFlow.

    3. Nell'elenco a discesa Versione framework modello, seleziona 2.3.

    4. Nel campo Località pacchetto, inserisci cloud-samples-data/ai-platform/hello-custom/hello-custom-sample-v1.tar.gz.

    5. Nel campo Modulo Python, inserisci trainer.task. trainer è il nome del pacchetto Python nel file tarball e task.py contiene il codice di addestramento. Pertanto, trainer.task è il nome del modulo che vuoi che Vertex AI esegua.

    6. Nel campo Directory di output del modello, fai clic su Sfoglia. Nel riquadro Seleziona cartella, procedi nel seguente modo:

      1. Vai al bucket Cloud Storage.

      2. Fai clic su Crea nuova cartella .

      3. Assegna alla nuova cartella il nome output. Quindi, fai clic su Crea.

      4. Fai clic su Seleziona.

      Conferma che il campo contenga il valore gs://BUCKET_NAME/output, dove BUCKET_NAME è il nome del tuo bucket Cloud Storage.

      Questo valore viene passato a Vertex AI nel campo baseOutputDirectory API, che imposta diverse variabili di ambiente a cui può accedere la tua applicazione di addestramento quando viene eseguita.

      Ad esempio, quando imposti questo campo su gs://BUCKET_NAME/output, Vertex AI imposta la variabile di ambiente AIP_MODEL_DIR su gs://BUCKET_NAME/output/model. Al termine dell'addestramento, Vertex AI utilizza qualsiasi artefatto nella directory AIP_MODEL_DIR per creare una risorsa del modello.

      Scopri di più sulle variabili di ambiente impostate da questo campo.

    Fai clic su Continua.

  6. Nel passaggio facoltativo Iperparametri, assicurati che la casella di controllo Abilita La casella di controllo Ottimizzazione degli iperparametri è deselezionata. Questo tutorial non utilizza dell'ottimizzazione degli iperparametri. Fai clic su Continua.

  7. Nel passaggio Compute e prezzi, alloca le risorse per un job di addestramento:

    1. Nell'elenco a discesa Regione, seleziona us-central1 (Iowa)

    2. Nell'elenco a discesa Tipo di macchina, seleziona n1-standard-4 dall'elenco Sezione Standard.

    Non aggiungere acceleratori o pool di worker per questo tutorial. Fai clic su Continua.

  8. Nel passaggio Contenitore di previsione, fornisci a Vertex AI le informazioni di cui ha bisogno per fornire le previsioni:

    1. Seleziona Container predefinito.

    2. Nella sezione Impostazioni del contenitore precompilato, segui questi passaggi:

      1. Nell'elenco a discesa Framework modello, seleziona TensorFlow.

      2. Nell'elenco a discesa Versione framework modello, seleziona 2.3.

      3. Nell'elenco a discesa Tipo di acceleratore, seleziona Nessuno.

      4. Verifica che il campo Model directory (Directory del modello) abbia il valore gs://BUCKET_NAME/output, dove BUCKET_NAME è il nome del tuo bucket Cloud Storage. Ciò corrisponde al valore della directory di output del modello che hai fornita in un passaggio precedente.

    3. Lascia vuoti i campi della sezione Schema di previsione.

  9. Fai clic su Inizia addestramento per avviare la pipeline di addestramento personalizzato.

Ora puoi visualizzare la tua nuova pipeline di addestramento, denominata hello_custom, su nella pagina Addestramento. Potrebbe essere necessario aggiornare la pagina. La formazione pipeline esegue due operazioni principali:

  1. La pipeline di addestramento crea una risorsa job personalizzato denominata hello_custom-custom-job. Dopo alcuni istanti, puoi visualizzare questa risorsa nella pagina Job personalizzati della sezione Addestramento:

    Vai a Job personalizzati

    Il job personalizzato esegue l'applicazione di addestramento utilizzando le risorse di calcolo specificate in questa sezione.

  2. Al termine del job personalizzato, la pipeline di addestramento trova gli artefatti che l'applicazione di addestramento crea nella directory output/model/ del tuo bucket Cloud Storage. Utilizza questi elementi per creare una risorsa modello.

Monitorare la formazione

Per visualizzare i log di addestramento:

  1. Nella sezione Vertex AI della console Google Cloud, vai alla pagina Job personalizzati.

    Vai a Job personalizzati

  2. Per visualizzare i dettagli del CustomJob che hai appena creato, fai clic su hello_custom-custom-job nell'elenco.

  3. Nella pagina dei dettagli del job, fai clic su Visualizza log.

Visualizzare il modello addestrato

Al termine della pipeline di addestramento personalizzato, puoi trovare il modello addestrato nella console Google Cloud, nella sezione Vertex AI, nella pagina Modelli.

Vai a Modelli

Il modello ha il nome hello_custom.

Passaggi successivi

Vai alla pagina successiva di questo tutorial per fornire le previsioni del modello ML addestrato.