Ciao dati tabulari: crea un set di dati e addestra un modello di classificazione AutoML

Utilizza la console Google Cloud per creare un set di dati tabulare e addestrare un modello di classificazione.

Crea un set di dati tabulare

  1. Nella console Google Cloud, nella sezione Vertex AI, vai alla pagina Set di dati.

    Vai alla pagina Set di dati

  2. Fai clic su Crea nella barra dei pulsanti per creare un nuovo set di dati.

  3. Inserisci Structured_AutoML_Tutorial per il nome del set di dati e seleziona la scheda Tabellare.

  4. Seleziona l'obiettivo Regressione/classificazione.

    Lascia Regione impostato su us-central1.

  5. Fai clic su Crea per creare il set di dati.

    Per questo tutorial, utilizzerai un set di dati bancari disponibile pubblicamente e ospitato su Cloud Storage.

  6. In Seleziona un'origine dati, fai clic su Seleziona file CSV da Cloud Storage.

  7. In Percorso file di importazione, inserisci cloud-ml-tables-data/bank-marketing.csv

  8. Fai clic su Continua.

Analizza il set di dati

Nella sezione Analizza puoi visualizzare ulteriori informazioni sul set di dati, ad esempio i valori mancanti o NULL.

Poiché il nostro set di dati è formattato correttamente per questo tutorial, non devi fare nulla in questa pagina e puoi saltare questa sezione.

  1. (Facoltativo) Fai clic su Genera statistiche per visualizzare il numero di valori mancanti o NULL nel set di dati. Questa operazione può richiedere 10 minuti o più.

  2. (Facoltativo) Fai clic su una delle colonne delle funzionalità per scoprire di più sui valori dei dati.

Addestramento di un modello di classificazione AutoML

  1. Fai clic su Addestra nuovo modello.

  2. Seleziona Altro.

  3. Nel riquadro Metodo di addestramento, verifica che il set di dati creato in precedenza sia selezionato per il campo Set di dati.

  4. Per il campo Obiettivo, seleziona Classificazione.

  5. Verifica che sia selezionato il metodo di addestramento AutoML.

  6. Fai clic su Continua.

  7. Nel riquadro Dettagli modello, seleziona Deposito per la colonna target e fai clic su Continua.

    La colonna target si riferisce all'aspetto che il modello deve essere addestrato a prevedere. Per il set di datibank-marketing.csv, la colonna Deposit indica se il cliente ha acquistato un deposito di termine (2 = sì, 1 = no).

    Il riquadro Opzioni di addestramento ti consente di aggiungere funzionalità e trasformare i dati delle colonne. Se non è selezionata nessuna colonna, per impostazione predefinita tutte le colonne non target verranno utilizzate come funzionalità per l'addestramento. Questo set di dati è pronto per essere utilizzato, perciò non è necessario applicare alcuna trasformazione.

  8. Fai clic su Continua.

  9. Nel riquadro Computing e prezzi, inserisci 1 per il budget di addestramento.

    Il budget della formazione determina il tempo effettivo della formazione, ma il tempo necessario per completarla include altre attività, pertanto l'intera procedura può richiedere più di un'ora. Al termine dell'addestramento, il modello viene visualizzato nella scheda del modello come link attivo, con un'icona di stato con un segno di spunta verde.

  10. Fai clic su Inizia addestramento.

Passaggi successivi

Ha inizio l'addestramento del modello, il che può richiedere un'ora o più tempo. Riceverai un'email al termine dell'addestramento. Una volta completato l'addestramento del modello, vai alla pagina successiva di questo tutorial per eseguire il deployment del modello e richiedere una previsione.

Questo tutorial utilizza un set di dati di cui è stata eseguita la pulizia e che è stato formattato per l'addestramento AutoML, ma la maggior parte dei dati richiederà alcune operazioni prima di essere pronto per l'uso. La qualità dei dati di addestramento influisce sull'efficacia dei modelli creati. Scopri di più sulla preparazione dei dati.

L'ottenimento dei dati e la loro preparazione sono fondamentali per garantire un modello di machine learning accurato. Scopri di più sulle best practice.

Scopri di più sulla creazione di un set di dati tabulare.

Vertex AI offre due metodi di addestramento dei modelli: AutoML e personalizzato. Il metodo AutoML consente addestrare i modelli con meno sforzo e mediante il machine learning, mentre il metodo personalizzato offre il controllo completo sulla funzionalità di addestramento. Scopri di più sui metodi di addestramento.

Vertex AI esamina il tipo di dati di origine e i valori della funzionalità, quindi deduce come utilizzerà la funzionalità nell'addestramento del modello. Ti consigliamo di controllare ogni tipo di dati per ciascuna colonna al fine di verificare che sia stato interpretato correttamente. Se necessario, puoi specificare una trasformazione supportata diversa per ogni funzionalità. Scopri di più sulle trasformazioni.

Scopri di più sull'addestramento di un modello AutoML per la classificazione o la regressione.