Introduzione ai dati tabulari: crea un set di dati e addestra un modello di classificazione AutoML

Mantieni tutto organizzato con le raccolte Salva e classifica i contenuti in base alle tue preferenze.

Utilizza la console Google Cloud per creare un set di dati tabulare e addestrare un modello di classificazione.

Crea un set di dati tabulare

  1. Nella sezione Vertex AI di Google Cloud Console, vai alla paginaSet di dati.

    Vai alla pagina Set di dati

  2. Fai clic su Crea nella barra dei pulsanti per creare un nuovo set di dati.

  3. Inserisci Structured_AutoML_Tutorial per il nome del set di dati e seleziona la scheda Tabulare.

  4. Seleziona l'obiettivo Regressione/classificazione.

    Lascia l'opzione Regione impostata su us-central1.

  5. Fai clic su Crea per creare il set di dati.

    Per questo tutorial, utilizzerai un set di dati bancari disponibile pubblicamente e ospitato su Cloud Storage.

  6. In Seleziona un'origine dati, fai clic su Seleziona file CSV da Cloud Storage

  7. In Percorso file di importazione, inserisci cloud-ml-tables-data/bank-marketing.csv

  8. Fai clic su Continua.

Analizza il set di dati

Nella sezione Analizza puoi visualizzare ulteriori informazioni sul set di dati, ad esempio i valori mancanti o NULL.

Poiché il nostro set di dati è formattato correttamente per questo tutorial, non devi fare nulla in questa pagina e puoi saltare questa sezione.

  1. (Facoltativo) Fai clic su Genera statistiche per visualizzare il numero di valori mancanti o NULL nel set di dati. Questa operazione può richiedere 10 minuti o più.

  2. (Facoltativo) Fai clic su una delle colonne funzionalità per scoprire di più sui valori dei dati.

Addestra un modello di classificazione AutoML

  1. Fai clic su Addestra nuovo modello.

  2. Nel riquadro Metodo di addestramento, verifica che il set di dati creato in precedenza sia selezionato per il campo Set di dati.

  3. Nel campo Obiettivo, seleziona Classificazione.

  4. Verifica che il metodo di addestramento AutoML sia selezionato.

  5. Fai clic su Continua.

  6. Nel riquadro Dettagli modello, seleziona Deposito per la colonna di destinazione e fai clic su Continua.

    La colonna target si riferisce all'aspetto che il modello deve essere addestrato a prevedere. Per il set di dati bank-marketing.csv, la colonna Deposit indica se il cliente ha acquistato un deposito di termine (2 = sì, 1 = no).

    Il riquadro Opzioni di addestramento ti offre l'opportunità di aggiungere funzionalità e trasformare i dati delle colonne. Se non è selezionata nessuna colonna, per impostazione predefinita tutte le colonne non target verranno utilizzate come funzionalità per l'addestramento. Questo set di dati è pronto per essere utilizzato, perciò non è necessario applicare alcuna trasformazione.

  7. Fai clic su Continua.

  8. Nel riquadro Calcolo e prezzi, inserisci 1 per il budget di addestramento.

    Il budget di addestramento determina il tempo effettivo per l'addestramento, ma il tempo necessario per completare l'addestramento include altre attività, quindi l'intero processo può richiedere più di un'ora. Al termine dell'addestramento, il modello viene visualizzato nella scheda del modello come link pubblicato, con un segno di spunta verde.

  9. Fai clic su Inizia addestramento.

Passaggi successivi

Ha inizio l'addestramento del modello, il che può richiedere un'ora o più tempo. Riceverai un'email al termine dell'addestramento. Una volta completato l'addestramento del modello, segui la pagina successiva di questo tutorial per eseguire il deployment del modello e richiedere una previsione.

Questo tutorial utilizza un set di dati di cui è stata eseguita la pulizia e che è stato formattato per l'addestramento AutoML, ma la maggior parte dei dati richiederà alcune operazioni prima di essere pronto per l'uso. La qualità dei dati di addestramento influisce sull'efficacia dei modelli creati. Scopri di più sulla preparazione dei dati.

L'ottenimento dei dati e la loro preparazione sono fondamentali per garantire un modello di machine learning accurato. Scopri di più sulle best practice.

Scopri di più sulla creazione di un set di dati tabulare.

Vertex AI offre due metodi di addestramento dei modelli: AutoML e personalizzato. AutoML consente di eseguire l'addestramento con meno sforzo e mediante il machine learning, mentre l'addestramento personalizzato ti offre il controllo completo sulla funzionalità di addestramento. Scopri di più sui metodi di addestramento.

Vertex AI esamina il tipo di dati di origine e i valori della funzionalità, quindi deduce come utilizzerà la funzionalità nell'addestramento del modello. Consigliamo di controllare ogni tipo di dati per ciascuna colonna al fine di verificare che sia stato interpretato correttamente. Se necessario, puoi specificare una trasformazione supportata diversa per qualsiasi funzionalità. Scopri di più sulle trasformazioni.

Scopri di più sull'addestramento di AutoML per la classificazione o la regressione.