Caratteristiche e funzionalità di AutoML Tables

Questa pagina descrive in che modo AutoML Tables consente a te e al tuo team di creare modelli ad alte prestazioni dai dati tabulari.

Consulta la nostra pagina Problemi noti per conoscere i problemi noti attuali e scoprire come evitarli o risolverli.

AutoML Tables è un servizio coperto dalle obbligazioni di Google stabilite nei Termini per il trattamento e la sicurezza dei dati.

Supporto dati

AutoML Tables consente di creare dati di addestramento puliti ed efficaci fornendo informazioni su dati mancanti, correlazione, cardinalità e distribuzione per ciascuna delle tue funzionalità. Inoltre, poiché non è previsto alcun costo per l'importazione dei dati e la visualizzazione delle relative informazioni, non ti viene addebitato alcun costo da AutoML Tables finché non inizi l'addestramento del modello.

Feature engineering

All'inizio dell'addestramento, AutoML Tables esegue automaticamente attività comuni di feature engineering per te, tra cui:

  • Normalizza e bucket i bucket le caratteristiche numeriche.
  • Crea codifica one-hot e incorporamenti per gli elementi categorici.
  • Eseguire l'elaborazione di base per le funzionalità di testo.
  • Estrai le caratteristiche relative a data e ora dalle colonne Timestamp.

Per maggiori informazioni, consulta Preparazione dei dati eseguita da AutoML Tables.

Addestramento del modello

Test di modelli in parallelo

Quando inizi l'addestramento del modello, AutoML Tables prende il set di dati e avvia l'addestramento per più architetture di modelli contemporaneamente. Questo approccio consente ad AutoML Tables di determinare rapidamente la migliore architettura dei modelli per i tuoi dati, senza dover eseguire l'iterazione in serie delle numerose architetture di modelli possibili. I test delle architetture dei modelli di AutoML Tables includono:

  • Lineare
  • Rete neurale profonda feed-forward
  • Albero decisionale potenziato con gradiente
  • AdaNet
  • Insieme di varie architetture di modelli

Man mano che nuove architetture di modello usciranno dalla community di ricerca, aggiungeremo anche quelle.

Valutazione e creazione del modello finale

Utilizzando i tuoi set di addestramento e convalida, determiniamo l'architettura del modello migliore per i tuoi dati. Poi addestriamo altri due modelli, utilizzando i parametri e l'architettura che abbiamo stabilito nella fase di test parallelo:

  1. Un modello addestrato con i tuoi set di addestramento e convalida.

    Utilizziamo il tuo set di test per fornire la valutazione su questo modello.

  2. Un modello addestrato con i set di addestramento, convalida e test.

    Si tratta del modello che ti mettiamo a disposizione per eseguire le previsioni.

Scelta tra AutoML Tables e BigQuery ML

Ti consigliamo di utilizzare BigQuery ML se preferisci eseguire rapidamente esperimenti o iterazioni con i dati da includere nel modello e utilizzare tipi di modelli più semplici a questo scopo (come la regressione logistica).

Ti consigliamo di lavorare direttamente nell'interfaccia di AutoML Tables se hai già finalizzato i dati e:

  • Ottimizzano al fine di massimizzare la qualità dei modelli (precisione, RMSE ridotto e così via) senza dover eseguire manualmente il feature engineering, la selezione del modello, l'assemblaggio e così via.

  • sono disposti ad attendere più a lungo per raggiungere la qualità del modello. AutoML Tables impiega almeno un'ora per addestrare un modello, poiché sperimenta molte opzioni di modellazione. BigQuery ML restituisce potenzialmente i modelli in pochi minuti perché mantiene le architetture dei modelli, i valori dei parametri e gli intervalli che hai impostato.

  • Utilizza un'ampia gamma di input di funzionalità (oltre ai numeri e alle classi) che trarrebbero vantaggio dal feature engineering automatizzato offerto da AutoML Tables.

Trasparenza del modello e Cloud Logging

Puoi visualizzare la struttura del tuo modello AutoML Tables utilizzando Cloud Logging. In Logging puoi visualizzare gli iperparametri finali del modello, nonché gli iperparametri e i valori degli obiettivi utilizzati durante la convalida del modello.

Per ulteriori informazioni, consulta Logging.

Spiegabilità

Sappiamo che devi essere in grado di spiegare in che modo i tuoi dati sono correlati al modello finale e alle previsioni che effettua. Ti offriamo due modi principali per ottenere informazioni sul tuo modello e su come funziona:

Testa l'esportazione dei dati

Puoi esportare il set di test insieme alle previsioni effettuate dal modello. Questa funzionalità offre insight sulle prestazioni del modello su singole righe di dati di addestramento. L'analisi del set di test e dei relativi risultati può aiutarti a capire su quali tipi di previsioni il tuo modello ha prestazioni scarse e potrebbe fornire indizi su come migliorare i dati per un modello di qualità superiore.