Caratteristiche e funzionalità di AutoML Tables

Questa pagina descrive il modo in cui AutoML Tables consente a te e al tuo team di creare modelli ad alte prestazioni dai dati tabulari.

Consulta la nostra pagina Problemi noti per informazioni sui problemi noti attuali e su come evitarli o recuperarli.

AutoML Tables è un servizio coperto dagli obblighi di Google definiti nei Termini per il trattamento e la sicurezza dei dati.

Supporto dati

AutoML Tables ti aiuta a creare dati di addestramento puliti ed efficaci fornendo informazioni su dati mancanti, correlazione, cardinalità e distribuzione per ciascuna delle tue funzionalità. Inoltre, poiché non è previsto alcun costo per l'importazione dei dati e la visualizzazione delle relative informazioni, non ti verranno addebitati costi da AutoML Tables finché non inizi l'addestramento del modello.

Ingegneria delle caratteristiche

Quando avvii l'addestramento, AutoML Tables esegue automaticamente le attività comuni di progettazione delle funzionalità, tra cui:

  • Normalizzare e bucketare le caratteristiche numeriche.
  • Creare codifiche e incorporamenti univoci per le funzionalità categoriche.
  • Esegui elaborazione di base per le funzionalità di testo.
  • Estrai funzionalità relative alla data e all'ora dalle colonne del timestamp.

Per saperne di più, consulta Preparazione dei dati applicata ad AutoML Tables.

Addestramento di modelli

Test di modelli paralleli

Quando avvii l'addestramento del tuo modello, AutoML Tables prende il tuo set di dati e inizia l'addestramento per più architetture dei modelli contemporaneamente. Questo approccio consente a AutoML Tables di determinare rapidamente la migliore architettura dei modelli per i dati, senza dover eseguire l'iterazione in serie sulle numerose architetture dei modelli possibili. Le architetture dei modelli I test delle tabelle AutoML includono:

  • Lineare
  • Rete neurale avanzata
  • Albero decisionale accelerato sfumato
  • Ad Exchange
  • Complesso di varie architetture di modelli

Man mano che nuovi architetture di modelli escono dalla community di ricerca, aggiungeremo anche quelle.

Valutazione e creazione del modello finale

Utilizzando i set di addestramento e convalida, determiniamo la migliore architettura del modello per i tuoi dati. Poi addestriamo altri due modelli, utilizzando i parametri e l'architettura che abbiamo determinato nella fase di test parallelo:

  1. Un modello addestrato con i set di addestramento e convalida.

    Utilizziamo il tuo set di test per fornire la valutazione del modello in questo modello.

  2. Un modello addestrato con i set di addestramento, convalida e test.

    Questo è il modello che ti forniamo da fare per effettuare previsioni.

Scelta tra AutoML Tables e BigQuery ML

Ti consigliamo di utilizzare BigQuery ML se ti interessano di più l'esperimento o l'iterazione rapida con quali dati includere nel modello e se vuoi utilizzare tipi di modelli più semplici per questo scopo (come la regressione logistica).

Ti consigliamo di lavorare direttamente nell'interfaccia di AutoML Tables se hai già finalizzato i dati e:

  • Sono ottimizzati per massimizzare la qualità dei modelli (precisione, RMSE basso e così via) senza dover effettuare manualmente la progettazione della caratteristica, la selezione del modello, l'unione e così via.

  • Sono disposti ad attendere più a lungo per ottenere la qualità del modello. AutoML Tables richiede almeno un'ora per addestrare un modello, perché esegue esperimenti con molte opzioni di modellazione. Potenzialmente, ML ML restituisce i modelli in pochi minuti perché si adatta alle architetture dei modelli e ai valori e agli intervalli dei parametri impostati.

  • Sfrutta un'ampia varietà di input di funzionalità (al di là di numeri e classi) che potrebbero trarre vantaggio dall'ulteriore tecnologia di engineering automatizzata fornita da AutoML Tables.

Trasparenza dei modelli e Cloud Logging

Puoi visualizzare la struttura del modello AutoML Tables utilizzando Cloud Logging. In Logging, puoi vedere gli iperparametri finali del modello, gli iperparametri e i valori obiettivo utilizzati durante la convalida del modello.

Per ulteriori informazioni, consulta la sezione Logging.

Spiegabilità

Sappiamo che devi essere in grado di spiegare in che modo i tuoi dati si riferiscono al modello finale e alle previsioni che effettua. Ti offriamo due modi principali per ottenere informazioni dettagliate sul tuo modello e sul suo funzionamento:

Esportazione dati di test

Puoi esportare il set di test insieme alle previsioni effettuate dal modello. Questa funzionalità offre informazioni dettagliate sul rendimento del modello in singole righe di dati di addestramento. L'analisi del set di test e dei suoi risultati può aiutarti a comprendere su quali tipi di previsioni il modello ha prestazioni scarse e fornire indizi su come migliorare i dati per un modello di qualità superiore.