Panoramica dei dati tabulari

Vertex AI ti consente di eseguire il machine learning con dati tabulari utilizzando processi e interfacce semplici. Per i problemi relativi ai dati tabulari, puoi creare i seguenti tipi di modelli:

  • I modelli di classificazione binaria prevedono un esito binario (una di due classi). Utilizza questo tipo di modello per le domande con risposta sì o no. Ad esempio, potresti volere costruire un modello di classificazione binaria per prevedere se un cliente acquisterà un abbonamento. In genere, un problema di classificazione binaria richiede meno dati rispetto ad altri tipi di modelli.
  • I modelli di classificazione multi-classe prevedono una classe da tre o più classi discrete. Utilizza questo tipo di modello per la classificazione. Ad esempio, come rivenditore, potresti voler creare un modello di classificazione multi-classe per segmentare i clienti in diversi profili.
  • I modelli di regressione prevedono un valore continuo. Ad esempio, in qualità di rivenditore, potresti voler creare un modello di regressione per prevedere quanto spenderà un cliente il mese successivo.
  • I modelli di previsione prevedono una sequenza di valori. Ad esempio, come rivenditore, potresti voler prevedere la domanda giornaliera dei tuoi prodotti per i tre mesi successivi in modo da poter rifornire in anticipo gli inventari dei prodotti in modo appropriato.

Per un'introduzione al machine learning con dati tabulari, consulta Introduzione ai dati tabulari. Per ulteriori informazioni sulle soluzioni Vertex AI, consulta le soluzioni Vertex AI per la classificazione e la regressione e le soluzioni Vertex AI per le previsioni.

Una nota sull'equità

Google si impegna a fare progressi nell'adozione di pratiche di IA responsabile. A questo scopo, i nostri prodotti di ML, tra cui AutoML, sono progettati in base a principi fondamentali come equità e machine learning incentrato sulle persone. Per ulteriori informazioni sulle best practice per ridurre i bias durante la creazione del tuo sistema di ML, consulta la guida al machine learning inclusivo: AutoML.

Soluzioni Vertex AI per la classificazione e la regressione

Vertex AI offre le seguenti soluzioni per la classificazione e la regressione:

Flusso di lavoro tabulare per AutoML end-to-end

Il flusso di lavoro tabulare per AutoML end-to-end è una pipeline AutoML completa per attività di classificazione e regressione. È simile all'API AutoML, ma ti consente di scegliere cosa controllare e cosa automatizzare. Invece di avere controlli per l'intera pipeline, hai controlli per ogni passaggio della pipeline. Questi controlli della pipeline includono:

  • Suddivisione dei dati
  • Feature engineering
  • Ricerca dell'architettura
  • Addestramento del modello
  • Ensemble di modelli
  • Distillazione del modello

Vantaggi

  • Supporta set di dati di grandi dimensioni di dimensioni superiori a 1 TB e con un massimo di 1000 colonne.
  • Ti consente di migliorare la stabilità e ridurre i tempi di addestramento limitando lo spazio di ricerca dei tipi di architettura o saltando la ricerca dell'architettura.
  • Ti consente di migliorare la velocità di addestramento selezionando manualmente l'hardware utilizzato per l'addestramento e la ricerca dell'architettura.
  • Consente di ridurre le dimensioni del modello e migliorare la latenza con la distillazione o modificando le dimensioni dell'ensemble.
  • Ogni componente AutoML può essere esaminato in una potente interfaccia di grafici delle pipeline che ti consente di visualizzare le tabelle di dati trasformati, le architetture dei modelli valutate e molti altri dettagli.
  • Ogni componente AutoML offre maggiore flessibilità e trasparenza, ad esempio la possibilità di personalizzare parametri, hardware, visualizzare lo stato del processo, i log e altro ancora.

Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per scoprire di più su Tabular Workflow per AutoML end-to-end, consulta Tabular Workflow for End-to-End AutoML.

Flusso di lavoro tabulare per TabNet

Il flusso di lavoro tabulare per TabNet è una pipeline che puoi utilizzare per addestrare modelli di classificazione o regressione. TabNet utilizza l'attenzione sequenziale per scegliere le caratteristiche su cui basare il ragionamento in ogni fase decisionale. Ciò favorisce l'interpretabilità e un apprendimento più efficiente perché la capacità di apprendimento viene utilizzata per le caratteristiche più salienti.

Vantaggi

  • Seleziona automaticamente lo spazio di ricerca degli iperparametri appropriato in base alle dimensioni del set di dati, al tipo di previsione e al budget per l'addestramento.
  • Integrato con Vertex AI. Il modello addestrato è un modello Vertex AI. Puoi eseguire previsioni batch o eseguire subito il deployment del modello per le previsioni online.
  • Fornisce un'interpretabilità intrinseca del modello. Puoi ottenere informazioni sulle funzionalità utilizzate da TabNet per prendere la sua decisione.
  • Supporta l'addestramento con GPU.

Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per scoprire di più su Tabular Workflow per TabNet, consulta Tabular Workflow per TabNet.

Flusso di lavoro tabulare per Wide & Deep

Il flusso di lavoro tabulare per Wide & Deep è una pipeline che puoi utilizzare per addestrare modelli di classificazione o regressione. Wide & Deep addestra congiuntamente modelli lineari ampi e reti neurali profonde. Combina i vantaggi della memorizzazione e della generalizzazione. In alcuni esperimenti online, i risultati hanno mostrato che Wide & Deep ha aumentato in modo significativo le acquisizioni di applicazioni del Google Store rispetto ai modelli solo ampi e solo approfonditi.

Vantaggi

  • Integrato con Vertex AI. Il modello addestrato è un modello Vertex AI. Puoi eseguire previsioni batch o eseguire subito il deployment del modello per le previsioni online.

Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per scoprire di più sul flusso di lavoro tabulare per Wide & Deep, consulta Flusso di lavoro tabulare per Wide & Deep.

Classificazione e regressione con AutoML

Vertex AI offre pipeline integrate e completamente gestite per attività di classificazione o regressione end-to-end. Vertex AI cerca il set ottimale di iperparametri, addestra più modelli con più set di iperparametri e poi crea un singolo modello finale da un insieme dei migliori modelli. Vertex AI prende in considerazione le reti neurali e gli alberi con boosting per i tipi di modelli.

Vantaggi

  • Facile da usare: il tipo di modello, i parametri del modello e l'hardware vengono scelti per te.

Per ulteriori informazioni, consulta la Panoramica di classificazione e regressione.

Soluzioni Vertex AI per le previsioni

Vertex AI offre le seguenti soluzioni per le previsioni:

Flusso di lavoro tabulare per la previsione

Il flusso di lavoro tabulare per la previsione è la pipeline completa per le attività di previsione. È simile all'API AutoML, ma ti consente di scegliere cosa controllare e cosa automatizzare. Invece di avere controlli per l'intera pipeline, hai controlli per ogni passaggio della pipeline. Questi controlli della pipeline includono:

  • Suddivisione dei dati
  • Feature engineering
  • Ricerca dell'architettura
  • Addestramento del modello
  • Ensemble di modelli

Vantaggi

  • Supporta set di dati di grandi dimensioni fino a 1 TB di dimensioni e con un massimo di 200 colonne.
  • Ti consente di migliorare la stabilità e ridurre i tempi di addestramento limitando lo spazio di ricerca dei tipi di architettura o saltando la ricerca dell'architettura.
  • Ti consente di migliorare la velocità di addestramento selezionando manualmente l'hardware utilizzato per l'addestramento e la ricerca dell'architettura.
  • Per alcuni metodi di addestramento del modello, consente di ridurre le dimensioni del modello e migliorare la latenza modificando le dimensioni dell'ensemble.
  • Ogni componente può essere esaminato in un'efficace interfaccia di grafici delle pipeline che consente di visualizzare le tabelle di dati trasformati, le architetture dei modelli valutate e molti altri dettagli.
  • Ogni componente offre flessibilità e trasparenza estese, ad esempio la possibilità di personalizzare parametri, hardware, visualizzare lo stato del processo, i log e altro ancora.

Per saperne di più su Tabular Workflows, consulta Tabular Workflows su Vertex AI. Per scoprire di più sul flusso di lavoro tabulare per la previsione, consulta Flusso di lavoro tabulare per la previsione.

Previsione con AutoML

Vertex AI offre una pipeline integrata e completamente gestita per le attività di previsione end-to-end. Vertex AI cerca l'insieme ottimale di iperparametri, addestra più modelli con più insiemi di iperparametri e poi crea un singolo modello finale da un insieme dei migliori modelli. Puoi scegliere tra Time series Dense Encoder (TiDE), Temporal Fusion Transformer (TFT), AutoML (L2L) e Seq2Seq+ come metodo di addestramento del modello. Vertex AI prende in considerazione solo le reti neurali per il tipo di modello.

Vantaggi

  • Facile da usare: i parametri del modello e l'hardware vengono scelti per te.

Per ulteriori informazioni, consulta la Panoramica delle previsioni.

Previsione con ARIMA_PLUS di BigQuery ML

ARIMA_PLUS di BigQuery ML è un modello di previsione univariato. Come modello statistico, è più veloce da addestrare rispetto a un modello basato su reti neurali. Ti consigliamo di addestrare un modello ARIMA_PLUS di BigQuery ML se devi eseguire molte iterazioni rapide dell'addestramento del modello o se hai bisogno di una base di riferimento economica rispetto alla quale misurare altri modelli.

Come Prophet, ARIMA_PLUS di BigQuery ML tenta di decomporre ogni serie temporale in tendenze, stagioni e festività, producendo una previsione utilizzando l'aggregazione delle previsioni di questi modelli. Una delle molte differenze, tuttavia, è che BQML ARIMA+ utilizza ARIMA per modellare il componente di tendenza, mentre Prophet tenta di adattare una curva utilizzando un modello logistico o lineare a pezzi.

Google Cloud offre una pipeline per l'addestramento di un modello ARIMA_PLUS di BigQuery ML e una pipeline per ottenere previsioni collettive da un modello ARIMA_PLUS di BigQuery ML. Entrambe le pipeline sono istanze di Vertex AI Pipelines di Google Cloud Pipeline Components (GCPC).

Vantaggi

  • Facile da usare: i parametri del modello e l'hardware vengono scelti per te.
  • Veloce: l'addestramento del modello fornisce una base di riferimento a basso costo rispetto alla quale confrontare altri modelli.

Per ulteriori informazioni, consulta Previsione con ARIMA+.

Previsione con Prophet

Prophet è un modello di previsione gestito da Meta. Consulta il documento di Prophet per i dettagli sull'algoritmo e la documentazione per ulteriori informazioni sulla libreria.

Come ARIMA_PLUS di BigQuery ML, Prophet tenta di decomporre ogni serie temporale in tendenze, stagioni e festività, producendo una previsione utilizzando l'aggregazione delle previsioni di questi modelli. Tuttavia, una differenza importante è che BQML ARIMA+ utilizza ARIMA per modellare il componente di tendenza, mentre Prophet tenta di adattare una curva utilizzando un modello lineare o logistico a pezzi.

Google Cloud offre una pipeline per l'addestramento di un modello Prophet e una pipeline per ottenere predizioni collettive da un modello Prophet. Entrambe le pipeline sono istanze di Vertex AI Pipelines di Google Cloud Pipeline Components (GCPC).

L'integrazione di Prophet con Vertex AI ti consente di:

Sebbene Prophet sia un modello multivariato, Vertex AI supporta solo una versione univariata.

Vantaggi

  • Flessibilità: puoi migliorare la velocità di addestramento selezionando l'hardware utilizzato per l'addestramento

Per ulteriori informazioni, consulta Predizione con Prophet.

Passaggi successivi