Panoramica dei dati tabulari

Vertex AI consente di eseguire il machine learning con dati tabelle usando processi e interfacce semplici. Puoi creare i seguenti tipi di modelli per i tuoi problemi relativi ai dati tabulari:

  • I modelli di classificazione binaria prevedono un risultato binario (una di due classi). Utilizza questo tipo di modello per le domande con sì o no. Ad esempio, potresti voler creare un modello di classificazione binario per prevedere se un cliente acquisterà un abbonamento. Generalmente, un problema di classificazione binaria richiede meno dati rispetto ad altri tipi di modelli.
  • I modelli di classificazione multi-classe prevedono una classe da tre o più classi discrete. Utilizza questo tipo di modello per la classificazione. Ad esempio, in qualità di rivenditore potresti voler creare un modello di classificazione multiclasse per segmentare i clienti in utenti tipo diversi.
  • I modelli di regressione prevedono un valore continuo. Ad esempio, in qualità di rivenditore potresti voler creare un modello di regressione per prevedere quanto spenderà un cliente il mese prossimo.
  • I modelli di previsione prevedono una sequenza di valori. Ad esempio, in qualità di rivenditore potresti voler prevedere la domanda giornaliera relativa ai tuoi prodotti per i prossimi tre mesi, in modo da poter prevedere in anticipo e in modo appropriato le novità dei prodotti.

Per un'introduzione al machine learning con dati tabulari, consulta Introduzione ai dati tabulari. Per ulteriori informazioni sulle soluzioni Vertex AI, consulta Soluzioni Vertex AI per classificazione e regressione e Soluzioni Vertex AI per la previsione.

Una nota sull'equità

Google si impegna a fare progressi nel rispetto delle pratiche dell'IA responsabile. A questo scopo, i nostri prodotti ML, tra cui AutoML, sono progettati intorno a principi fondamentali come l'equità e il machine learning incentrato sulla persona. Per ulteriori informazioni sulle best practice per attenuare i bias durante la creazione di un sistema ML personalizzato, consulta la guida al machine learning inclusivo - AutoML.

Soluzioni Vertex AI per classificazione e regressione

Vertex AI offre le seguenti soluzioni per la classificazione e la regressione:

Flusso di lavoro tabulare per AutoML end-to-end

Tabular Workflow for End-to-End AutoML è una pipeline AutoML completa per le attività di classificazione e regressione. È simile all'API AutoML, ma ti consente di scegliere cosa controllare e cosa automatizzare. Invece di controllare l'intera pipeline, puoi utilizzare i controlli per ogni passaggio della pipeline. Questi controlli della pipeline includono:

  • Suddivisione dei dati
  • Feature engineering
  • Ricerca dell'architettura
  • Addestramento del modello
  • Configurazione di modelli
  • Distillazione del modello

Vantaggi

  • Supporta set di dati di grandi dimensioni con più TB e fino a 1000 colonne.
  • Consente di migliorare la stabilità e ridurre i tempi di addestramento limitando lo spazio di ricerca dei tipi di architettura o saltando la ricerca dell'architettura.
  • Consente di migliorare la velocità di addestramento selezionando manualmente l'hardware utilizzato per l'addestramento e la ricerca dell'architettura.
  • Consente di ridurre le dimensioni del modello e migliorare la latenza tramite la distillazione o modificando le dimensioni dell'insieme.
  • Ogni componente AutoML può essere ispezionato in una potente interfaccia grafica delle pipeline che consente di visualizzare le tabelle di dati trasformate, le architetture dei modelli valutate e molti altri dettagli.
  • Ogni componente AutoML ottiene maggiore flessibilità e trasparenza, ad esempio la possibilità di personalizzare parametri, hardware, visualizzare lo stato del processo, log e altro ancora.

Per saperne di più su Tabular Workflows, vedi Tabular Workflows on Vertex AI (Flussi di lavoro tabulari su Vertex AI). Per saperne di più sul flusso di lavoro tabulare per AutoML end-to-end, vedi Flusso di lavoro tabulare per AutoML end-to-end.

Flusso di lavoro tabulare per TabNet

Il flusso di lavoro tabulare per TabNet è una pipeline che puoi utilizzare per addestrare modelli di classificazione o regressione. TabNet utilizza l'attenzione sequenziale per scegliere le caratteristiche su cui ragionare in ogni passaggio decisionale. Ciò favorisce l'interpretabilità e l'apprendimento più efficiente perché la capacità di apprendimento viene utilizzata per le caratteristiche più importanti.

Vantaggi

  • Seleziona automaticamente lo spazio di ricerca degli iperparametri appropriato in base alle dimensioni del set di dati, al tipo di previsione e al budget di addestramento.
  • Integrazione con Vertex AI. Il modello addestrato è un modello Vertex AI. Puoi eseguire previsioni batch o eseguire immediatamente il deployment del modello per le previsioni online.
  • Fornisce l'interpretabilità intrinseca del modello. Puoi ottenere informazioni sulle funzionalità utilizzate da TabNet per prendere questa decisione.
  • Supporta l'addestramento con GPU.

Per saperne di più su Tabular Workflows, vedi Tabular Workflows on Vertex AI (Flussi di lavoro tabulari su Vertex AI). Per ulteriori informazioni sul flusso di lavoro tabulare per TabNet, consulta Flusso di lavoro tabulare per TabNet.

Flusso di lavoro tabulare per Wide and Deep

Tabular Workflow for Wide & Deep è una pipeline che puoi utilizzare per addestrare modelli di classificazione o regressione. Wide & Deep addestra congiuntamente modelli lineari ampi e reti neurali profonde. Combina i vantaggi della memorizzazione e della generalizzazione. I risultati di alcuni esperimenti online hanno mostrato che Wide & Deep ha aumentato significativamente le acquisizioni di applicazioni del Google Store rispetto ai modelli wide-only e solo deep.

Vantaggi

  • Integrazione con Vertex AI. Il modello addestrato è un modello Vertex AI. Puoi eseguire previsioni batch o eseguire immediatamente il deployment del modello per le previsioni online.

Per saperne di più su Tabular Workflows, vedi Tabular Workflows on Vertex AI (Flussi di lavoro tabulari su Vertex AI). Per saperne di più sul flusso di lavoro tabulare per Wide & Deep, vedi Tabular Workflow for Wide & Deep.

Classificazione e regressione con AutoML

Vertex AI offre pipeline integrate e completamente gestite per attività di classificazione o regressione end-to-end. Vertex AI cerca l'insieme ottimale di iperparametri, addestra più modelli con più insiemi di iperparametri e poi crea un singolo modello finale da un insieme dei modelli principali. Vertex AI prende in considerazione le reti neurali e gli alberi potenziati per i tipi di modello.

Vantaggi

  • Facile da usare: il tipo di modello, i parametri del modello e l'hardware vengono scelti per te.

Per ulteriori informazioni, consulta Panoramica della classificazione e regressione.

Soluzioni Vertex AI per la previsione

Vertex AI offre le seguenti soluzioni per la previsione:

Flusso di lavoro tabulare per la previsione

Il flusso di lavoro tabulare per la previsione è la pipeline completa per le attività di previsione. È simile all'API AutoML, ma ti consente di scegliere cosa controllare e cosa automatizzare. Invece di controllare l'intera pipeline, puoi utilizzare i controlli per ogni passaggio della pipeline. Questi controlli della pipeline includono:

  • Suddivisione dei dati
  • Feature engineering
  • Ricerca dell'architettura
  • Addestramento del modello
  • Configurazione di modelli

Vantaggi

  • Supporta set di dati di grandi dimensioni con dimensioni fino a 1 TB e fino a 200 colonne.
  • Consente di migliorare la stabilità e ridurre i tempi di addestramento limitando lo spazio di ricerca dei tipi di architettura o saltando la ricerca dell'architettura.
  • Consente di migliorare la velocità di addestramento selezionando manualmente l'hardware utilizzato per l'addestramento e la ricerca dell'architettura.
  • Per alcuni metodi di addestramento dei modelli, ti consente di ridurre le dimensioni del modello e migliorare la latenza modificando le dimensioni dell'insieme.
  • Ogni componente può essere ispezionato in una potente interfaccia grafica delle pipeline che ti consente di visualizzare le tabelle di dati trasformate, le architetture dei modelli valutate e molti altri dettagli.
  • Ogni componente ottiene maggiore flessibilità e trasparenza, come la possibilità di personalizzare parametri, hardware, visualizzare lo stato del processo, log e altro ancora.

Per saperne di più su Tabular Workflows, vedi Tabular Workflows on Vertex AI (Flussi di lavoro tabulari su Vertex AI). Per ulteriori informazioni sul flusso di lavoro tabulare per la previsione, consulta Flusso di lavoro tabulare per la previsione.

Previsioni con AutoML

Vertex AI offre una pipeline integrata e completamente gestita per le attività di previsione end-to-end. Vertex AI cerca l'insieme ottimale di iperparametri, addestra più modelli con più insiemi di iperparametri e poi crea un unico modello finale da un insieme dei modelli principali. Puoi scegliere tra Time Series Dense Encoder (TiDE), Temporal Fusion Transformer (TFT), AutoML (L2L) e Seq2Seq+ come metodo di addestramento del modello. Vertex AI considera solo le reti neurali per il tipo di modello.

Vantaggi

  • Facilità di utilizzo: i parametri e l'hardware del modello vengono scelti automaticamente.

Per ulteriori informazioni, consulta la sezione Panoramica della previsione.

Previsioni con BigQuery ML ARIMA_PLUS

BigQuery ML ARIMA_PLUS è un modello di previsione non variata. Come modello statistico, l'addestramento è più rapido di un modello basato su reti neurali. Consigliamo di addestrare un modello BigQuery ML ARIMA_PLUS se devi eseguire molte iterazioni rapide di addestramento di modelli o se hai bisogno di una base di riferimento economica da utilizzare per la misurazione di altri modelli.

Come Prophet, BigQuery ML ARIMA_PLUS tenta di scomporre ogni serie temporale in tendenze, stagioni e festività, generando una previsione utilizzando l'aggregazione delle previsioni di questi modelli. Una delle tante differenze, tuttavia, è che BQML ARIMA+ utilizza ARIMA per modellare il componente della tendenza, mentre Prophet tenta di adattare una curva utilizzando un modello logistico o lineare a tratti.

Google Cloud offre una pipeline per l'addestramento di un modello ARIMA_PLUS di BigQuery ML e una pipeline per ottenere previsioni batch da un modello ARIMA_PLUS di BigQuery ML. Entrambe le pipeline sono istanze di Vertex AI Pipelines da Google Cloud Pipeline components (GCPC).

Vantaggi

  • Facilità di utilizzo: i parametri e l'hardware del modello vengono scelti automaticamente.
  • Veloce: l'addestramento dei modelli offre una base di riferimento a basso costo per il confronto di altri modelli.

Per ulteriori informazioni, consulta la sezione Previsione con ARIMA+.

Fare previsioni con il Profeta

Prophet è un modello di previsione gestito da Meta. Consulta il Prophet paper per i dettagli sugli algoritmi e la documentazione per ulteriori informazioni sulla libreria.

Come BigQuery ML ARIMA_PLUS, Prophet tenta di scomporre ogni serie temporale in tendenze, stagioni e festività, generando una previsione utilizzando l'aggregazione delle previsioni di questi modelli. Tuttavia, una differenza importante è che BQML ARIMA+ utilizza ARIMA per modellare il componente di tendenza, mentre Prophet tenta di adattare una curva utilizzando un modello logistico o lineare a tratti.

Google Cloud offre una pipeline per l'addestramento di un modello Prophet e una per ottenere previsioni batch da un modello Prophet. Entrambe le pipeline sono istanze di Vertex AI Pipelines da Google Cloud Pipeline components (GCPC).

L'integrazione di Prophet con Vertex AI ti consente di:

Sebbene Prophet sia un modello multivariato, Vertex AI ne supporta solo una versione univariata.

Vantaggi

  • Flessibile: puoi migliorare la velocità dell'addestramento selezionando l'hardware utilizzato per l'addestramento

Per ulteriori informazioni, consulta la sezione Previsione con Prophet.

Passaggi successivi