Panoramica della valutazione dei modelli BigQuery ML
Questo documento descrive in che modo BigQuery ML supporta la valutazione dei modelli di machine learning (ML).
Panoramica della valutazione del modello
Puoi utilizzare le metriche di valutazione del modello ML per i seguenti scopi:
- Valutare la qualità dell'adattamento tra il modello e i dati.
- Per confrontare modelli diversi.
- Per prevedere con quale precisione puoi aspettarti che ogni modello funzioni su un set di dati specifico, nel contesto della selezione del modello.
Le valutazioni dei modelli di apprendimento supervisionato e non supervisionato funzionano in modo diverso:
- Per i modelli di apprendimento supervisionato, la valutazione del modello è ben definita. Un set di valutazione, ovvero dati che non sono stati analizzati dal modello, viene solitamente escluso dal set di addestramento e poi utilizzato per valutare le prestazioni del modello. Ti consigliamo di non utilizzare il set di addestramento per la valutazione perché il modello ha un rendimento scadente quando generalizza i risultati di previsione per i nuovi dati. Questo risultato è noto come overfitting.
- Per i modelli di apprendimento non supervisionato, la valutazione del modello è meno definita in genere varia da modello a modello. Poiché i modelli di apprendimento non supervisionato non prevedono un set di valutazione, le metriche di valutazione vengono calcolate utilizzando l'intero set di dati di input.
Per informazioni sugli statement e sulle funzioni SQL supportati per ogni tipo di modello, consulta Percorso utente end-to-end per ogni modello.
Offerte di valutazione dei modelli
BigQuery ML fornisce le seguenti funzioni per calcolare e metriche di valutazione per i modelli ML:
Categoria di modello | Tipi di modello | Funzioni di valutazione del modello | Che cosa fa la funzione |
---|---|---|---|
Apprendimento supervisionato | Regressore lineare Regressore potenziato di alberi Regressore forestale casuale Regressore DNN Regressore ampio e profondo Regressore AutoML Tables |
ML.EVALUATE |
Registra le seguenti metriche:
|
Regresione logistica Classificatore ad alberi con boosting Classificatore foresta casuale Classificatore DNN Classificatore ampio e profondo Classificatore AutoML Tables |
ML.EVALUATE |
Genera i seguenti report:
|
|
ML.CONFUSION_MATRIX |
Mostra la matrice di confusione. | ||
ML.ROC_CURVE |
Genera report sulle metriche per diversi valori di soglia, tra cui:
Si applica solo ai modelli di classificazione con classi binarie. |
||
Apprendimento non supervisionato | K-means | ML.EVALUATE |
Mostra l'indice di Davies-Bouldin e la distanza quadratica media tra i punti dati e i centroidi dei cluster assegnati. |
Fattoreizzazione matriciale | ML.EVALUATE |
Per i modelli basati su feedback espliciti, vengono registrate le seguenti metriche:
|
|
Per i modelli basati su feedback impliciti, vengono registrate le seguenti metriche:
|
|||
PCA | ML.EVALUATE |
Indica il rapporto della varianza spiegata totale. | |
Codificatore automatico | ML.EVALUATE |
Genera i seguenti report:
|
|
Serie temporale | ARIMA_PLUS | ML.EVALUATE
| Genera i seguenti report:
Questa funzione richiede nuovi dati come input. |
ML.ARIMA_EVALUATE
| Segnala le seguenti metriche per tutti i modelli candidati ad ARIMA
caratterizzate da diverse tuple (p, d, q, has_drift):
Inoltre, riporta altre informazioni su stagionalità, effetti delle festività e valori anomali con picchi e cali. Questa funzione non richiede nuovi dati come input. |
Valutazione automatica nelle istruzioni CREATE MODEL
BigQuery ML supporta la valutazione automatica durante la creazione del modello. A seconda del tipo di modello, delle opzioni di addestramento con suddivisione dei dati e dell'utilizzo dell'ottimizzazione degli iperparametri, le metriche di valutazione vengono calcolate in base al set di dati di valutazione riservato, al set di dati di test riservato o all'intero set di dati di input.
Per i modelli k-means, PCA, autoencoder e ARIMA_PLUS, BigQuery ML utilizza tutti i dati di input come dati di addestramento e le metriche di valutazione vengono calcolate rispetto all'intero set di dati di input.
Per la regressione lineare e logistica, albero potenziato, foresta casuale, DNN, Wide and Deep e i modelli di fattorizzazione matriciale, le metriche di valutazione viene calcolata in base al set di dati specificato
CREATE MODEL
opzioni:Quando addestri questi tipi di modelli utilizzando l'ottimizzazione degli iperparametri, l'opzione
DATA_SPLIT_TEST_FRACTION
è utile anche per definire il set di dati in base al quale vengono calcolate le metriche di valutazione. Per maggiori informazioni, consulta la sezione Suddivisione dei dati.Per i modelli AutoML Tables, consulta come vengono utilizzate le suddivisioni dei dati per l'addestramento e la valutazione.
Per ottenere le metriche di valutazione calcolate durante la creazione del modello, utilizza le funzioni di valutazione come ML.EVALUATE
sul modello senza specificare dati di input.
Per un esempio, vedi
ML.EVALUATE
senza dati di input specificati.
Valutazione con un nuovo set di dati
Dopo la creazione del modello, puoi specificare nuovi set di dati per la valutazione. Per fornire
un nuovo set di dati, utilizza funzioni di valutazione come ML.EVALUATE
sul modello
i dati di input specificati. Per un esempio, vedi
ML.EVALUATE
con una soglia personalizzata e dati di input.