Panoramica di BigQuery Explainable AI

Questo documento descrive in che modo BigQuery ML supporta l'intelligenza artificiale AIA) Explainable.

Explainable AI ti aiuta a comprendere i risultati generati dal modello di machine learning predittivo per le attività di classificazione e regressione definendo il modo in cui ogni caratteristica in una riga di dati ha contribuito al risultato previsto. Queste informazioni sono spesso indicate come attribuzione delle caratteristiche. Puoi utilizzare queste informazioni per verificare se il modello funziona come previsto, riconoscere i bias nei modelli e stabilire modi per migliorare il modello e i dati di addestramento.

Per informazioni sulle istruzioni e sulle funzioni SQL supportate per ogni tipo di modello, consulta Percorso dell'utente end-to-end per ogni modello.

Spiegabilità locale e globale

Esistono due tipi di spiegabilità: locale e globale. Sono anche noti rispettivamente come importanza locale delle caratteristiche e importanza globale delle caratteristiche.

  • La spiegabilità locale restituisce valori di attribuzione delle funzionalità per ogni esempio spiegato. Questi valori descrivono l'impatto di una particolare caratteristica sulla previsione rispetto alla previsione di riferimento.
  • La spiegabilità globale restituisce l'influenza complessiva della caratteristica sul modello e viene spesso ottenuta aggregando le attribuzioni delle caratteristiche sull'intero set di dati. Un valore assoluto più alto indica che la caratteristica ha avuto un'influenza maggiore sulle previsioni del modello.

Offerte di Explainable AI in BigQuery ML

Explainable AI in BigQuery ML supporta vari modelli di machine learning, sia in serie temporali che non in serie temporale. Ciascuno dei modelli sfrutta un metodo di spiegabilità diverso.

Se vuoi utilizzare Explainable AI sui modelli BigQuery ML registrati in Model Registry, devi seguire requisiti separati. Per saperne di più, consulta Applicare Explainable AI ai modelli BigQuery ML.

Categoria di modello Tipi di modello Metodo di spiegabilità Spiegazione di base del metodo Funzioni di spiegazione locale Funzioni di spiegazione globali
Modelli supervisionati Regressione lineare e logistica Valori di Shapley I valori di Shapley per i modelli lineari sono uguali a model weight * feature value, dove i valori delle caratteristiche sono standardizzati e i pesi del modello vengono addestrati con i valori delle caratteristiche standardizzati. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Errori standard e Valori p Gli errori standard e i valori p vengono utilizzati per il test di significatività rispetto ai pesi del modello. NA ML.ADVANCED_WEIGHTS4
Alberi potenziati

Foresta casuale
Forma dell'albero Albero SHAP è un algoritmo per calcolare i valori SHAP esatti per i modelli basati su albero decisionale. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Contributo approssimativo alle funzionalità Consente di ottenere un valore approssimativo dei valori di contributo delle caratteristiche. È più veloce e semplice rispetto ad Tree SHAP. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Importanza delle caratteristiche basate sull'indice di Gini Un punteggio globale di importanza delle caratteristiche che indica quanto è stata utile o preziosa ciascuna caratteristica per la costruzione dell'albero potenziato o del modello di foresta casuale durante l'addestramento. NA ML.FEATURE_IMPORTANCE
Rete neurale profonda (DNN)

Grande e profondo
Gradienti integrati Un metodo basato su gradienti che calcola in modo efficiente le attribuzioni delle caratteristiche con le stesse proprietà axiomatiche del valore di Shapley. Fornisce un'approssimazione campionamento delle attribuzioni esatte delle caratteristiche. La sua accuratezza è controllata dal parametro integrated_gradients_num_steps. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
AutoML Tables Valore di Shapley campionato Il valore di Shapley campionato assegna il credito per il risultato del modello a ciascuna caratteristica e prende in considerazione diverse permutazioni delle caratteristiche. Questo metodo fornisce un'approssimazione di campionamento dei valori di Shapley esatti. NA ML.GLOBAL_EXPLAIN2
Modelli di serie temporali ARIMA_PLUS Scomposizione di serie temporali Scompone le serie temporali in più componenti, se questi componenti sono presenti nella serie temporale. I componenti includono tendenza, stagionale, festività, variazioni di passi, picco e cali. Consulta la pipeline di modellazione ARIMA_PLUS per ulteriori dettagli. ML.EXPLAIN_FORECAST3 NA
ARIMA_PLUS_XREG Scomposizione di serie temporali
e
Valori di Shapley
Scompone la serie temporale in più componenti, tra cui tendenza, stagionale, festività, variazioni dei passi, picco e cali (simile a ARIMA_PLUS). L'attribuzione di ciascun regressore esterno viene calcolata in base ai valori di Shapley, che corrispondono a model weight * feature value. ML.EXPLAIN_FORECAST3 NA

1ML_EXPLAIN_PREDICT è una versione estesa di ML.PREDICT.

2ML.GLOBAL_EXPLAIN restituisce la spiegabilità globale ottenuta prendendo l'attribuzione assoluta media ricevuta da ogni caratteristica per tutte le righe nel set di dati di valutazione.

3ML.EXPLAIN_FORECAST è una versione estesa di ML.FORECAST.

4ML.ADVANCED_WEIGHTS è una versione estesa di ML.WEIGHTS.