Panoramica di BigQuery Explainable AI

Questo documento descrive in che modo BigQuery ML supporta l'intelligenza artificiale AIA) spiegabile, chiamata a volte XAI.

Explainable AI ti aiuta a comprendere i risultati generati dal modello di machine learning predittivo per le attività di classificazione e regressione definendo il modo in cui ogni caratteristica in una riga di dati ha contribuito al risultato previsto. Queste informazioni sono spesso indicate come attribuzione delle caratteristiche. Puoi utilizzare queste informazioni per verificare se il modello funziona come previsto, riconoscere i bias nei modelli e stabilire modi per migliorare il modello e i dati di addestramento.

Per informazioni sulle istruzioni e sulle funzioni SQL supportate per ogni tipo di modello, consulta Percorso dell'utente end-to-end per ogni modello.

Spiegabilità locale e globale

Esistono due tipi di spiegabilità: locale e globale. Queste sono anche note rispettivamente come importanza delle caratteristiche locali e importanza globale delle caratteristiche.

  • La spiegabilità locale restituisce i valori di attribuzione delle caratteristiche per ogni esempio spiegato. Questi valori descrivono in che misura una particolare caratteristica ha influito sulla previsione rispetto alla previsione di riferimento.
  • La spiegabilità globale restituisce l'influenza complessiva della caratteristica sul modello e viene spesso ottenuta aggregando le attribuzioni delle caratteristiche sull'intero set di dati. Un valore assoluto più elevato indica che la caratteristica ha avuto un'influenza maggiore sulle previsioni del modello.

Offerte Explainable AI in BigQuery ML

Explainable AI in BigQuery ML supporta vari modelli di machine learning, sia di serie temporali che non. Ciascuno dei modelli sfrutta un diverso metodo di spiegabilità.

Per utilizzare Explainable AI sui modelli BigQuery ML registrati in Model Registry, devi seguire requisiti distinti. Per saperne di più, vedi Applicare Explainable AI sui modelli di BigQuery ML.

Categoria del modello Tipi di modello Metodo di spiegabilità Spiegazione di base del metodo Spiega le funzioni locali Spiegazione globale delle funzioni
Modelli supervisionati Regressione lineare e logistica Valori di Shapley I valori di Shapley per i modelli lineari sono uguali a model weight * feature value, dove i valori delle caratteristiche sono standardizzati e le ponderazioni del modello vengono addestrati con i valori delle caratteristiche standardizzati. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Errori standard e valori P Gli errori standard e i valori p vengono utilizzati per i test di significatività rispetto alle ponderazioni del modello. NA ML.ADVANCED_WEIGHTS4
Alberi potenziati

Foresta casuale
FORMA ad albero Tree SHAP è un algoritmo che consente di calcolare valori SHAP esatti per i modelli basati su albero decisionale. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Contributo approssimativo alle funzionalità Offre un valore approssimativo dei valori del contributo delle funzionalità. È più semplice e veloce rispetto a Tree SHAP. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
Importanza delle caratteristiche basate su Gini Index Un punteggio globale di importanza delle caratteristiche che indica l'utilità o il valore di ciascuna caratteristica nella creazione del modello ad albero potenziato o di foresta casuale durante l'addestramento. NA ML.FEATURE_IMPORTANCE
Rete neurale profonda (DNN)

Wide-and-Deep
Gradienti integrate Un metodo basato su gradienti che calcola in modo efficiente le attribuzioni delle caratteristiche con le stesse proprietà assiomatiche del valore di Shapley. Fornisce un'approssimazione campionaria delle attribuzioni esatte delle caratteristiche. La sua precisione è controllata dal parametro integrated_gradients_num_steps. ML.EXPLAIN_PREDICT1 ML.GLOBAL_EXPLAIN2
AutoML Tables Dati di Shapley campionati Il valore di Shapley campionato assegna il merito del risultato del modello a ogni caratteristica e considera diverse permutazioni delle caratteristiche. Questo metodo fornisce un'approssimazione di campionamento dei valori di Shapley esatti. NA ML.GLOBAL_EXPLAIN2
Modelli di serie temporali ARIMA_PLUS Scomposizione di serie temporali Scompone la serie temporale in più componenti se questi componenti sono presenti nella serie temporale. I componenti includono tendenza, stagionalità, festività, variazioni di passi e picchi e cali. Per ulteriori dettagli, consulta la pagina relativa alla pipeline di modellazione di ARIMA_PLUS. ML.EXPLAIN_FORECAST3 NA
ARIMA_PLUS_XREG Scomposizione delle serie temporali
e
Valori di Shapley
Scompone la serie temporale in più componenti, tra cui tendenza, stagionalità, festività, variazioni di passaggi e picchi e cali (in modo simile ad ARIMA_PLUS). L'attribuzione di ogni regressore esterno viene calcolata in base ai valori di Shapley, che è uguale a model weight * feature value. ML.EXPLAIN_FORECAST3 NA

1ML_EXPLAIN_PREDICT è una versione estesa di ML.PREDICT.

2ML.GLOBAL_EXPLAIN restituisce la spiegabilità globale ottenuta prendendo l'attribuzione assoluta media che ogni caratteristica riceve per tutte le righe nel set di dati di valutazione.

3ML.EXPLAIN_FORECAST è una versione estesa di ML.FORECAST.

4ML.ADVANCED_WEIGHTS è una versione estesa di ML.WEIGHTS.