Panoramica delle ponderazioni del modello BigQuery ML

Questo documento descrive come BigQuery ML supporta la rilevabilità del peso dei modelli per i modelli di machine learning (ML).

Un modello ML è un artefatto che viene salvato dopo l'esecuzione di un algoritmo ML sui dati di addestramento. Il modello rappresenta le regole, i numeri e qualsiasi altra struttura di dati specifica dell'algoritmo necessaria per fare previsioni. Tra gli esempi di tali prodotti o servizi figurano:

  • Un modello di regressione lineare è costituito da un vettore di coefficienti con valori specifici.
  • Un modello ad albero decisionale è composto da uno o più alberi di istruzioni "if-then" con valori specifici.
  • Un modello di rete neurale profonda è composto da una struttura di grafici con vettori o matrici di pesi con valori specifici.

In BigQuery ML, il termine ponderazioni del modello viene utilizzato per descrivere i componenti da cui è composto un modello.

Per informazioni sulle istruzioni e sulle funzioni SQL supportate per ogni tipo di modello, consulta Percorso dell'utente end-to-end per ogni modello.

Offerte per la ponderazione del modello in BigQuery ML

BigQuery ML offre svariate funzioni che consentono di recuperare le ponderazioni dei modelli per modelli diversi.

Categoria del modello Tipi di modello Funzioni per le ponderazioni dei modelli A cosa serve la funzione
Modelli supervisionati Regressione lineare e logistica ML.WEIGHTS Recupera i coefficienti delle caratteristiche e l'intercetta.
Modelli non supervisionati Kmeans ML.CENTROIDS Recupera i coefficienti di caratteristica per tutti i baricentro.
Fattorizzazione matriciale ML.WEIGHTS Recupera le ponderazioni di tutti i fattori latenti. Rappresentano le due matrici decomposte, la matrice utente e la matrice di articoli.
APC ML.PRINCIPAL_COMPONENTS Recupera i coefficienti di caratteristica per tutti i componenti principali, noti anche come autovettori.
ML.PRINCIPAL_COMPONENT_INFO Recupera le statistiche di ciascun componente principale, ad esempio l'autovalore.
Modelli di serie temporali ARIMA_PLUS ML.ARIMA_COEFFICIENTS Recupera i coefficienti del modello ARIMA, utilizzato per modellare il componente di tendenza della serie temporale di input. Per informazioni su altri componenti, come i pattern stagionali presenti nelle serie temporali, utilizza ML.ARIMA_EVALUATE.

BigQuery ML non supporta le funzioni di ponderazione del modello per i seguenti tipi di modelli:

Per visualizzare le ponderazioni di tutti questi tipi di modelli tranne quelli di AutoML Tables, esporta il modello da BigQuery ML a Cloud Storage. Puoi quindi utilizzare la libreria XGBoost per visualizzare la struttura ad albero per i modelli ad albero potenziato e a foresta casuale oppure la libreria TensorFlow per visualizzare la struttura del grafico per i modelli DNN e wide-and-deep. Non esiste un metodo per ottenere informazioni sul peso del modello per i modelli AutoML Tables.

Per ulteriori informazioni sull'esportazione di un modello, consulta le sezioni Istruzione EXPORT MODEL ed Esportare un modello BigQuery ML per la previsione online.