Pre-elaborazione manuale delle funzionalità
Puoi utilizzare la
clausola TRANSFORM
dell'istruzione CREATE MODEL
in combinazione con le funzioni di preelaborazione manualmente
per definire la preelaborazione dei dati personalizzata. Puoi anche utilizzare queste funzioni di pre-elaborazione manuale al di fuori della clausola TRANSFORM
.
Se vuoi disaccoppiare il pretrattamento dei dati dall'addestramento del modello, puoi creare un
modello solo di trasformazione
che esegue solo le trasformazioni dei dati utilizzando la clausola TRANSFORM
.
Puoi utilizzare la
funzione ML.TRANSFORM
per aumentare la trasparenza della pre-elaborazione delle caratteristiche. Questa funzione consente di
restituire i dati pre-elaborati dalla clausola TRANSFORM
di un modello, in modo da poter visualizzare i dati di addestramento effettivi che vengono utilizzati per l'addestramento del modello, nonché i dati di previsione effettivi che vengono utilizzati per la pubblicazione del modello.
Per informazioni sul supporto della preelaborazione delle funzionalità in BigQuery ML, consulta Panoramica della preelaborazione delle funzionalità.
Per informazioni sugli statement e sulle funzioni SQL supportati per ogni tipo di modello, consulta Percorso utente end-to-end per ogni modello.
Tipi di funzioni di pre-elaborazione
Esistono diversi tipi di funzioni di pre-elaborazione manuale:
- Le funzioni scalari operano su una singola riga. Ad esempio,
ML.BUCKETIZE
. - Le funzioni con valori di tabella operano su tutte le righe e producono una tabella. Ad esempio,
ML.FEATURES_AT_TIME
. Le funzioni analitiche operano su tutte le righe e restituiscono il risultato per ogni riga in base alle statistiche raccolte in tutte le righe. Ad esempio,
ML.QUANTILE_BUCKETIZE
.Devi sempre utilizzare una clausola
OVER()
vuota con le funzioni di analisi ML.Quando utilizzi le funzioni di analisi ML all'interno della clausola
TRANSFORM
durante l'addestramento, le stesse statistiche vengono applicate automaticamente al input nella previsione.
Le seguenti sezioni descrivono le funzioni di preelaborazione disponibili.
Funzioni generali
Per la pulizia dei dati, utilizza la seguente funzione su espressioni stringa o numeriche:
Funzioni numeriche
Utilizza le seguenti funzioni sulle espressioni numeriche per normalizzare i dati:
ML.BUCKETIZE
ML.MAX_ABS_SCALER
ML.MIN_MAX_SCALER
ML.NORMALIZER
ML.POLYNOMIAL_EXPAND
ML.QUANTILE_BUCKETIZE
ML.ROBUST_SCALER
ML.STANDARD_SCALER
Funzioni categoriche
Utilizza le seguenti funzioni per classificare i dati:
Funzioni di testo
Utilizza le seguenti funzioni per le espressioni di stringhe di testo:
Funzioni di immagine
Utilizza le seguenti funzioni sui dati delle immagini:
Limitazioni note
- BigQuery ML supporta sia la pre-elaborazione automatica sia quella manuale nell'esportazione del modello. Consulta i tipi di dati e le funzioni supportati per esportare i modelli addestrati con la clausola
TRANSFORM
di BigQuery ML.