Pre-elaborazione manuale delle funzionalità
Puoi utilizzare lo
Clausola TRANSFORM
dell'istruzione CREATE MODEL
in combinazione con la pre-elaborazione manuale
per definire la pre-elaborazione personalizzata dei dati. Puoi
utilizzare anche queste funzioni di pre-elaborazione manuale al di fuori della clausola TRANSFORM
.
Se vuoi disaccoppiare la pre-elaborazione dei dati dall'addestramento del modello, puoi creare
modello di sola trasformazione
che esegue solo trasformazioni dei dati
usando la clausola TRANSFORM
.
Puoi utilizzare lo
Funzione ML.TRANSFORM
per aumentare la trasparenza della pre-elaborazione delle caratteristiche. Questa funzione consente di
restituiscono i dati pre-elaborati dalla clausola TRANSFORM
di un modello, in modo che tu possa
vedere i dati effettivi da addestrare per l'addestramento del modello,
i dati di previsione effettivi
che vanno alla pubblicazione del modello.
Per informazioni sul supporto della pre-elaborazione delle caratteristiche in BigQuery ML, consulta Panoramica della pre-elaborazione delle funzionalità.
Per informazioni sulle istruzioni e sulle funzioni SQL supportate per ogni modello consulta Percorso dell'utente end-to-end per ogni modello.
Tipi di funzioni di pre-elaborazione
Esistono diversi tipi di funzioni di pre-elaborazione manuale:
- Le funzioni scalari operano su una singola riga. Ad esempio:
ML.BUCKETIZE
- Le funzioni con valori di tabella operano su tutte le righe e generano una tabella. Ad esempio:
ML.FEATURES_AT_TIME
Le funzioni di analisi operano su tutte le righe e restituiscono il risultato per ogni riga in base alle statistiche raccolte in tutte le righe. Ad esempio:
ML.QUANTILE_BUCKETIZE
Devi sempre utilizzare una clausola
OVER()
vuota con le funzioni di analisi ML.Quando utilizzi funzioni di analisi ML all'interno della clausola
TRANSFORM
durante l'addestramento, le stesse statistiche vengono l'input nella previsione.
Le seguenti sezioni descrivono le funzioni di pre-elaborazione disponibili.
Funzioni generali
Utilizza la seguente funzione su stringhe o espressioni numeriche per eseguire la pulizia dei dati:
Funzioni numeriche
Utilizza le seguenti funzioni sulle espressioni numeriche per regolarizzare i dati:
ML.BUCKETIZE
ML.MAX_ABS_SCALER
ML.MIN_MAX_SCALER
ML.NORMALIZER
ML.POLYNOMIAL_EXPAND
ML.QUANTILE_BUCKETIZE
ML.ROBUST_SCALER
ML.STANDARD_SCALER
Funzioni categoriche
Per classificare i dati, utilizza le seguenti funzioni:
Funzioni di testo
Utilizza le seguenti funzioni per le espressioni stringa di testo:
Funzioni immagine
Utilizza le seguenti funzioni sui dati immagine:
Limitazioni note
- BigQuery ML supporta sia la pre-elaborazione automatica che quella manuale
durante la pre-elaborazione nell'esportazione del modello. Consulta
i tipi di dati supportati
e funzioni
per esportare modelli addestrati con
Clausola
TRANSFORM
di BigQuery ML.