Panoramica della pre-elaborazione delle funzionalità
Il pre-elaborazione delle funzionalità è uno dei passaggi più importanti del ciclo di vita del machine learning. Consiste nella creazione di funzionalità e nella pulizia dei dati di addestramento. La creazione di funzionalità è anche chiamata feature engineering.
BigQuery ML fornisce le seguenti tecniche di pre-elaborazione delle funzionalità:
Pre-elaborazione automatica. BigQuery ML esegue la pre-elaborazione automatica durante l'addestramento. Per saperne di più, consulta Preelaborazione automatica delle funzionalità.
Pre-elaborazione manuale. Puoi utilizzare la clausola
TRANSFORM
nell'istruzioneCREATE MODEL
per definire la pre-elaborazione personalizzata utilizzando le funzioni di pre-elaborazione manuale. Puoi anche utilizzare queste funzioni al di fuori della clausolaTRANSFORM
per elaborare i dati di addestramento prima di creare il modello.
Ottenere informazioni sulle funzionalità
Puoi utilizzare la funzione ML.FEATURE_INFO
per recuperare le statistiche di tutte le colonne delle caratteristiche di input.
Conoscenze consigliate
Utilizzando le impostazioni predefinite nelle istruzioni CREATE MODEL
e nelle
funzioni di inferenza, puoi creare e utilizzare modelli BigQuery ML
anche senza molte conoscenze di ML. Tuttavia, avere una conoscenza di base del ciclo di vita dello sviluppo di ML, come l'feature engineering e l'addestramento del modello, ti aiuta a ottimizzare sia i dati sia il modello per ottenere risultati migliori. Ti consigliamo di utilizzare le seguenti risorse per acquisire familiarità con le tecniche e i processi di ML:
- Machine Learning Crash Course
- Introduzione al machine learning
- Pulizia dei dati
- Feature engineering
- Machine learning intermedio
Passaggi successivi
- Scopri di più sul feature serving in BigQuery ML.
Per ulteriori informazioni sulle istruzioni e sulle funzioni SQL supportate per i modelli che supportano il pre-elaborazione delle funzionalità, consulta i seguenti documenti: