Panoramica della pre-elaborazione delle funzionalità
La preelaborazione delle funzionalità è uno dei passaggi più importanti nel ciclo di vita del machine learning. Consiste nella creazione di funzionalità e nella pulizia dei dati di addestramento. La creazione di funzionalità è nota anche come feature engineering.
BigQuery ML fornisce le seguenti tecniche di pre-elaborazione delle funzionalità:
Pre-elaborazione automatica. BigQuery ML esegue la pre-elaborazione automatica durante l'addestramento. Per saperne di più, consulta Preelaborazione automatica delle funzionalità.
Pre-elaborazione manuale. Puoi utilizzare la clausola
TRANSFORM
nell'istruzioneCREATE MODEL
per definire la preelaborazione personalizzata utilizzando le funzioni di preelaborazione manualmente. Puoi anche utilizzare queste funzioni al di fuori della clausolaTRANSFORM
per elaborare i dati di addestramento prima di creare il modello.
Ottenere informazioni sulle funzionalità
Puoi utilizzare la funzione ML.FEATURE_INFO
per recuperare le statistiche di tutte le colonne delle caratteristiche di input.
Conoscenze consigliate
Utilizzando le impostazioni predefinite negli statement CREATE MODEL
e nelle funzioni di inferenza, puoi creare e utilizzare i modelli BigQuery ML anche senza avere molte conoscenze di ML. Tuttavia, avere conoscenze di base sul
ciclo di vita dello sviluppo di ML, come la creazione di funzionalità e l'addestramento del modello,
ti aiuta a ottimizzare sia i dati sia il modello per
ottenere risultati migliori. Ti consigliamo di utilizzare le seguenti risorse per acquisire familiarità con le tecniche e le procedure di ML:
- Machine Learning Crash Course
- Introduzione al machine learning
- Pulizia dei dati
- Feature engineering
- Machine learning intermedio
Passaggi successivi
Scopri di più sul pubblicazione di funzionalità in BigQuery ML.