Scelta di un metodo di addestramento

Questo documento illustra le principali differenze tra l'addestramento di un modello in Vertex AI utilizzando AutoML o l'addestramento personalizzato e l'addestramento di un modello utilizzando BigQuery ML.

Con AutoML, puoi creare e addestrare un modello con il minimo sforzo tecnico. Puoi utilizzare AutoML per prototipare rapidamente i modelli ed esplorare nuovi set di dati prima di investire nello sviluppo. Ad esempio, puoi usarlo per scoprire quali sono le caratteristiche migliori per un determinato set di dati.

Con l'addestramento personalizzato puoi creare un'applicazione di addestramento ottimizzata per i risultati che ti prefiggi. Hai il controllo completo sulle funzionalità dell'applicazione di addestramento. Nello specifico, puoi scegliere come target qualsiasi obiettivo, utilizzare qualsiasi algoritmo, sviluppare le tue funzioni di perdita o metriche oppure definire altre personalizzazioni.

Con BigQuery ML puoi addestrare i modelli utilizzando i dati di BigQuery direttamente in BigQuery. Utilizzando i comandi SQL, puoi creare rapidamente un modello e utilizzarlo per ottenere predizioni collettive.

Per confrontare le diverse funzionalità e competenze richieste per ciascun servizio, esamina la tabella seguente.

AutoML Addestramento personalizzato BigQuery ML
Sono richieste competenze di data science No Sì, per sviluppare l'applicazione di addestramento nonché per eseguire parte della preparazione dei dati come il feature engineering. No.
Sono richieste conoscenze di programmazione No, AutoML è senza codice. Sì, per sviluppare l'applicazione di addestramento. Conoscenza della programmazione SQL necessaria per creare, valutare e utilizzare il modello in BigQuery ML.
Tempo necessario per addestrare il modello Minore. È necessaria una minore preparazione dei dati e non è richiesto alcuno sviluppo. Maggiore. È necessaria una maggiore preparazione dei dati ed è richiesto lo sviluppo di applicazioni di addestramento. Minore. La velocità di sviluppo dei modelli aumenta perché non è necessario creare l'infrastruttura richiesta per le previsioni batch o l'addestramento dei modelli, poiché BigQuery ML sfrutta il motore di calcolo di BigQuery. Ciò aumenta la velocità di addestramento, valutazione e previsione.
Limiti agli obiettivi di machine learning Sì, devi scegliere come target uno degli obiettivi predefiniti di AutoML. No Sì.
Può ottimizzare manualmente le prestazioni del modello con l'ottimizzazione degli iperparametri No. AutoML esegue alcune ottimizzazioni automatiche degli iperparametri, ma non puoi modificare i valori utilizzati. Sì. Puoi ottimizzare il modello durante l'esecuzione di ogni addestramento per la sperimentazione e il confronto. Sì. BigQuery ML supporta l'ottimizzazione degli iperparametri durante l'addestramento dei modelli di ML utilizzando istruzioni`CREATE MODEL`.
Può controllare aspetti dell'ambiente di addestramento Limitato. Per i set di dati di immagini e tabelle, puoi specificare il numero di ore nodo da usare per l'addestramento e se consentire l'interruzione anticipata dell'addestramento. Sì. Puoi specificare aspetti dell'ambiente come il tipo di macchina Compute Engine, la dimensione del disco, il framework di machine learning e il numero di nodi. No.
Limiti delle dimensioni dei dati

Sì. AutoML utilizza set di dati gestiti. I limiti delle dimensioni variano a seconda del tipo di set di dati. Per informazioni specifiche, consulta uno degli argomenti seguenti:

No, nel caso di set di dati non gestiti. Questi hanno gli stessi limiti degli oggetti set di dati gestiti creati e ospitati da Vertex AI e vengono utilizzati per addestrare i modelli AutoML. Sì. BigQuery ML applica le quote appropriate in base al singolo progetto. Per scoprire di più, consulta la sezione Quote e limiti.

Passaggi successivi