Questo documento illustra le principali differenze tra l'addestramento di un modello in Vertex AI utilizzando AutoML o l'addestramento personalizzato e l'addestramento di un modello utilizzando BigQuery ML.
Con AutoML, crei e addestri un modello con un'attività tecnica minima impegno. Puoi utilizzare AutoML per prototipare rapidamente i modelli ed esplorare nuovi set di dati prima di investire nello sviluppo. Ad esempio, puoi utilizzare per capire quali sono le caratteristiche migliori per un determinato set di dati.
Con l'addestramento personalizzato puoi creare un'applicazione di addestramento il risultato desiderato. Hai il controllo completo sulle funzionalità dell'applicazione di addestramento. Nello specifico, puoi scegliere come target qualsiasi obiettivo, utilizzare qualsiasi algoritmo, sviluppare le tue funzioni di perdita o metriche oppure definire altre personalizzazioni.
Con BigQuery ML puoi addestrare i modelli utilizzando i dati di BigQuery direttamente in BigQuery. Utilizzando i comandi SQL, puoi creare rapidamente un modello e utilizzarlo per ottenere predizioni collettive.
Per mettere a confronto le diverse funzionalità e competenze richieste per ogni servizio, consulta la tabella seguente.
AutoML | Addestramento personalizzato | BigQuery ML | |
---|---|---|---|
Sono necessarie competenze di data science | No | Sì, per sviluppare l'applicazione di addestramento nonché per eseguire alcune la preparazione dei dati come il feature engineering. | No. |
Sono richieste conoscenze di programmazione | No, AutoML è senza codice. | Sì, per sviluppare l'applicazione di addestramento. | Conoscenza di programmazione SQL richiesta per creare, valutare utilizzare il modello in BigQuery ML. |
Tempo necessario per addestrare il modello | Minore. È necessaria una minore preparazione dei dati e non è richiesto alcuno sviluppo. | Maggiore. È necessaria una maggiore preparazione dei dati ed è richiesto lo sviluppo di applicazioni di addestramento. | Minore. La velocità di sviluppo dei modelli aumenta perché non è necessario creare l'infrastruttura richiesta per le previsioni batch o l'addestramento dei modelli, poiché BigQuery ML sfrutta il motore di calcolo di BigQuery. Questo aumenta la velocità addestramento, valutazione e previsione. |
Limiti agli obiettivi di machine learning | Sì, devi scegliere come target uno dei valori predefiniti degli obiettivi. | No | Sì. |
Può ottimizzare manualmente le prestazioni del modello con l'ottimizzazione degli iperparametri | No. AutoML esegue alcune ottimizzazioni automatiche degli iperparametri, ma non puoi modificare i valori utilizzati. | Sì. Puoi ottimizzare il modello durante l'esecuzione di ogni addestramento per la sperimentazione e il confronto. | Sì. BigQuery ML supporta l'ottimizzazione degli iperparametri durante l'addestramento dei modelli ML utilizzando Istruzioni "CREATE MODEL". |
Consente di controllare gli aspetti dell'ambiente di addestramento | Limitato. Per i set di dati immagine e tabulari, puoi specificare il numero ore nodo da usare per l'addestramento e se consentire l'interruzione anticipata addestramento. | Sì. Puoi specificare aspetti dell'ambiente come il tipo di macchina Compute Engine, la dimensione del disco, il framework di machine learning e il numero di nodi. | No. |
Limiti delle dimensioni dei dati |
Sì. AutoML utilizza set di dati gestiti, dimensione dei dati Le limitazioni variano a seconda del tipo di set di dati. Invita a uno dei seguenti argomenti per le specifiche: |
Per i set di dati non gestiti, no. I set di dati gestiti hanno gli stessi limiti dei set di dati oggetti di set di dati gestiti creati e ospitati da Vertex AI e vengono utilizzati per addestrare modelli AutoML. | Sì. BigQuery ML applica le quote appropriate in base al singolo progetto. Per scoprire di più, consulta la sezione Quote e limiti. |
Passaggi successivi
- Scegli un tutorial introduttivo per ottenere è iniziato con Vertex AI Training.
- Scopri di più sull'addestramento di un modello AutoML.
- Informazioni su creando un job di addestramento personalizzato mediante Python.