Questa pagina fornisce una panoramica dell'addestramento con algoritmi integrati. Con gli algoritmi integrati in AI Platform Training, puoi eseguire job di addestramento sui tuoi dati senza scrivere alcun codice per un'applicazione di addestramento. Puoi inviare i dati di addestramento, selezionare un algoritmo e consentire ad AI Platform Training di gestire la pre-elaborazione e l'addestramento per te. Dopodiché è facile eseguire il deployment del modello e ottenere previsioni su AI Platform Training.
Come funziona l'addestramento con algoritmi integrati
AI Platform Training esegue il job di addestramento sulle risorse di calcolo nel cloud. Ecco la procedura generale:
- Confronta gli algoritmi integrati disponibili per determinare se si adattano al tuo set di dati e al tuo caso d'uso specifici.
- In questo caso, seleziona l'algoritmo integrato più adatto alle tue esigenze.
- Se non ci sono algoritmi integrati adatti, puoi creare un'applicazione di addestramento da eseguire su AI Platform Training.
- Formatta i dati di input per l'addestramento con l'algoritmo integrato. Devi inviare i dati come file CSV rimuovendo la riga di intestazione e impostando la colonna di destinazione come prima colonna. Se applicabile, segui eventuali requisiti di formattazione aggiuntivi specifici dell'algoritmo integrato in uso.
- Crea un bucket Cloud Storage in cui AI Platform Training possa archiviare l'output di addestramento, se non ne hai già uno.
- Seleziona le opzioni per personalizzare il job di addestramento. In primo luogo, effettua le selezioni per configurare il job di addestramento complessivo, quindi effettua ulteriori selezioni per configurare l'algoritmo in modo specifico. Facoltativamente, puoi effettuare ulteriori selezioni
per configurare l'ottimizzazione degli iperparametri per il job.
- Per il job di addestramento complessivo, seleziona il nome di un job, l'algoritmo integrato da utilizzare, le macchine da utilizzare, la regione in cui deve essere eseguito il job e la località del bucket Cloud Storage in cui vuoi che AI Platform Training memorizzi gli output di addestramento.
- Per le selezioni specifiche degli algoritmi, puoi abilitare AI Platform Training per eseguire la pre-elaborazione automatica sul tuo set di dati. Puoi anche specificare argomenti come tasso di apprendimento, passaggi di addestramento e dimensione del batch.
- Per l'ottimizzazione degli iperparametri, puoi selezionare una metrica dell'obiettivo, ad esempio massimizzare l'accuratezza predittiva del modello o ridurre al minimo la perdita di addestramento. Inoltre, puoi ottimizzare iperparametri specifici e impostare intervalli per i loro valori.
- Invia il job di addestramento e visualizza i log per monitorarne l'avanzamento e lo stato.
- Una volta completato correttamente il job di addestramento, puoi eseguire il deployment del modello addestrato su AI Platform Training per configurare un server di previsione e ottenere previsioni sui nuovi dati.
Limitazioni
Tieni presente le seguenti limitazioni per l'addestramento con algoritmi integrati:
- L'addestramento distribuito non è supportato. Per eseguire un job di addestramento distribuito su AI Platform Training, devi creare un'applicazione di addestramento.
- I job di addestramento inviati tramite la console Google Cloud utilizzano solo tipi di macchine legacy. Puoi utilizzare tipi di macchine Compute Engine con job di addestramento inviati tramite
gcloud
o la libreria client delle API di Google per Python. Scopri di più sui tipi di macchine per l'addestramento. - Le GPU sono supportate per alcuni algoritmi. Per saperne di più, consulta il confronto dettagliato di tutti gli algoritmi integrati.
- Le macchine con più GPU non offrono una velocità maggiore grazie all'addestramento degli algoritmi integrati. Se utilizzi GPU, seleziona macchine con un'unica GPU.
- Le TPU non sono supportate per l'addestramento con algoritmi tabulari integrato. Devi creare un'applicazione di addestramento. Scopri come eseguire un job di addestramento con le TPU.
Eventuali ulteriori limitazioni relative a specifici algoritmi integrati sono indicate nelle guide corrispondenti per ciascun algoritmo.
Ottimizzazione degli iperparametri
L'ottimizzazione degli iperparametri è supportata per l'addestramento con algoritmi integrati. Per prima cosa, specifica una metrica obiettivo e indica se minimizzarla o massimizzarla. Puoi massimizzare la precisione del modello per la classificazione o ridurre al minimo la perdita di addestramento. Elenca gli iperparametri da regolare, insieme a un valore target per ognuno.
Quando invii il job di addestramento con l'ottimizzazione degli iperparametri, AI Platform Training esegue più prove, monitorando e regolando gli iperparametri dopo ogni prova. Quando il job di ottimizzazione degli iperparametri è completo, AI Platform Training segnala i valori per la configurazione più efficace degli iperparametri, nonché un riepilogo per ogni prova.
Scopri di più sull'ottimizzazione degli iperparametri su AI Platform Training.
Panoramica degli algoritmi
Gli algoritmi integrati consentono di addestrare i modelli per una varietà di casi d'uso comunemente risolti con la classificazione e la regressione. I seguenti algoritmi integrati sono disponibili per l'addestramento su AI Platform Training:
- Studente lineare
- Ampio e profondo
- TabNet
- XGBoost
- Classificazione di immagini
- Rilevamento di oggetti
Studente lineare
L'algoritmo integrato in Linear Learner viene utilizzato per la regressione logistica, la classificazione binaria e la classificazione multiclasse. AI Platform Training utilizza un'implementazione basata su TensorFlow Estimator.
Un modello di Linear Learner assegna una ponderazione a ogni caratteristica di input e somma le ponderazioni per prevedere un valore target numerico. Per la regressione logistica, questo valore viene convertito in un valore compreso tra 0 e 1. Questo semplice tipo di modello è facile da interpretare, perché puoi confrontare le ponderazioni delle caratteristiche per determinare quali caratteristiche di input hanno un impatto significativo sulle tue previsioni.
Scopri di più su come funzionano i modelli lineari su larga scala.
Ampio e profondo
L'algoritmo integrato Wide and Deep viene utilizzato per problemi di classificazione e regressione su larga scala, ad esempio sistemi di suggerimenti, ricerca e problemi di ranking. AI Platform Training utilizza un'implementazione basata su uno strumento TensorFlow Estimator.
Questo tipo di modello combina un modello lineare che apprende e "memorizza" un'ampia gamma di regole con una rete neurale profonda che "generalizza" le regole e le applica correttamente a caratteristiche simili in nuovi dati non visti.
Scopri di più su wide e deep learning.
TabNet
L'algoritmo integrato TabNet viene utilizzato per problemi di classificazione e regressione sui dati tabulari. AI Platform Training utilizza un'implementazione basata su TensorFlow.
L'algoritmo integrato TabNet fornisce inoltre attribuzioni delle caratteristiche per aiutare a interpretare il comportamento del modello e spiegare le sue previsioni.
Scopri di più su TabNet come nuovo algoritmo integrato.
XGBoost
XGBoost (eXtreme Gradient Boosting) è un framework che implementa un algoritmo di boosting del gradiente. XGBoost consente un apprendimento supervisionato efficiente per le attività di classificazione, regressione e ranking. L'addestramento XGBoost si basa su insiemi ad albero decisionale, che combinano i risultati di più modelli di classificazione e regressione.
Scopri di più su come funziona XGBoost.
Classificazione di immagini
L'algoritmo integrato per il rilevamento delle immagini utilizza i modelli di classificazione delle immagini TensorFlow. Puoi addestrare un modello di classificazione di immagini basato su un'implementazione TensorFlow di EfficientNet o ResNet.
Rilevamento di oggetti
L'algoritmo integrato per il rilevamento di oggetti utilizza l'API TensorFlow Object Detection per creare un modello in grado di identificare più oggetti all'interno di una singola immagine.
Confronto tra gli algoritmi integrati
La seguente tabella offre un rapido confronto degli algoritmi integrati:
Nome algoritmo | Modello ML utilizzato | Tipo di problema | Esempi di casi d'uso | Acceleratori supportati per l'addestramento |
---|---|---|---|---|
Studente lineare | TensorFlow Estimator LinearClassifier e LinearRegressor. |
Classificazione, regressione | Previsione di vendita | GPU |
Wide and deep | TensorFlow Estimator DNNLinearCombinadClassifier, DNNLinearCombinadEstimator e DNNLinearCombinadRegressor. |
Classificazione, regressione, ranking | Sistemi di consigli, ricerca | GPU |
TabNet | TensorFlow Estimator | Classificazione, regressione | Previsione della percentuale di clic (CTR) per la pubblicità, rilevamento delle frodi | GPU |
XGBoost | XGBoost | Classificazione, regressione | Previsione della percentuale di clic (CTR) per la pubblicità | GPU (supportata solo dalla versione distribuita dell'algoritmo) |
Classificazione delle immagini | Modelli di classificazione delle immagini TensorFlow | Classificazione | Classificazione delle immagini | GPU, TPU |
Rilevamento di oggetti | API TensorFlow Object Detection | Rilevamento di oggetti | Rilevamento di oggetti all'interno di scene di immagini complesse | GPU, TPU |
Container con algoritmi
Quando invii il job di addestramento ad AI Platform Training, selezioni l'algoritmo specificando l'URI del container Docker corrispondente ospitato in Container Registry. Gli algoritmi integrati sono disponibili tramite i seguenti container:
Algoritmo | URI di Container Registry |
---|---|
Studente lineare |
gcr.io/cloud-ml-algos/linear_learner_cpu:latest gcr.io/cloud-ml-algos/linear_learner_gpu:latest
|
Ampio e profondo |
gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
|
TabNet |
gcr.io/cloud-ml-algos/tab_net:latest |
XGBoost |
gcr.io/cloud-ml-algos/boosted_trees:latest gcr.io/cloud-ml-algos/xgboost_dist:latest
|
Classificazione di immagini |
gcr.io/cloud-ml-algos/image_classification:latest
|
Rilevamento di oggetti |
gcr.io/cloud-ml-algos/image_object_detection:latest
|
Passaggi successivi
- Scopri come AI Platform Training pre-elabora i dati per l'addestramento con algoritmi integrati.
- Prova un tutorial iniziale per l'addestramento degli algoritmi integrati.