Introduzione agli algoritmi integrati

Questa pagina fornisce una panoramica dell'addestramento con algoritmi integrati. Con gli algoritmi integrati in AI Platform Training, puoi eseguire job di addestramento sui tuoi dati senza scrivere alcun codice per un'applicazione di addestramento. Puoi inviare i dati di addestramento, selezionare un algoritmo e consentire ad AI Platform Training di gestire la pre-elaborazione e l'addestramento per te. Dopodiché è facile eseguire il deployment del modello e ottenere previsioni su AI Platform Training.

Come funziona l'addestramento con algoritmi integrati

AI Platform Training esegue il job di addestramento sulle risorse di calcolo nel cloud. Ecco la procedura generale:

  1. Confronta gli algoritmi integrati disponibili per determinare se si adattano al tuo set di dati e al tuo caso d'uso specifici.
  2. Formatta i dati di input per l'addestramento con l'algoritmo integrato. Devi inviare i dati come file CSV rimuovendo la riga di intestazione e impostando la colonna di destinazione come prima colonna. Se applicabile, segui eventuali requisiti di formattazione aggiuntivi specifici dell'algoritmo integrato in uso.
  3. Crea un bucket Cloud Storage in cui AI Platform Training possa archiviare l'output di addestramento, se non ne hai già uno.
  4. Seleziona le opzioni per personalizzare il job di addestramento. In primo luogo, effettua le selezioni per configurare il job di addestramento complessivo, quindi effettua ulteriori selezioni per configurare l'algoritmo in modo specifico. Facoltativamente, puoi effettuare ulteriori selezioni per configurare l'ottimizzazione degli iperparametri per il job.
    • Per il job di addestramento complessivo, seleziona il nome di un job, l'algoritmo integrato da utilizzare, le macchine da utilizzare, la regione in cui deve essere eseguito il job e la località del bucket Cloud Storage in cui vuoi che AI Platform Training memorizzi gli output di addestramento.
    • Per le selezioni specifiche degli algoritmi, puoi abilitare AI Platform Training per eseguire la pre-elaborazione automatica sul tuo set di dati. Puoi anche specificare argomenti come tasso di apprendimento, passaggi di addestramento e dimensione del batch.
    • Per l'ottimizzazione degli iperparametri, puoi selezionare una metrica dell'obiettivo, ad esempio massimizzare l'accuratezza predittiva del modello o ridurre al minimo la perdita di addestramento. Inoltre, puoi ottimizzare iperparametri specifici e impostare intervalli per i loro valori.
  5. Invia il job di addestramento e visualizza i log per monitorarne l'avanzamento e lo stato.
  6. Una volta completato correttamente il job di addestramento, puoi eseguire il deployment del modello addestrato su AI Platform Training per configurare un server di previsione e ottenere previsioni sui nuovi dati.

Limitazioni

Tieni presente le seguenti limitazioni per l'addestramento con algoritmi integrati:

Eventuali ulteriori limitazioni relative a specifici algoritmi integrati sono indicate nelle guide corrispondenti per ciascun algoritmo.

Ottimizzazione degli iperparametri

L'ottimizzazione degli iperparametri è supportata per l'addestramento con algoritmi integrati. Per prima cosa, specifica una metrica obiettivo e indica se minimizzarla o massimizzarla. Puoi massimizzare la precisione del modello per la classificazione o ridurre al minimo la perdita di addestramento. Elenca gli iperparametri da regolare, insieme a un valore target per ognuno.

Quando invii il job di addestramento con l'ottimizzazione degli iperparametri, AI Platform Training esegue più prove, monitorando e regolando gli iperparametri dopo ogni prova. Quando il job di ottimizzazione degli iperparametri è completo, AI Platform Training segnala i valori per la configurazione più efficace degli iperparametri, nonché un riepilogo per ogni prova.

Scopri di più sull'ottimizzazione degli iperparametri su AI Platform Training.

Panoramica degli algoritmi

Gli algoritmi integrati consentono di addestrare i modelli per una varietà di casi d'uso comunemente risolti con la classificazione e la regressione. I seguenti algoritmi integrati sono disponibili per l'addestramento su AI Platform Training:

  • Studente lineare
  • Ampio e profondo
  • TabNet
  • XGBoost
  • Classificazione di immagini
  • Rilevamento di oggetti

Studente lineare

L'algoritmo integrato in Linear Learner viene utilizzato per la regressione logistica, la classificazione binaria e la classificazione multiclasse. AI Platform Training utilizza un'implementazione basata su TensorFlow Estimator.

Un modello di Linear Learner assegna una ponderazione a ogni caratteristica di input e somma le ponderazioni per prevedere un valore target numerico. Per la regressione logistica, questo valore viene convertito in un valore compreso tra 0 e 1. Questo semplice tipo di modello è facile da interpretare, perché puoi confrontare le ponderazioni delle caratteristiche per determinare quali caratteristiche di input hanno un impatto significativo sulle tue previsioni.

Scopri di più su come funzionano i modelli lineari su larga scala.

Ampio e profondo

L'algoritmo integrato Wide and Deep viene utilizzato per problemi di classificazione e regressione su larga scala, ad esempio sistemi di suggerimenti, ricerca e problemi di ranking. AI Platform Training utilizza un'implementazione basata su uno strumento TensorFlow Estimator.

Questo tipo di modello combina un modello lineare che apprende e "memorizza" un'ampia gamma di regole con una rete neurale profonda che "generalizza" le regole e le applica correttamente a caratteristiche simili in nuovi dati non visti.

Scopri di più su wide e deep learning.

TabNet

L'algoritmo integrato TabNet viene utilizzato per problemi di classificazione e regressione sui dati tabulari. AI Platform Training utilizza un'implementazione basata su TensorFlow.

L'algoritmo integrato TabNet fornisce inoltre attribuzioni delle caratteristiche per aiutare a interpretare il comportamento del modello e spiegare le sue previsioni.

Scopri di più su TabNet come nuovo algoritmo integrato.

XGBoost

XGBoost (eXtreme Gradient Boosting) è un framework che implementa un algoritmo di boosting del gradiente. XGBoost consente un apprendimento supervisionato efficiente per le attività di classificazione, regressione e ranking. L'addestramento XGBoost si basa su insiemi ad albero decisionale, che combinano i risultati di più modelli di classificazione e regressione.

Scopri di più su come funziona XGBoost.

Classificazione di immagini

L'algoritmo integrato per il rilevamento delle immagini utilizza i modelli di classificazione delle immagini TensorFlow. Puoi addestrare un modello di classificazione di immagini basato su un'implementazione TensorFlow di EfficientNet o ResNet.

Rilevamento di oggetti

L'algoritmo integrato per il rilevamento di oggetti utilizza l'API TensorFlow Object Detection per creare un modello in grado di identificare più oggetti all'interno di una singola immagine.

Confronto tra gli algoritmi integrati

La seguente tabella offre un rapido confronto degli algoritmi integrati:

Nome algoritmo Modello ML utilizzato Tipo di problema Esempi di casi d'uso Acceleratori supportati per l'addestramento
Studente lineare TensorFlow Estimator
LinearClassifier e LinearRegressor.
Classificazione, regressione Previsione di vendita GPU
Wide and deep TensorFlow Estimator
DNNLinearCombinadClassifier, DNNLinearCombinadEstimator e DNNLinearCombinadRegressor.
Classificazione, regressione, ranking Sistemi di consigli, ricerca GPU
TabNet TensorFlow Estimator Classificazione, regressione Previsione della percentuale di clic (CTR) per la pubblicità, rilevamento delle frodi GPU
XGBoost XGBoost Classificazione, regressione Previsione della percentuale di clic (CTR) per la pubblicità GPU (supportata solo dalla versione distribuita dell'algoritmo)
Classificazione delle immagini Modelli di classificazione delle immagini TensorFlow Classificazione Classificazione delle immagini GPU, TPU
Rilevamento di oggetti API TensorFlow Object Detection Rilevamento di oggetti Rilevamento di oggetti all'interno di scene di immagini complesse GPU, TPU

Container con algoritmi

Quando invii il job di addestramento ad AI Platform Training, selezioni l'algoritmo specificando l'URI del container Docker corrispondente ospitato in Container Registry. Gli algoritmi integrati sono disponibili tramite i seguenti container:

Algoritmo URI di Container Registry
Studente lineare gcr.io/cloud-ml-algos/linear_learner_cpu:latest
gcr.io/cloud-ml-algos/linear_learner_gpu:latest
Ampio e profondo gcr.io/cloud-ml-algos/wide_deep_learner_cpu:latest
gcr.io/cloud-ml-algos/wide_deep_learner_gpu:latest
TabNet gcr.io/cloud-ml-algos/tab_net:latest
XGBoost gcr.io/cloud-ml-algos/boosted_trees:latest
gcr.io/cloud-ml-algos/xgboost_dist:latest
Classificazione di immagini gcr.io/cloud-ml-algos/image_classification:latest
Rilevamento di oggetti gcr.io/cloud-ml-algos/image_object_detection:latest

Passaggi successivi