AI Platform Pipelines fornisce una piattaforma che puoi utilizzare per automatizzare il tuo flusso di lavoro di machine learning (ML) come pipeline. Se esegui il processo di ML come pipeline, puoi:
- Esegui le pipeline in modo ad hoc.
- Pianifica esecuzioni ricorrenti per addestrare nuovamente il modello su base regolare.
- Esegui esperimenti eseguendo la pipeline con diversi set di iperparametri, numero di passaggi o iterazioni di addestramento e così via. Quindi, confronta i risultati dei tuoi esperimenti.
Questa guida descrive come eseguire una pipeline e pianificare le esecuzioni ricorrenti. Questa guida fornisce anche risorse che puoi utilizzare per scoprire di più sull'interfaccia utente di Kubeflow Pipelines.
Prima di iniziare
Questa guida descrive come utilizzare l'interfaccia utente di Kubeflow Pipelines per eseguire una pipeline. Prima di poter eseguire una pipeline, devi configurare il tuo cluster AI Platform Pipelines e assicurarti di disporre delle autorizzazioni sufficienti per accedere al cluster AI Platform Pipelines.
Esegui una pipeline ML
Segui le istruzioni riportate di seguito per eseguire una pipeline ML sul tuo cluster AI Platform Pipelines.
Apri le pipeline della piattaforma AI nella console Google Cloud.
Fai clic su Apri dashboard Pipelines per il tuo cluster Kubeflow Pipelines. L'interfaccia utente di Kubeflow Pipelines si apre in una nuova scheda.
Nel pannello di navigazione a sinistra, fai clic su Pipeline.
Fai clic sul nome della pipeline da eseguire. Se non hai ancora caricato una pipeline, fai clic sul nome di una pipeline di esempio come [Demo] TFX - Trainer del modello di previsione della mancia del taxi. Viene visualizzato un grafico che mostra i passaggi della pipeline.
Per eseguire o pianificare la pipeline, fai clic su Crea esecuzione. Viene aperto un modulo in cui puoi inserire i dettagli dell'esecuzione.
Prima di eseguire una pipeline, devi specificare i dettagli dell'esecuzione, il tipo di esecuzione e i parametri di esecuzione.
Nella sezione Dettagli esecuzione, specifica quanto segue:
- Pipeline: seleziona la pipeline da eseguire.
- Versione pipeline: seleziona la versione della pipeline che vuoi eseguire.
- Nome esecuzione: inserisci un nome univoco per questa esecuzione. Puoi utilizzare il nome per trovare questa esecuzione in un secondo momento.
- (Facoltativo) Descrizione: inserisci una descrizione per fornire maggiori informazioni su questa esecuzione.
- Esperimento: (facoltativo) per raggruppare le esecuzioni correlate, seleziona un esperimento.
Nella sezione Tipo di esecuzione, indica la frequenza con cui deve essere eseguita questa esecuzione.
- Seleziona se si tratta di un'esecuzione una tantum o periodica.
Se si tratta di un'esecuzione ricorrente, specifica l'attivatore di esecuzione:
- Tipo di attivatore: seleziona se l'esecuzione deve essere attivata su base periodica o in base a una pianificazione cron.
- Numero massimo di esecuzioni simultanee: inserisci il numero massimo di esecuzioni che possono essere attive contemporaneamente.
- Ha data di inizio: seleziona Ha data di inizio, poi inserisci la Data di inizio e l'Ora di inizio per specificare quando questo attivatore deve iniziare a creare le esecuzioni.
- Ha data di fine: seleziona Ha data di fine, quindi inserisci la Data di fine e l'Ora di fine per specificare quando questo attivatore deve interrompere la creazione delle esecuzioni.
- Esegui ogni: seleziona la frequenza per attivare nuove esecuzioni. Se questa esecuzione viene attivata in base a una pianificazione cron, seleziona Consenti modifica dell'espressione cron per inserire direttamente un'espressione cron.
In Parametri esecuzione, personalizza i parametri della pipeline per questa esecuzione. Puoi utilizzare i parametri per impostare valori come i percorsi per il caricamento degli dati di addestramento o la memorizzazione di artefatti, iperparametri, il numero di Iterazioni di addestramento e così via. I parametri di una pipeline vengono definiti al momento della sua compilazione.
Se stai eseguendo la pipeline [Demo] TFX - Taxi Tip Prediction Model Trainer, specifica quanto segue:
pipeline-root: il parametro pipeline-root specifica dove deve essere memorizzato l'output della pipeline. Questa pipeline salva gli elementi correlati all'esecuzione nel bucket Cloud Storage predefinito di AI Platform Pipelines.
Puoi ignorare questo valore per specificare il percorso di un altro bucket Cloud Storage a cui il tuo cluster può accedere. Scopri di più sulla creazione di un bucket Cloud Storage.
data-root: il parametro data-root specifica il percorso dei dati di addestramento della pipeline. Utilizza il valore predefinito.
file-modulo: il parametro file-modulo specifica il percorso al codice sorgente di un modulo utilizzato in questa pipeline. Utilizza il valore predefinito.
Caricando il codice da un bucket Cloud Storage, puoi cambiare rapidamente il comportamento di un componente senza ricostruire l'immagine del contenitore del componente.
Fai clic su Avvia. La dashboard delle pipeline mostra un elenco di esecuzioni delle pipeline.
Fai clic sul nome dell'esecuzione nell'elenco delle esecuzioni della pipeline. Viene visualizzato il grafico della corsa. Mentre l'esecuzione è ancora in corso, il grafico cambia man mano che viene eseguito ogni passaggio.
Fai clic sui passaggi della pipeline per esplorare gli input, gli output, i log e così via dell'esecuzione.
Informazioni sull'interfaccia utente di Kubeflow Pipelines
Utilizza le seguenti risorse per scoprire di più sull'interfaccia utente di Kubeflow Pipelines.
- Scopri di più sugli obiettivi e sui concetti principali di Kubeflow Pipelines
- Leggi una panoramica delle interfacce di Kubeflow Pipelines
- Scopri di più sulla terminologia utilizzata in Kubeflow Pipelines
Passaggi successivi
- Orchestra il processo di ML come una pipeline.
- Scopri come connetterti al tuo cluster AI Platform Pipelines utilizzando l'SDK Kubeflow Pipelines.