Configura una pipeline ML utilizzando AI Platform Pipelines
Questa guida rapida fornisce una breve introduzione ad AI Platform Pipelines. In questa guida, installerai Kubeflow Pipelines con TensorFlow Extended su un nuovo cluster Google Kubernetes Engine (GKE), quindi esegui una pipeline di esempio.
Questo argomento è destinato agli utenti che non hanno mai utilizzato AI Platform Pipelines.
Prima di iniziare
Prima di seguire questa guida, controlla che il tuo progetto Google Cloud sia configurato correttamente e di avere le autorizzazioni sufficienti per eseguire il deployment di AI Platform Pipelines.
- Accedi al tuo account Google Cloud. Se non conosci Google Cloud, crea un account per valutare le prestazioni dei nostri prodotti in scenari reali. I nuovi clienti ricevono anche 300 $di crediti gratuiti per l'esecuzione, il test e il deployment dei carichi di lavoro.
-
Nella console di Google Cloud Console, nella pagina del selettore dei progetti, seleziona o crea un progetto Google Cloud.
-
Verifica che la fatturazione sia attivata per il tuo progetto Google Cloud. Scopri come verificare se la fatturazione è abilitata per un progetto.
-
Nella console di Google Cloud Console, nella pagina del selettore dei progetti, seleziona o crea un progetto Google Cloud.
-
Verifica che la fatturazione sia attivata per il tuo progetto Google Cloud. Scopri come verificare se la fatturazione è abilitata per un progetto.
-
Utilizza le istruzioni seguenti per verificare se hai ricevuto i ruoli necessari per il deployment di AI Platform Pipelines.
-
Apri una sessione di Cloud Shell.
Cloud Shell si apre in un frame nella parte inferiore della console di Google Cloud.
-
Per eseguire il deployment di AI Platform Pipelines, devi disporre dei ruoli Visualizzatore (
roles/viewer
) e Amministratore di Kubernetes Engine (roles/container.admin
) nel progetto o altri ruoli che includono le stesse autorizzazioni, come il ruolo Proprietario (roles/owner
) nel progetto. Esegui il comando seguente in Cloud Shell per elencare le entità con i ruoli Visualizzatore e Amministratore Kubernetes Engine.gcloud projects get-iam-policy PROJECT_ID \ --flatten="bindings[].members" --format="table(bindings.role, bindings.members)" \ --filter="bindings.role:roles/container.admin OR bindings.role:roles/viewer"
Sostituisci PROJECT_ID con l'ID del tuo progetto Google Cloud.
Utilizza l'output di questo comando per verificare che il tuo account disponga dei ruoli Visualizzatore e Amministratore di Kubernetes Engine.
-
Se non hai ricevuto i ruoli richiesti, contatta l'amministratore del progetto Google Cloud per ricevere ulteriore assistenza.
Scopri di più sulla concessione dei ruoli di Identity and Access Management.
-
Configura l'istanza di AI Platform Pipelines
Segui le istruzioni riportate di seguito per configurare AI Platform Pipelines su un nuovo cluster GKE.
Apri AI Platform Pipelines in Google Cloud Console.
Fai clic su Seleziona progetto. Viene visualizzata una finestra di dialogo che richiede di selezionare un progetto Google Cloud.
Seleziona il progetto Google Cloud che vuoi utilizzare per questa guida rapida, quindi fai clic su Apri.
Nella barra degli strumenti di AI Platform Pipelines, fai clic su Nuova istanza. Kubeflow Pipelines si apre in Google Cloud Marketplace.
Fai clic su Configura. Si apre un modulo per configurare il deployment di Kubeflow Pipelines.
Se viene visualizzato il link Crea un nuovo cluster, fai clic su Crea un nuovo cluster. In caso contrario, vai al passaggio successivo.
Seleziona us-central1-a come Zona del cluster in cui deve essere creato il cluster GKE.
Seleziona Consenti l'accesso alle seguenti API Cloud per concedere alle applicazioni eseguite sul tuo cluster GKE l'accesso alle risorse Google Cloud. Se selezioni questa casella, concedi al tuo cluster l'accesso all'ambito di accesso di
https://www.googleapis.com/auth/cloud-platform
. Questo ambito di accesso fornisce l'accesso completo alle risorse Google Cloud che hai abilitato nel progetto. Concedere al tuo cluster l'accesso alle risorse Google Cloud in questo modo ti evita la necessità di creare un secret Kubernetes.Fai clic su Crea cluster per creare il tuo cluster GKE. Il completamento della procedura richiede diversi minuti.
Dopo aver creato il cluster, fornisci le seguenti informazioni:
- Spazio dei nomi: seleziona default come spazio dei nomi.
- Nome istanza app:inserisci pipelines-quickstart come nome dell'istanza.
Emissary Executor: per impostazione predefinita, Kubeflow Pipelines utilizza l'esecutore Docker. Seleziona questa opzione per utilizzare l'esecutore emissario (alpha). Invia un feedback sulla tua esperienza.
Fai clic su Deploy per eseguire il deployment di pipeline Kubeflow nel nuovo cluster GKE.
Il processo di deployment richiede diversi minuti. Al termine del processo di deployment, vai alla sezione successiva.
Esegui una pipeline di esempio
Utilizza le istruzioni seguenti per eseguire una pipeline di esempio nella nuova istanza di AI Platform Pipelines.
Apri AI Platform Pipelines in Google Cloud Console.
Trova il cluster AI Platform Pipelines denominato pipelines-quickstart, quindi fai clic su Apri pipelines Dashboard per aprire le pipeline Kubeflow. Si apre la dashboard delle pipeline di Kubeflow che mostra la pagina Per iniziare.
Puoi utilizzare la pagina Per iniziare nella dashboard per saperne di più sulle pipeline dimostrative e tutorial fornite con Kubeflow Pipelines oppure per saperne di più su come creare una pipeline.
Nel pannello di navigazione a sinistra, fai clic su Pipelines.
Le pipeline di Kubeflow offrono diverse pipeline di esempio. Fai clic su [Tutorial] Trasmettere dati nei componenti Python. Si apre un grafico che mostra i passaggi della pipeline.
Per eseguire la pipeline una volta, fai clic su Crea esecuzione. In Kubeflow Pipelines, una esecuzione è una singola esecuzione di una pipeline. Si apre un modulo in cui si inseriscono i dettagli dell'esecuzione.
Inserisci "Quickstart run run" come Run name (Nome esecuzione).
Fai clic su Avvia. La dashboard delle pipeline mostra un elenco di esecuzioni di pipeline nella pagina Esperimenti. In Kubeflow Pipelines, puoi utilizzare esperimenti per organizzare le esecuzioni della pipeline in gruppi logici.
Fai clic sull'esecuzione denominata Quickstart pipeline run (Esecuzione della pipeline di avvio rapido). Viene visualizzato il grafico della tua esecuzione. Mentre l'esecuzione è ancora in corso, il grafico cambia durante l'esecuzione di ogni passaggio.
Fai clic sui passaggi della pipeline per esplorare gli input, gli output, i log e così via dell'esecuzione.
Ora hai eseguito una pipeline di esempio nell'istanza di AI Platform Pipelines.
Esegui la pulizia
Per evitare che al tuo account Google Cloud vengano addebitati costi relativi alle risorse utilizzate in questa pagina, segui questi passaggi:
Per evitare che al tuo account Google Cloud vengano addebitati ulteriori costi, segui le istruzioni riportate di seguito per eliminare l'istanza di AI Platform Pipelines e il cluster GKE che hai creato nelle sezioni precedenti.Apri AI Platform Pipelines in Google Cloud Console.
Seleziona la casella di controllo dell'istanza di AI Platform Pipelines denominata pipelines-quickstart.
Nella barra degli strumenti di AI Platform Pipelines, fai clic su Delete (Elimina).
Nella finestra di dialogo Elimina pipeline Kubeflow dal cluster, seleziona la casella di controllo Elimina cluster. La selezione di questa casella di controllo indica che vuoi eliminare il cluster GKE che hai creato per questa guida rapida.
Fai clic su Elimina per eliminare l'istanza di AI Platform Pipelines e il cluster GKE.
Passaggi successivi
- Per saperne di più sulle pipeline di AI Platform e sulle pipeline ML, leggi l'introduzione alle pipeline di AI Platform.
- Orchestra il tuo processo di ML come una pipeline.