Utilizza i seguenti suggerimenti per risolvere i problemi nel cluster AI Platform Pipelines.
Comprendere perché l'esecuzione di una pipeline non è riuscita
Ogni passaggio di un'esecuzione della pipeline ha un log che descrive l'attività di quel passaggio. Leggi e analizza questi log per comprendere meglio perché l'esecuzione non è riuscita. Segui le istruzioni riportate di seguito per controllare i log di un'esecuzione della pipeline.
Apri le pipeline della piattaforma AI nella console Google Cloud.
Fai clic su Apri dashboard Pipelines per il tuo cluster Kubeflow Pipelines. L'interfaccia utente di Kubeflow Pipelines si apre in una nuova scheda.
Nel pannello di navigazione a sinistra, fai clic su Esperimenti. Un elenco di pipeline esperimenti disponibili.
Fai clic su Tutte le esecuzioni. Viene visualizzato un elenco di esecuzioni della pipeline.
Fai clic sul nome dell'esecuzione della pipeline di cui vuoi risolvere i problemi. R che mostra i passaggi nella pipeline.
I passaggi della pipeline con un segno di spunta verde sono stati completati correttamente. I passaggi con un punto esclamativo rosso non sono riusciti.
Fai clic sul passaggio della pipeline per cui vuoi risolvere i problemi. Viene visualizzata una sezione con gli elementi, gli input, gli output, i volumi, il manifest e i log del passaggio.
Esamina ogni scheda per comprendere gli input e gli output, gli elementi creati e l'attività registrata nel log. Potresti dover eseguire diversi passaggi per trovare la fonte dell'errore.
Accesso vietato alla dashboard Kubeflow Pipelines
Se viene visualizzato il messaggio forbidden durante l'accesso alle pipeline di Kubeflow per un cluster AI Platform Pipelines, non disponi di autorizzazioni per accedere al cluster. Questo problema può verificarsi quando qualcun altro crea un cluster Google Kubernetes Engine ed esegue il deployment di AI Platform Pipelines per te.
Per risolvere il problema, chiedi all'amministratore di Google Cloud di utilizzare le seguenti istruzioni per concedere al tuo account l'accesso a AI Platform Pipelines:
Segui le istruzioni riportate di seguito per concedere a un account utente l'accesso al tuo del cluster AI Platform Pipelines.
Apri le pipeline della piattaforma AI nella console Google Cloud.
Trova il tuo cluster AI Platform Pipelines. Prendi nota il cluster e la zona da utilizzare nei passaggi successivi.
Apri una sessione di Cloud Shell.
Cloud Shell si apre in un frame nella parte inferiore della console Google Cloud. Utilizza le funzionalità di Cloud Shell per completare il resto del processo.
Esegui il comando seguente per impostare il progetto Google Cloud predefinito per questa sessione Cloud Shell.
gcloud config set project PROJECT_ID
Sostituisci PROJECT_ID con l'ID del tuo progetto Google Cloud.
Esegui questo comando per trovare l'account di servizio dei cluster GKE.
gcloud container clusters describe CLUSTER_NAME --zone ZONE \ --format="flattened(nodePools[].config.serviceAccount)"
Sostituisci quanto segue:
- CLUSTER_NAME: il nome del tuo cluster GKE in un cluster Kubernetes.
- ZONE: la zona in cui è stato creato il cluster.
La risposta potrebbe indicare che il cluster utilizza un account di servizio denominato
default
. Questo valore si riferisce all'account di servizio predefinito per Compute Engine. Esegui questo comando per trovare il nome completo l'account di servizio.gcloud iam service-accounts list \ --filter "compute@developer.gserviceaccount.com"
Scopri di più sull'account di servizio predefinito di Compute Engine.
Concedi al tuo account utente il ruolo Utente account di servizio nell'account di servizio del tuo cluster GKE.
gcloud iam service-accounts add-iam-policy-binding \ SERVICE_ACCOUNT_NAME \ --member=user:USERNAME \ --role=roles/iam.serviceAccountUser
Sostituisci quanto segue:
- SERVICE_ACCOUNT_NAME: il nome dell'account di servizio del tuo cluster GKE, che hai trovato nel passaggio precedente. I nomi degli account di servizio sono formattati come *@*.gserviceaccount.com.
- USERNAME: il tuo nome utente su Google Cloud.
Concedi al tuo account utente l'accesso al cluster GKE Visualizzatore per il progetto.
gcloud projects add-iam-policy-binding PROJECT_ID \ --member user:USERNAME --role roles/container.clusterViewer
Sostituisci quanto segue:
- PROJECT_ID: l'ID del tuo progetto Google Cloud.
- USERNAME: il tuo nome utente su Google Cloud.
Autorizzazioni insufficienti durante l'esecuzione di una pipeline
Durante l'esecuzione di una pipeline che accede alle risorse Google Cloud, potresti ricevere errore di autorizzazioni insufficienti. Ad esempio:
Error executing an HTTP request: HTTP response code 403 with body '{ "error": { "errors": [ { "domain": "global", "reason": "insufficientPermissions", "message": "Insufficient Permission" } ], "code": 403, "message": "Insufficient Permission" } }'
Per un passaggio della pipeline che consenta di accedere alle risorse o alle API Google Cloud, Il cluster e la pipeline di Google Kubernetes Engine devono:
- Il cluster deve avere un secret Kubernetes che consente di accedere dell'accesso a specifiche risorse Google Cloud. Segui le istruzioni in Configurare Cluster GKE per concedere le tue pipeline alle risorse Google Cloud.
- Il passaggio della pipeline deve specificare che richiede l'accesso al segreto Kubernetes nella definizione della pipeline. Scopri come definire i passaggi della pipeline che accedono alle risorse Google Cloud.
"Il server è riuscito a soddisfare solo parzialmente la tua richiesta" messaggio di avviso
Potresti visualizzare il seguente messaggio durante l'upgrade di un cluster o il deployment di AI Platform Pipelines.
Sorry, the server was only able to partially fulfill your request. Some data might not be rendered.
Se vedi questo messaggio, attendi cinque minuti e poi aggiorna la pagina.