Risoluzione dei problemi di AI Platform Pipelines

Utilizza i seguenti suggerimenti per risolvere i problemi del cluster AI Platform Pipelines.

Capire perché l'esecuzione di una pipeline non è riuscita

Ogni passaggio di un'esecuzione di pipeline ha un log che descrive l'attività di quel passaggio. Leggi e analizza questi log per comprendere meglio perché l'esecuzione non è riuscita. Utilizza le istruzioni seguenti per controllare i log per l'esecuzione di una pipeline.

  1. Apri AI Platform Pipelines nella console Google Cloud.

    Vai ad AI Platform Pipelines

  2. Fai clic su Apri dashboard di pipeline per il tuo cluster Kubeflow Pipelines. L'interfaccia utente di Kubeflow Pipelines si apre in una nuova scheda.

  3. Nel pannello di navigazione a sinistra, fai clic su Esperimenti. Viene visualizzato un elenco di esperimenti della pipeline.

  4. Fai clic su Tutte le esecuzioni. Viene visualizzato un elenco di esecuzioni pipeline.

  5. Fai clic sul nome dell'esecuzione della pipeline di cui vuoi risolvere i problemi. Si apre un grafico che mostra i passaggi della pipeline.

  6. I passaggi della pipeline con un segno di spunta verde sono stati completati correttamente. I passaggi con un punto esclamativo rosso non sono riusciti.

    Fai clic sul passaggio della pipeline di cui vuoi risolvere i problemi. Viene visualizzata una sezione con gli artefatti, gli input, gli output, i volumi, il manifest e i log del passaggio.

  7. Esamina ogni scheda per comprendere gli input e gli output, gli artefatti creati e l'attività registrata nel log. Potresti dover svolgere diversi passaggi per trovare l'origine dell'errore.

Accesso vietato alla dashboard Kubeflow Pipelines

Se ricevi il messaggio non consentito durante l'accesso alla dashboard Kubeflow Pipelines per un cluster AI Platform Pipelines, non disponi di autorizzazioni sufficienti per accedere al cluster. Questo problema può verificarsi quando un'altra persona crea un cluster Google Kubernetes Engine ed esegue il deployment di AI Platform Pipelines per te.

Per risolvere il problema, chiedi all'amministratore di Google Cloud di utilizzare le seguenti istruzioni per concedere al tuo account l'accesso ad AI Platform Pipelines:

Segui le istruzioni riportate di seguito per concedere a un account utente l'accesso al cluster AI Platform Pipelines.

  1. Apri AI Platform Pipelines nella console Google Cloud.

    Vai ad AI Platform Pipelines

  2. Trova il cluster AI Platform Pipelines. Prendi nota del cluster e della zona da utilizzare nei passaggi successivi.

  3. Apri una sessione di Cloud Shell.

    Apri Cloud Shell

    Cloud Shell si apre in un frame nella parte inferiore della console Google Cloud. Utilizza Cloud Shell per completare il resto del processo.

  4. Esegui questo comando per impostare il progetto Google Cloud predefinito per questa sessione di Cloud Shell.

    gcloud config set project PROJECT_ID
    

    Sostituisci PROJECT_ID con l'ID del tuo progetto Google Cloud.

  5. Esegui questo comando per trovare l'account di servizio utilizzato dal cluster GKE.

    gcloud container clusters describe CLUSTER_NAME --zone ZONE \
    --format="flattened(nodePools[].config.serviceAccount)"
    

    Sostituisci quanto segue:

    • CLUSTER_NAME: il nome del tuo cluster GKE.
    • ZONE: la zona in cui è stato creato il cluster.

    La risposta potrebbe indicare che il cluster utilizza un account di servizio denominato default. Questo valore si riferisce all'account di servizio predefinito per Compute Engine. Esegui questo comando per trovare il nome completo di questo account di servizio.

    gcloud iam service-accounts list \
    --filter "compute@developer.gserviceaccount.com"
    

    Scopri di più sull'account di servizio predefinito di Compute Engine.

  6. Concedi al tuo account utente il ruolo Utente account di servizio per l'account di servizio del tuo cluster GKE.

    gcloud iam service-accounts add-iam-policy-binding \
    SERVICE_ACCOUNT_NAME \
    --member=user:USERNAME \
    --role=roles/iam.serviceAccountUser
    

    Sostituisci quanto segue:

    • SERVICE_ACCOUNT_NAME: il nome dell'account di servizio del cluster GKE, che hai trovato nel passaggio precedente. I nomi degli account di servizio hanno il formato *@*.gserviceaccount.com.
    • USERNAME: il tuo nome utente su Google Cloud.
  7. Concedi al tuo account utente l'accesso al ruolo Visualizzatore cluster GKE nel progetto.

    gcloud projects add-iam-policy-binding PROJECT_ID \
    --member user:USERNAME --role roles/container.clusterViewer
    

    Sostituisci quanto segue:

    • PROJECT_ID: l'ID del tuo progetto Google Cloud.
    • USERNAME: il tuo nome utente su Google Cloud.

Autorizzazioni insufficienti durante l'esecuzione di una pipeline

Durante l'esecuzione di una pipeline che accede alle risorse Google Cloud, potresti ricevere un errore di autorizzazioni insufficienti. Ad esempio:

Error executing an HTTP request: HTTP response code 403 with body '{
  "error": {
    "errors": [
      {
       "domain": "global",
       "reason": "insufficientPermissions",
       "message": "Insufficient Permission"
      }
    ],
    "code": 403,
    "message": "Insufficient Permission"
  }
}'

Affinché un passaggio della pipeline possa accedere alle risorse o alle API di Google Cloud, il cluster e la pipeline di Google Kubernetes Engine devono:

Messaggio di avviso "Il server è riuscito a soddisfare solo parzialmente la tua richiesta"

Potresti visualizzare il seguente messaggio quando viene eseguito l'upgrade di un cluster o quando viene eseguito il deployment di AI Platform Pipelines.

Sorry, the server was only able to partially fulfill
your request. Some data might not be rendered.

Se viene visualizzato questo messaggio, attendi cinque minuti e poi aggiorna la pagina.