Solución de problemas de AI Platform Pipelines

Usa las siguientes sugerencias para solucionar problemas en el clúster de AI Platform Pipelines.

Comprende por qué falló la ejecución de una canalización

En una ejecución de canalización, cada paso tiene un registro de la actividad realizada en este. Lee y analiza estos registros para comprender mejor por qué falló la ejecución. Usa las siguientes instrucciones para verificar los registros de una ejecución de canalización.

  1. Abre AI Platform Pipelines en la consola de Google Cloud.

    Ir a AI Platform Pipelines

  2. Haz clic en Open pipelines dashboard (Abrir panel de canalizaciones) para seleccionar el clúster de Kubeflow Pipelines. Se abrirá la interfaz de usuario de Kubeflow Pipelines en una pestaña nueva.

  3. En el panel de navegación de la izquierda, haz clic en Experimentos. Aparecerá una lista de experimentos de canalización.

  4. Haz clic en Todas las ejecuciones. Aparecerá una lista de ejecuciones de canalizaciones.

  5. Haz clic en el nombre de la ejecución de canalización en la que deseas solucionar problemas. Se abrirá un grafo en el que se muestran los pasos en la canalización.

  6. Los pasos de la canalización que tienen una marca de verificación verde se completaron de manera correcta. Los pasos con un signo de exclamación rojo fallaron.

    Haz clic en el paso de la canalización que deseas corregir. Aparecerá una sección con los artefactos, las entradas, las salidas, los volúmenes, el manifiesto y los registros del paso.

  7. Revisa todas las pestañas para comprender las entradas y salidas, los artefactos creados y la actividad registrada. Es posible que debas revisar varios pasos para encontrar la causa del error.

Acceso prohibido al panel de Kubeflow Pipelines

Si recibes el mensaje prohibido mientras intentas acceder al panel de Kubeflow Pipelines de un clúster de AI Platform Pipelines, significa que no tienes permisos suficientes para acceder al clúster. Este problema puede ocurrir cuando otra persona crea un clúster de Google Kubernetes Engine y, luego, implementa AI Platform Pipelines.

Para resolver este problema, pídele al administrador de Google Cloud que use las siguientes instrucciones para otorgar a tu cuenta acceso a AI Platform Pipelines:

Usa las siguientes instrucciones para otorgar a una cuenta de usuario acceso a tu clúster de AI Platform Pipelines.

  1. Abre AI Platform Pipelines en la consola de Google Cloud.

    Ir a AI Platform Pipelines

  2. Busca el clúster de AI Platform Pipelines. Toma nota del clúster y la zona para usarlos en pasos posteriores.

  3. Abre una sesión de Cloud Shell.

    Abra Cloud Shell

    Cloud Shell se abrirá en un marco en la parte inferior de la consola de Google Cloud. Usa Cloud Shell para completar el resto de este proceso.

  4. Ejecuta el siguiente comando para establecer el proyecto de Google Cloud predeterminado para esta sesión de Cloud Shell.

    gcloud config set project PROJECT_ID
    

    Reemplaza PROJECT_ID por el ID del proyecto de Google Cloud.

  5. Ejecuta el siguiente comando para buscar la cuenta de servicio que usa el clúster de GKE.

    gcloud container clusters describe CLUSTER_NAME --zone ZONE \
    --format="flattened(nodePools[].config.serviceAccount)"
    

    Reemplaza lo siguiente:

    • CLUSTER_NAME: Es el nombre del clúster de GKE.
    • ZONE: Es la zona en la que se creó el clúster.

    La respuesta puede indicar que tu clúster usa una cuenta de servicio llamada default. Este valor se refiere a la cuenta de servicio predeterminada para Compute Engine. Ejecuta el siguiente comando para buscar el nombre completo de esta cuenta de servicio.

    gcloud iam service-accounts list \
    --filter "compute@developer.gserviceaccount.com"
    

    Obtén más información sobre la cuenta de servicio predeterminada de Compute Engine.

  6. Otorga a tu cuenta de usuario la función de usuario de la cuenta de servicio de tu clúster de GKE.

    gcloud iam service-accounts add-iam-policy-binding \
    SERVICE_ACCOUNT_NAME \
    --member=user:USERNAME \
    --role=roles/iam.serviceAccountUser
    

    Reemplaza lo siguiente:

    • SERVICE_ACCOUNT_NAME: Es el nombre de la cuenta de servicio del clúster de GKE, que encontraste en el paso anterior. Los nombres de cuentas de servicio tienen el siguiente formato: *@*.gserviceaccount.com.
    • USERNAME: Es tu nombre de usuario en Google Cloud.
  7. Otorga a tu cuenta de usuario la función de visualizador de clústeres de GKE en el proyecto.

    gcloud projects add-iam-policy-binding PROJECT_ID \
    --member user:USERNAME --role roles/container.clusterViewer
    

    Reemplaza lo siguiente:

    • PROJECT_ID: Es el ID del proyecto de Google Cloud.
    • USERNAME: Es tu nombre de usuario en Google Cloud.

Permisos insuficientes mientras se ejecuta una canalización

Mientras ejecutas una canalización que accede a los recursos de Google Cloud, es posible que recibas un error de permisos insuficientes. Por ejemplo:

Error executing an HTTP request: HTTP response code 403 with body '{
  "error": {
    "errors": [
      {
       "domain": "global",
       "reason": "insufficientPermissions",
       "message": "Insufficient Permission"
      }
    ],
    "code": 403,
    "message": "Insufficient Permission"
  }
}'

Para que un paso de la canalización acceda a las API o los recursos de Google Cloud, se deben cumplir las siguientes condiciones en la canalización y el clúster de Google Kubernetes Engine:

Mensaje de advertencia que indica que el servidor completó la solicitud de forma parcial

Es posible que veas el siguiente mensaje cuando se esté actualizando un clúster o cuando se esté implementando AI Platform Pipelines.

Sorry, the server was only able to partially fulfill
your request. Some data might not be rendered.

Si ves este mensaje, espera cinco minutos y actualiza la página.