Glosario de errores de TPU de Cloud

En este documento se ofrece un glosario de errores habituales con soluciones del servicio Cloud TPU.


Tipo de acelerador no válido

Mensaje de error

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

Solución

Se ha proporcionado un parámetro no válido al comando create. La disponibilidad de un acelerador en una zona depende de los siguientes parámetros: el tipo, la marca preemptible, la marca spot y la marca reserved. Las marcas preemptible, spot y reserved se pueden cambiar incluyéndolas o excluyéndolas en el comando create.

Una TPU creada con la marca reserved usará la capacidad reservada. Si incluyes las marcas spot o preemptible, la TPU podrá interrumpirse por TPUs de mayor prioridad. Si no se proporciona ninguna de estas marcas, la TPU será bajo demanda. No es una configuración válida habilitar más de una de estas marcas. Consulta la documentación del comando create para obtener más información.

Los tipos de acelerador disponibles en cada zona se pueden consultar en la documentación sobre regiones y zonas de TPU o mediante el comando accelerator-types list. Cambia el comando de creación para usar uno de estos tipos de acelerador y vuelve a intentarlo. Si el problema persiste, ponte en contacto con el equipo de Asistencia.

No se ha encontrado la red

Mensaje de error

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

Solución

No se ha encontrado la red xxxx. Asegúrate de que la red se haya creado y configurado correctamente. Para obtener más información, consulta el artículo Crear y gestionar redes de VPC.

Permiso denegado a la cuenta de servicio

Mensaje de error

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

Solución

Este error se produce cuando un usuario intenta crear o enumerar nodos en un proyecto sin autorización de gestión de identidades y accesos. Una causa probable de este problema es que la cuenta de servicio de la API Cloud TPU no tiene el rol necesario para el proyecto. En la documentación sobre cómo gestionar el acceso a las cuentas se explica cómo hacerlo. Sigue los pasos de la sección Conceder o revocar un solo rol y asigna a la cuenta "service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com" el rol "Agente de servicio de la API Cloud TPU" (sustituye PROJECT_NUMBER por el número de tu proyecto, que puedes encontrar en la configuración del proyecto en la consola Google Cloud ). Para obtener más información sobre los agentes de servicio, consulta la documentación de los agentes de servicio.

Cuota superada

Mensaje de error

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

Solución

Tu proyecto ha alcanzado un límite de cuota. Para obtener más información sobre cómo trabajar con cuotas, consulta la documentación de Cloud Quotas. No debe confundirse con la cuota de TPU, que rige el uso de los pods de TPU.

Puede solicitar un aumento del límite correspondiente siguiendo los pasos que se indican en Solicitar un ajuste de cuota. En la página de cuotas, puede buscar la cuota especificada por la parte "AAAA" de este mensaje. Algunas cuotas se dividen en diferentes regiones o servicios. El mensaje de error indicará cuál de ellos debe aumentarse.

Las partes "XXXX" e "YYYY" del mensaje pueden ser una de las siguientes:

  • HEALTH_CHECKS: cuota "Comprobaciones del estado"
  • FIREWALLS: cuota "Reglas de cortafuegos"
  • NETWORK_ENDPOINT_GROUPS: cuota de "Grupos de puntos finales de red" de esta región
  • READ_REQUESTS: cuota "Solicitudes de lectura por minuto" del servicio de la API de Compute Engine
  • OPERATION_READ_REQUESTS: cuota "Solicitudes de lectura de operaciones por minuto"

Esta solicitud se suele procesar en un plazo de 2 a 3 días hábiles. Si la solicitud es urgente, ponte en contacto con un ingeniero de atención al cliente o con un gestor técnico de cuentas.