Glosario de errores de Cloud TPU

En este documento, se proporciona un glosario de errores comunes con soluciones del servicio de Cloud TPU.


Tipo de acelerador no válido

Mensaje de error

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

Solución

Se proporcionó un parámetro no válido para el comando create. La disponibilidad de un acelerador en una zona depende de los siguientes parámetros: el tipo, la marca preemptible, la marca spot y la marca reserved. Las marcas preemptible, spot y reserved se pueden cambiar si se incluyen o excluyen en el comando de creación.

Una TPU creada con la marca reserved usará capacidad reservada. Si incluyes las marcas spot o preemptible, se permitirá que las TPU de mayor prioridad interrumpan la TPU. Si no se proporciona ninguna de estas marcas, la TPU será a pedido. No es una configuración válida habilitar más de una de estas marcas. Consulta la documentación del comando create para obtener más información.

Los tipos de aceleradores disponibles en cada zona se pueden encontrar en la documentación de regiones y zonas de TPU o se pueden consultar con el comando accelerator-types list. Cambia el comando de creación para usar uno de estos tipos de aceleradores y vuelve a intentarlo. Si el problema persiste, comunícate con el equipo de asistencia.

No se encontró la red

Mensaje de error

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

Solución

No se encontró la red xxxx. Asegúrate de que la red se haya creado y configurado correctamente. Consulta Crea y administra redes de VPC para obtener más información.

Se denegó el permiso de la cuenta de servicio

Mensaje de error

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

Solución

Este error se produce cuando un usuario intenta crear o enumerar nodos en un proyecto sin autorización de IAM. Una causa probable de este problema es que la cuenta de servicio de la API de Cloud TPU no tiene el rol requerido para el proyecto. En la documentación sobre la administración de cuentas de acceso, se proporciona una descripción general de cómo administrar el acceso. Sigue los pasos de Cómo otorgar o revocar un solo rol y otorga a la cuenta "service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com" el rol de "Agente de servicio de la API de Cloud TPU" (asegúrate de reemplazar PROJECT_NUMBER por el número de tu proyecto, que se encuentra en la configuración del proyecto en la consola de Google Cloud ). Para obtener más información sobre los agentes de servicio, consulta la documentación de Agentes de servicio.

Se superó la cuota

Mensaje de error

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

Solución

Tu proyecto alcanzó un límite de cuota. Para obtener más información sobre cómo trabajar con cuotas, consulta la documentación de Cloud Quotas. No se debe confundir con la cuota de TPU, que rige el uso de los pods de TPU.

Para solicitar un aumento del límite adecuado, sigue los pasos que se indican en Solicita un ajuste de cuota. En la página de cuotas, puedes buscar la cuota especificada por la parte "AAAA" de este mensaje. Algunas cuotas se dividen en diferentes regiones o servicios. El mensaje de error indicará cuál debe aumentarse.

Las partes "XXXX" y "YYYY" del mensaje pueden ser una de las siguientes:

  • HEALTH_CHECKS: Cuota de "Verificaciones de estado"
  • FIREWALLS: Cuota de "Reglas de firewall"
  • NETWORK_ENDPOINT_GROUPS: Cuota de "Grupos de extremos de red" para esta región
  • READ_REQUESTS: Cuota de "solicitudes de lectura por minuto" para el servicio de la API de Compute Engine
  • OPERATION_READ_REQUESTS: Cuota de "Solicitudes de lectura de operaciones por minuto"

Por lo general, esta solicitud se procesa en un plazo de 2 a 3 días hábiles. Si la solicitud es urgente, comunícate con un ingeniero de atención al cliente o un administrador técnico de cuentas.