Glossário de erros do Cloud TPU

Este documento oferece um glossário de erros comuns com soluções do serviço Cloud TPU.


Tipo de acelerador inválido

Mensagem de erro

generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and
reserved (false) is not available in zone us-central1-a, please contact support.

Solução

Um parâmetro inválido foi fornecido ao comando "create". A disponibilidade de um acelerador em uma zona depende dos seguintes parâmetros: tipo, flag preemptible, flag spot e flag reserved. As flags preemptible, spot e reserved podem ser alteradas incluindo ou excluindo-as no comando create.

Uma TPU criada com a flag reserved usa capacidade reservada. Incluir as flags spot ou preemptible permite que a TPU seja interrompida por TPUs de maior prioridade. Se nenhuma dessas flags for fornecida, a TPU será sob demanda. Não é uma configuração válida ativar mais de uma dessas flags. Consulte a documentação do comando "create" para mais informações.

Os tipos de acelerador disponíveis em cada zona podem ser encontrados na documentação de regiões e zonas de TPU ou consultados usando o comando accelerator-types list. Mude o comando de criação para usar um desses tipos de acelerador e tente de novo ou entre em contato com o suporte se o problema persistir.

Rede não encontrada

Mensagem de erro

  Cloud TPU received a bad request. The field "Network" cannot be "xxxx":
  requested resource not found

Solução

A rede xxxx não foi encontrada. Verifique se a rede foi criada e configurada corretamente. Consulte Criar e gerenciar redes VPC para mais informações.

Permissão negada à conta de serviço

Mensagem de erro

  generic::permission_denied: Cloud TPU got permissions denied when trying to
  access the customer project. Make sure that the IAM account
  'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud
  TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts

Solução

Esse erro ocorre quando um usuário tenta criar ou listar nós em um projeto sem autorização do IAM. Uma causa provável desse problema é que a conta de serviço da API Cloud TPU não tem a função necessária para o projeto. A documentação sobre como gerenciar contas de acesso oferece uma visão geral de como fazer isso. Siga as etapas em Conceder ou revogar uma única função e atribua à conta "service-PROJECT_NUMBER@cloud-tpu.iam.gserviceaccount.com" a função de "Agente de serviço da API Cloud TPU". Não se esqueça de substituir PROJECT_NUMBER pelo número do seu projeto, que pode ser encontrado nas configurações do projeto no console Google Cloud . Para mais informações sobre agentes de serviço, consulte a documentação sobre agentes de serviço.

Cota excedida

Mensagem de erro

You have reached XXXX limit. Please request an increase for the 'YYYY' quota for
Compute Engine API by following https://cloud.google.com/docs/quotas/view-manage#requesting_higher_quota.

Solução

Seu projeto atingiu um limite de cota. Para saber mais sobre como trabalhar com cotas, consulte a documentação do Cloud Quotas. Não confunda com a cota de TPU, que rege o uso de pods de TPU.

Para pedir um aumento no limite adequado, siga as etapas listadas em Solicitar um ajuste de cota. Na página de cotas, pesquise a cota especificada pela parte "YYYY" desta mensagem. Algumas cotas são divididas em diferentes regiões ou serviços. A mensagem de erro vai indicar qual precisa ser aumentado.

As partes "XXXX" e "YYYY" da mensagem podem ser uma das seguintes opções:

  • HEALTH_CHECKS: cota "Verificações de integridade"
  • FIREWALLS: cota "Regras de firewall"
  • NETWORK_ENDPOINT_GROUPS: cota "Grupos de endpoints de rede" para esta região
  • READ_REQUESTS: cota "Solicitações de leitura por minuto" para o serviço da API Compute Engine.
  • OPERATION_READ_REQUESTS: cota "Solicitações de leitura de operações por minuto"

Essa solicitação geralmente é processada em até dois ou três dias úteis. Se o pedido for urgente, entre em contato com um engenheiro de clientes ou gerente técnico de contas.