Glossário de erros do Cloud TPU
Neste documento, fornecemos um glossário de erros comuns com soluções do serviço do Cloud TPU.
Tipo de acelerador inválido
Mensagem de erro
generic::invalid_argument: Accelerator type v2-512 as preemptible (false) and reserved (false) is not available in zone us-central1-a, please contact support.
Solução
Um parâmetro inválido foi fornecido para o comando create. A disponibilidade de um acelerador em uma zona depende de três parâmetros: o tipo, a sinalização preemptiva e a sinalização reservada. As sinalizações preemptivas e reservadas podem ser alteradas incluindo-as ou excluindo-as no comando create.
Uma TPU criada com a sinalização reservada usará a capacidade reservada. A inclusão da sinalização preemptiva permitirá que a TPU seja interrompida por TPUs de prioridade mais alta. Se nenhum for fornecido, a TPU estará sob demanda. Não é uma configuração válida para ativar ambas as sinalizações. Consulte a documentação sobre como criar comandos para mais informações.
Os tipos de acelerador disponíveis em cada zona podem ser encontrados na documentação das regiões e zonas de TPU. Se preferir, consulte o comando de lista de tipos de acelerador. Altere o comando de criação para usar um desses tipos de acelerador e tente novamente ou entre em contato com o suporte se o problema persistir.
Rede não encontrada
Mensagem de erro
Cloud TPU received a bad request. The field "Network" cannot be "xxxx": requested resource not found
Solução
A rede xxxx não foi encontrada. Verifique se a rede foi criada e configurada corretamente. Para mais informações, acesse https://cloud.google.com/vpc/docs/create-modify-vpc-networks.
Permissão da conta de serviço negada
Mensagem de erro
generic::permission_denied: Cloud TPU got permissions denied when trying to access the customer project. Make sure that the IAM account 'service-[project number]@cloud-tpu.iam.gserviceaccount.com' has the 'Cloud TPU API Service Agent' role by following https://cloud.google.com/iam/docs/manage-access-service-accounts
Solução
Esse erro ocorre quando um usuário tenta criar ou listar nós em um projeto
sem autorização do IAM. Uma causa provável para esse problema é que a conta de serviço da Cloud TPU API não tem o papel necessário para o projeto. A documentação Gerenciar contas de acesso fornece uma visão geral de como gerenciar o acesso. Siga as etapas em Conceder ou revogar um único papel e atribua à conta "service-PROJECT_NUMBER
@cloud-tpu.iam.gserviceaccount.com" o papel de "Agente de serviço da API Cloud TPU". Lembre-se de substituir PROJECT_NUMBER
pelo número do projeto, que pode ser encontrado nas configurações do projeto no Console do Google Cloud. Para mais informações sobre agentes de serviço, consulte a documentação dos agentes de serviço.
Cota excedida
Mensagem de erro
You have reached XXXX limit. Please request an increase for the 'YYYY' quota for Compute Engine API by following https://cloud.google.com/docs/quota#requesting_higher_quota.
Solução
Seu projeto alcançou o limite da cota. Para saber mais sobre como trabalhar com cotas, consulte https://cloud.google.com/docs/quota. Não confunda com a cota de TPU, que rege o uso dos pods.
Você pode solicitar um aumento para o limite apropriado seguindo as etapas listadas em https://cloud.google.com/docs/quota_detail/view_manage#requesting_high_quota. Na página de cotas, pesquise a cota especificada pela parte "AAAA" desta mensagem. Algumas cotas são divididas em diferentes regiões ou serviços. A mensagem de erro indicará qual precisa ser aumentada.
As partes "XXXX" e "AAAA" da mensagem podem ser uma das seguintes: * HEALTH_CHECKS - cota "Verificações de integridade" * FIREWALLS - Cota de "Regras de firewall" * NETWORK_ENDPOINT_GROUPS - Cota de "Grupos de endpoints da rede" para esta região * READ_REQUESTS - Cota de "Solicitações de leitura por minuto" para o serviço da API do Compute Engine" * Operation__
Essa solicitação normalmente é processada em dois a três dias úteis. Se a solicitação for urgente, entre em contato com um engenheiro de clientes ou um gerente técnico de contas.