Configurar o ambiente do Cloud TPU

Antes de usar os recursos do Cloud TPU para treinar ou executar inferências em modelos, siga estas etapas de configuração:

Configurar seu projeto do Google Cloud

É necessário ter uma conta e um projeto do Google Cloud para usar o Cloud TPU.

  1. No console do Google Cloud, faça login na sua Conta do Google ou crie uma nova conta.

  2. Instale a CLI do Google Cloud. A Google Cloud CLI é uma interface para acessar e gerenciar recursos e serviços do Google Cloud.

  3. Selecione ou crie um projeto do Google Cloud:

    No console do Google Cloud, selecione ou crie um projeto do Cloud no seletor de projetos.

    No Cloud Shell, defina o ID do projeto usando a CLI gcloud. O ID do projeto é o nome do seu projeto mostrado no console do Google Cloud.

    $ gcloud config set project PROJECT-ID
  4. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

    A configuração de faturamento é necessária para todo o uso do Google Cloud. Você só vai receber cobranças depois de começar a usar os recursos do Google Cloud. Para mais informações, consulte a documentação do Cloud Billing.

    O faturamento do uso de todas as versões da Cloud TPU segue o preço regional padrão exibido na página de preços da Cloud TPU.

Configurar o ambiente para usar o Cloud TPU

Antes de solicitar um Cloud TPU, é necessário ativar a API Cloud TPU e verificar se você tem permissões para gerenciar o acesso no projeto e criar um Cloud TPU. Também é recomendável criar uma conta de serviço gerenciado pelo usuário para anexar à TPU.

  1. Ative a API Cloud TPU no console do Google Cloud ou usando a CLI gcloud no Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com

    Console

    1. No console do Google Cloud, acesse a página da API Cloud TPU.

    Acessar a página da API Cloud TPU

    1. Clique em Ativar.
  2. Verifique se você tem os seguintes papéis no projeto:

    Siga as instruções em Acessar o acesso atual para saber quem tem acesso ao seu projeto, pasta ou organização. Para conferir seu próprio acesso, na coluna Participante, encontre a linha que contém seu endereço de e-mail. Caso seu endereço de e-mail não esteja nessa coluna, isso significa que você não tem papéis. Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.

    Se você não tiver um papel obrigatório, conceda o papel ou peça a um administrador para fazer isso.

  3. Crie um agente de serviço do Cloud TPU:

    Os agentes de serviço, um tipo de identidade de serviço, são mantidos pelo Google e usados pelo serviço do Cloud TPU para realizar operações no seu projeto do Google Cloud. Por exemplo, o agente de serviço é usado para criar e gerenciar recursos do Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
  4. Crie uma conta de serviço do TPU:

    As contas de serviço funcionam como credenciais para suas VMs do TPU. Os papéis associados a uma conta de serviço concedem acesso aos recursos do Google Cloud. Recomendamos o uso de uma conta de serviço gerenciado pelo usuário, concedendo apenas as permissões exigidas pela VM do TPU. Ao usar uma conta serviço gerenciado pelo usuário, é necessário especificá-la ao criar uma VM de TPU usando a flag --service-account.

    1. Siga as instruções em Criar contas de serviço para criar uma conta de serviço gerenciado pelo usuário.

    2. Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à sua conta de serviço acesso aos serviços do Google Cloud que a TPU vai acessar. As funções a seguir são recomendadas para que a TPU acesse os serviços do Google Cloud usados com frequência.

Preparar-se para criar uma Cloud TPU

Antes de criar um Cloud TPU, é necessário solicitar a cota. Também é recomendável usar recursos em fila e quais parâmetros você quer usar para configurar a TPU.

  1. Solicitar cota:

    Para criar um Cloud TPU, seu projeto do Google Cloud precisa ter cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela será criada. Por exemplo, se você quiser criar uma TPU v4-8 em us-central2-b, solicite uma cota de 8 núcleos de TPU v4 em us-central2-b. Para mais informações sobre as zonas em que o Cloud TPU está disponível, consulte Regiões e zonas de TPU.

    A cota é alocada de maneira diferente dependendo da versão da TPU. Diferentes tipos de cota têm expectativas de disponibilidade diferentes. Para mais informações sobre a alocação de cotas, os tipos de cota e como solicitar cota, consulte Cotas.

  2. Determine se você quer usar recursos em fila.

    Criar um Cloud TPU como um recurso enfileirado é uma prática recomendada. Os recursos em fila permitem que você receba capacidade quando ela estiver disponível. É possível especificar um horário de início e término opcional para quando a solicitação precisa ser preenchida.

    Existem diferentes comandos da CLI gcloud para trabalhar com recursos em fila. Para mais informações, consulte o guia do usuário sobre recursos em fila.

  3. Determine os parâmetros de criação do Cloud TPU:

    • Zona: defina a flag --zone para a zona em que você quer criar uma TPU. É necessário ter cota alocada nessa zona. Para mais informações, consulte Regiões e zonas de TPU.

    • Configuração de TPU: se você não precisar especificar uma topologia personalizada ou estiver usando TPU v2 ou v3, defina a flag --accelerator-type como vVERSION-TENSORCORES. Substitua VERSION pelo número da versão da TPU que você quer usar. Substitua TENSORCORES pelo número de TensorCores que você quer usar.

      Se você quiser personalizar a topologia física da TPU, use as flags --version e --topology. Defina a flag --version como a versão da TPU que você quer usar. Defina a flag --topology como a topologia que você quer usar.

      Para mais informações sobre as configurações de TPU, incluindo as configurações com suporte e as variantes de topologia, consulte Versões de TPU.

    • Versão do software: se você estiver solicitando um recurso em fila, defina a flag --runtime-version como o nome da versão do software que você quer usar. Caso contrário, use a flag --version. As versões do software de TPU estão disponíveis para os frameworks TensorFlow, PyTorch e JAX. Para mais informações sobre as versões de software com suporte, consulte Versões de software da VM de TPU.

    • Conta de serviço: defina --service-account como o endereço de e-mail de uma conta de serviço, se você criou uma, para anexar a conta de serviço ao TPU. Se estiver vazio, a conta de serviço padrão do Compute Engine será usada.

    • Tipo de cota: adicione a flag que corresponde ao tipo de cota que você quer usar:

      Tipo da cota Sinalização
      Reservado --reserved
      VMs spot --spot
      Preemptivo (não disponível para recursos em fila. Use --spot) --preemptible
      Sob demanda Nenhuma flag adicional é necessária
    • Configuração avançada: é possível adicionar flags adicionais à solicitação para configurar o TPU. Consulte a documentação do gcloud compute tpus tpu-vm create e as seções a seguir para mais informações:

Para conferir exemplos de como criar uma Cloud TPU, consulte Começar.

A seguir

  1. Saiba como criar e gerenciar recursos de VM e TPU.
  2. Executar um guia de início rápido do Cloud TPU