Configurar o ambiente do Cloud TPU

Antes de poder usar os recursos do Cloud TPU para treinar ou executar inferência em modelos, siga estas etapas de configuração:

Configurar seu projeto do Google Cloud

Você precisa ter uma conta e um projeto do Google Cloud para usar o Cloud TPU.

  1. No console do Google Cloud, faça login na sua Conta do Google ou inscreva-se para uma nova conta.

  2. Instale a CLI do Google Cloud. A CLI do Google Cloud é uma interface para acessar e gerenciar recursos e serviços do Google Cloud.

  3. Selecione ou crie um projeto do Google Cloud:

    No console do Google Cloud, escolha ou crie um projeto do Cloud no seletor de projetos.

    No Cloud Shell, defina o ID do projeto usando a CLI gcloud. O ID do projeto é o nome do projeto mostrado no console do Google Cloud.

    $ gcloud config set project PROJECT-ID
    
  4. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

    A configuração do faturamento é obrigatória para todo o uso do Google Cloud. Você só será cobrado depois que começar a usar os recursos do Google Cloud. Para mais informações, consulte a documentação do Cloud Billing.

    O faturamento para o uso de todas as versões do Cloud TPU segue os preços regionais padrão mostrados na página de preços do Cloud TPU.

Configurar o ambiente para usar o Cloud TPU

Antes de solicitar um Cloud TPU, ative a API Cloud TPU e verifique se você tem permissões para gerenciar o acesso no projeto e criar um Cloud TPU. Também é recomendável criar uma conta de serviço gerenciado pelo usuário para anexar à TPU.

  1. Ative a API Cloud TPU no Console do Google Cloud ou usando a CLI gcloud no Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com
    

    Console

    1. No console do Google Cloud, acesse a página da API Cloud TPU.

    Acessar a página da API Cloud TPU

    1. Selecione Ativar.
  2. Verifique se você tem os seguintes papéis em seu projeto:

    Siga as instruções em Visualizar acesso atual para saber quem tem acesso ao projeto, pasta ou organização. Para ver seu próprio acesso, na coluna Principal, localize a linha que contém seu endereço de e-mail. Caso seu endereço de e-mail não esteja nessa coluna, você não tem papéis. Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os necessários.

    Se você não tiver um papel necessário, conceda-o ou peça a um administrador para fazer isso.

  3. Crie um agente de serviço do Cloud TPU:

    Os agentes de serviço, um tipo de identidade de serviço, são identidades de serviço mantidas pelo Google usadas pelo serviço do Cloud TPU para executar operações no seu projeto do Google Cloud. Por exemplo, o agente de serviço é usado para criar e gerenciar recursos do Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
    
  4. Crie uma conta de serviço da TPU:

    As contas de serviço funcionam como credenciais para as VMs da TPU. Os papéis anexados a uma conta de serviço concedem acesso aos recursos do Google Cloud. Recomendamos usar uma conta de serviço gerenciado pelo usuário, concedendo apenas as permissões exigidas pela VM da TPU. Ao usar uma conta serviço gerenciado pelo usuário, é preciso especificá-la ao criar uma VM de TPU usando a sinalização --service-account.

    1. Siga as instruções em Criar contas de serviço para criar uma conta de serviço gerenciado pelo usuário.

    2. Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à sua conta de serviço acesso aos serviços do Google Cloud acessados pela TPU. Os papéis a seguir são recomendados para que sua TPU acesse os serviços mais usados do Google Cloud.

Preparação para criar um Cloud TPU

Antes de criar um Cloud TPU, é preciso solicitar cota. Considere também o uso de recursos na fila e quais parâmetros você quer usar para configurar a TPU.

  1. Cota de solicitação:

    Para criar um Cloud TPU, o projeto do Google Cloud precisa ter uma cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela será criada. Por exemplo, se você quiser criar uma TPU v4-8 em us-central2-b, solicite uma cota de 8 núcleos TPU v4 em us-central2-b. Para mais informações sobre zonas em que o Cloud TPU está disponível, consulte Regiões e zonas da TPU.

    A cota é alocada de maneira diferente, dependendo da versão da TPU. Diferentes tipos de cota têm diferentes expectativas de disponibilidade. Para mais informações sobre alocação e tipos de cotas, e como solicitar cotas, consulte Cotas.

  2. Determine se você quer usar recursos na fila.

    Criar um Cloud TPU como um recurso na fila é uma prática recomendada. Os recursos na fila permitem que você receba a capacidade quando ela estiver disponível. Você pode especificar um horário de início e término opcional para preencher a solicitação.

    Há diferentes comandos da CLI gcloud para trabalhar com recursos na fila. Para mais informações, consulte o Guia do usuário de recursos em fila.

  3. Determine os parâmetros de criação do Cloud TPU:

    • Zona: defina a flag --zone como a zona em que você quer criar uma TPU. Você precisa ter uma cota alocada nesta zona. Para mais informações, consulte Regiões e zonas de TPU.

    • Configuração de TPU: se você não precisar especificar uma topologia personalizada ou estiver usando TPU v2 ou v3, defina a sinalização --accelerator-type como vVERSION-TENSORCORES. Substitua VERSION pelo número da versão da TPU que você quer usar. Substitua TENSORCORES pelo número de TensorCores que você quer usar.

      Se você quiser personalizar a topologia física da TPU, use as sinalizações --version e --topology. Defina a sinalização --version como a versão da TPU que você quer usar. Defina a sinalização --topology como a topologia que você quer usar.

      Para mais informações sobre configurações de TPU, incluindo configurações compatíveis e variantes de topologia, consulte Versões de TPU.

    • Versão do software: se você estiver solicitando um recurso na fila, defina a flag --runtime-version como o nome da versão do software que quer usar. Caso contrário, use a sinalização --version. As versões de software da TPU estão disponíveis para frameworks do TensorFlow, do PyTorch e do JAX. Para mais informações sobre as versões de software compatíveis, consulte Versões de software da VM da TPU.

    • Conta de serviço: defina --service-account como o endereço de e-mail de uma conta de serviço, se tiver criado uma, para anexar a conta de serviço à TPU. Se estiver vazia, a conta de serviço padrão do Compute Engine será usada.

    • Tipo de cota: adicione a sinalização que corresponde ao tipo de cota que você quer usar:

      Tipo da cota Flag
      Reservado --reserved
      VMs spot --spot
      Preemptiva usando recursos em fila --best-effort
      A preemptiva não usa recursos na fila --preemptible
      Sob demanda Nenhuma sinalização adicional necessária
    • Configuração avançada: é possível adicionar outras sinalizações à solicitação para configurar a TPU. Consulte a documentação do gcloud compute tpus tpu-vm create e as seções a seguir em Gerenciar TPUs para mais informações:

Para exemplos de como criar um Cloud TPU, consulte Primeiros passos.

A seguir

  1. Aprenda a criar e gerenciar recursos de VM e TPU
  2. Execute um guia de início rápido do Cloud TPU.