Configurar o ambiente do Cloud TPU

Antes de poder usar os recursos do Cloud TPU para treinar ou executar inferência em modelos, siga estas etapas de configuração:

Configurar seu projeto do Google Cloud

É necessário ter uma conta e um projeto do Google Cloud para usar o Cloud TPU.

  1. No console do Google Cloud, faça login na sua Conta do Google ou criar uma nova conta.

  2. Instale a CLI do Google Cloud. A Google Cloud CLI é uma interface para acessar e gerenciar recursos e serviços do Google Cloud.

  3. Selecione ou crie um projeto do Google Cloud:

    No console do Google Cloud, selecione ou crie um projeto do Cloud no seletor de projetos.

    No Cloud Shell, defina o ID do projeto usando a CLI gcloud. O ID do projeto é o nome do projeto mostrado no console do Google Cloud.

    $ gcloud config set project PROJECT-ID
  4. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

    A configuração do faturamento é obrigatória para todo o uso do Google Cloud. Você só vai receber cobranças depois de começar a usar os recursos do Google Cloud. Para mais informações, consulte a documentação do Cloud Billing.

    O faturamento para o uso de todas as versões do Cloud TPU segue os preços regionais padrão mostrado na página de preços do Cloud TPU.

Configurar o ambiente para usar o Cloud TPU

Antes de solicitar um Cloud TPU, é necessário ativar a API Cloud TPU e verificar se você tem permissões para gerenciar o acesso no projeto e criar um Cloud TPU. Também é recomendável criar uma conta de serviço gerenciada pelo usuário para anexar à TPU.

  1. Ative a API Cloud TPU no console do Google Cloud ou usando o CLI gcloud no Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com

    Console

    1. No console do Google Cloud, acesse a página da API Cloud TPU.

    Acessar a página da API Cloud TPU

    1. Clique em Ativar.
  2. Verifique se você tem os seguintes papéis em seu projeto:

    Siga as instruções Visualizar o acesso atual para ver que tem acesso ao projeto, pasta ou organização. Para conferir seu próprio acesso, na coluna Participante, encontre a linha que contém seu endereço de e-mail. Caso seu endereço de e-mail não esteja nessa coluna, você não tem papéis. Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.

    Se você não tiver um papel obrigatório, conceda o papel ou peça a um administrador para fazer isso.

  3. Crie um agente de serviço do Cloud TPU:

    Os agentes de serviço, um tipo de identidade de serviço, são Identidades de serviço mantidas pelo Google que são usadas pelo serviço do Cloud TPU para executar operações no seu projeto do Google Cloud. Por exemplo, o serviço é usado para criar e gerenciar recursos da Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
  4. Crie uma conta de serviço da TPU:

    As contas de serviço funcionam como credenciais para suas VMs do TPU. Os papéis associados a uma conta de serviço concedem acesso aos recursos do Google Cloud. Recomendamos o uso de um conta de serviço gerenciado pelo usuário, concedendo apenas as permissões exigidas pelos VM da TPU. Ao usar uma conta serviço gerenciado pelo usuário, você precisa especificá-la ao você estiver criando uma VM de TPU usando a sinalização --service-account.

    1. Siga as instruções em Criar contas de serviço. para criar uma conta de serviço gerenciado pelo usuário.

    2. Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à sua conta de serviço acesso aos serviços do Google Cloud que a TPU vai acessar. O os papéis a seguir são recomendados para que sua TPU acesse os dados mais usados serviços do Google Cloud.

Preparação para criar um Cloud TPU

Antes de criar um Cloud TPU, é necessário solicitar a cota. Considere também usando recursos na fila, bem como os parâmetros que você quer usar para configurar a TPU.

  1. Cota de solicitação:

    Para criar um Cloud TPU, seu projeto do Google Cloud precisa ter cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela será criada. Por exemplo, se você quiser criar uma TPU v4-8 em us-central2-b, solicite uma cota de 8 núcleos de TPU v4 em us-central2-b. Para mais informações sobre zonas em que o Cloud TPU está disponível, consulte Regiões e zonas de TPU.

    A cota é alocada de maneira diferente, dependendo da versão da TPU. Tipos diferentes de cota têm diferentes expectativas de disponibilidade. Para mais informações sobre a alocação de cotas, os tipos de cota e como solicitar cota, consulte Cotas.

  2. Determine se você quer usar recursos em fila.

    Criar um Cloud TPU como um recurso na fila é uma prática recomendada. Os recursos em fila permitem que você receba capacidade quando ela estiver disponível. É possível especificar um horário de início e término opcional para quando a solicitação precisa ser preenchida.

    Existem diferentes comandos da gcloud CLI para trabalhar com recursos em fila. Para mais informações, consulte o guia do usuário sobre recursos em fila.

  3. Determine os parâmetros de criação do Cloud TPU:

    • Zona: defina a flag --zone para a zona em que você quer criar uma TPU. É necessário ter cota alocada nessa zona. Para mais informações, consulte Regiões e zonas de TPU.

    • Configuração de TPU: se não for preciso especificar uma topologia personalizada. você estiver usando TPU v2 ou v3, defina a sinalização --accelerator-type como vVERSION-TENSORCORES. Substituir VERSION pelo número da versão da TPU que você quer usar. Substituir TENSORCORES pelo número de TensorCores que você quer usar.

      Se você quiser personalizar a topologia física da TPU, use as flags --version e --topology. Defina a flag --version como a TPU que você quer usar. Defina a flag --topology como a topologia que você quer usar.

      Para mais informações sobre as configurações de TPU, incluindo as configurações com suporte e as variantes de topologia, consulte Versões de TPU.

    • Versão do software: se você estiver solicitando um recurso em fila, defina a flag --runtime-version como o nome da versão do software que você quer usar. Caso contrário, use a sinalização --version. Versões de software da TPU estão disponíveis para frameworks do TensorFlow, do PyTorch e do JAX. Para mais informações sobre as versões de software com suporte, consulte Versões de software de VM de TPU.

    • Conta de serviço: defina --service-account como o endereço de e-mail de uma conta de serviço, se você tiver criado uma, para anexar a conta de serviço ao TPU. Se estiver vazia, a conta de serviço padrão do Compute Engine será usado.

    • Tipo de cota: adicione a flag que corresponde ao tipo de cota que você quer usar:

      Tipo da cota Sinalização
      Reservado --reserved
      VMs spot --spot
      Preemptiva (não disponível para recursos na fila; use --spot). --preemptible
      Sob demanda Nenhuma sinalização adicional necessária
    • Configuração avançada: é possível adicionar flags adicionais à solicitação para configurar o TPU. Consulte a documentação do gcloud compute tpus tpu-vm create. e nas seções a seguir para mais informações:

Para conferir exemplos de como criar uma Cloud TPU, consulte Começar.

A seguir

  1. Aprenda a criar e gerenciar recursos de VM e TPU
  2. Execute um guia de início rápido do Cloud TPU.