Configurar o ambiente do Cloud TPU

Antes de usar os recursos do Cloud TPU para treinar ou executar inferência em modelos, é preciso seguir estas etapas de configuração:

Configurar seu projeto do Google Cloud

É preciso ter uma conta e um projeto do Google Cloud para usar a Cloud TPU.

  1. No console do Google Cloud, faça login na sua Conta do Google ou inscreva-se para uma nova conta.

  2. Instale a CLI do Google Cloud. A CLI do Google Cloud é uma interface para acessar e gerenciar recursos e serviços do Google Cloud.

  3. Selecione ou crie um projeto do Google Cloud:

    No console do Google Cloud, selecione ou crie um projeto do Cloud no seletor de projetos.

    No Cloud Shell, defina o ID do projeto usando a CLI gcloud. O ID do projeto é o nome mostrado no console do Google Cloud.

    $ gcloud config set project PROJECT-ID
    
  4. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

    A configuração de faturamento é obrigatória para todo o uso do Google Cloud. Você só será cobrado depois que começar a usar os recursos do Google Cloud. Para mais informações, consulte a documentação do Cloud Billing.

    O faturamento de todas as versões do Cloud TPU segue os preços regionais padrão mostrados na página de preços do Cloud TPU.

Configurar o ambiente para usar o Cloud TPU

Antes de solicitar um Cloud TPU, ative a API Cloud TPU e verifique se você tem permissões para gerenciar o acesso no projeto e criar uma Cloud TPU. Também é recomendável criar uma conta de serviço gerenciado pelo usuário para anexar à TPU.

  1. Ative a API Cloud TPU no console do Google Cloud ou usando a CLI gcloud no Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com
    

    Console

    1. No console do Google Cloud, acesse a página da API Cloud TPU.

    Acessar a página da API Cloud TPU

    1. Selecione Ativar.
  2. Verifique se você tem os seguintes papéis no projeto:

    Siga as instruções em Visualizar acesso atual para saber quem tem acesso ao seu projeto, pasta ou organização. Para ver seu próprio acesso, encontre a linha que tem seu endereço de e-mail na coluna Principal. Se o seu endereço de e-mail não estiver nessa coluna, você não tem nenhuma função. Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.

    Se você não tiver um papel obrigatório, conceda-o ou peça a um administrador para fazer isso.

  3. Crie um agente de serviço da Cloud TPU:

    Os agentes de serviços, um tipo de identidade de serviço, são identidades de serviço mantidas pelo Google e usadas pelo serviço do Cloud TPU para executar operações no projeto do Google Cloud. Por exemplo, o agente de serviço é usado para criar e gerenciar recursos do Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
    
  4. Crie uma conta de serviço da TPU:

    As contas de serviço funcionam como credenciais para as VMs da TPU. Os papéis anexados a uma conta de serviço concedem acesso aos recursos do Google Cloud. Recomendamos usar uma conta de serviço gerenciado pelo usuário, concedendo apenas as permissões exigidas pela VM da TPU. Ao usar uma conta serviço gerenciado pelo usuário, é preciso especificá-la ao criar uma VM da TPU usando a sinalização --service-account.

    1. Siga as instruções em Criar contas de serviço para criar uma conta de serviço gerenciada pelo usuário.

    2. Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à sua conta de serviço acesso aos serviços do Google Cloud que a TPU acessará. Os papéis a seguir são recomendados para que a TPU acesse os serviços do Google Cloud mais usados.

Preparação para criar um Cloud TPU

Antes de criar um Cloud TPU, é preciso solicitar uma cota. Pense também em usar recursos na fila, bem como quais parâmetros você quer usar para configurar a TPU.

  1. Solicitação de cotas:

    Para criar um Cloud TPU, seu projeto do Google Cloud precisa ter uma cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela será criada. Por exemplo, se você quiser criar uma TPU v4-8 em us-central2-b, solicite uma cota de 8 núcleos da TPU v4 em us-central2-b. Para mais informações sobre as zonas em que o Cloud TPU está disponível, consulte Regiões e zonas da TPU.

    A cota é alocada de maneira diferente dependendo da versão da TPU. Diferentes tipos de cota têm expectativas de disponibilidade distintas. Para mais informações sobre alocação de cota, tipos de cota e como solicitar cota, consulte Cotas.

  2. Determine se você quer usar recursos na fila.

    Criar uma Cloud TPU como um recurso em fila é uma prática recomendada. Os recursos na fila permitem que você receba capacidade quando ela estiver disponível. Você pode especificar um horário opcional de início e término para o preenchimento da solicitação.

    Há diferentes comandos da CLI gcloud para trabalhar com recursos na fila. Para mais informações, consulte o Guia do usuário para recursos na fila.

  3. Determine os parâmetros de criação da Cloud TPU:

    • Zona: defina a sinalização --zone como a zona em que você quer criar uma TPU. É preciso ter uma cota alocada nesta zona. Para mais informações, consulte Regiões e zonas da TPU.

    • Configuração de TPU: se você não precisar especificar uma topologia personalizada ou estiver usando a TPU v2 ou v3, defina a sinalização --accelerator-type como vVERSION-TENSORCORES. Substitua VERSION pelo número da versão da TPU que você quer usar. Substitua TENSORCORES pelo número de TensorCores que você quer usar.

      Para personalizar a topologia física da TPU, use as sinalizações --version e --topology. Defina a sinalização --version como a versão da TPU que você quer usar. Defina a sinalização --topology como a topologia que você quer usar.

      Para mais informações sobre configurações de TPU, incluindo configurações compatíveis e variantes de topologia, consulte Versões de TPUs.

    • Versão do software: se você estiver solicitando um recurso na fila, defina a sinalização --runtime-version como o nome da versão do software que você quer usar. Caso contrário, use a sinalização --version. As versões do software de TPU estão disponíveis para os frameworks do TensorFlow, PyTorch e JAX. Para mais informações sobre as versões de software compatíveis, consulte Versões de software da VM de TPU.

    • Conta de serviço: defina --service-account como o endereço de e-mail de uma conta de serviço, caso tenha criado uma, para anexar essa conta à sua TPU. Se estiver vazia, a conta de serviço padrão do Compute Engine será usada.

    • Tipo de cota: se você quiser criar uma TPU usando cota reservada, adicione a sinalização --reserved à solicitação.

      Se você quiser criar uma TPU usando a cota preemptiva e solicitar um recurso na fila, adicione a sinalização --best-effort à solicitação.

      Se você quiser criar uma TPU usando a cota preemptiva e não estiver solicitando um recurso na fila, adicione a sinalização --preemptible à solicitação.

      Se quiser criar uma TPU usando a cota sob demanda, não será preciso adicionar outras sinalizações.

    • Configuração avançada: é possível adicionar outras sinalizações à solicitação para configurar a TPU. Consulte a documentação do gcloud compute tpus tpu-vm create e as seções a seguir em Gerenciar TPUs para mais informações:

Para exemplos de como criar um Cloud TPU, consulte os Primeiros passos.

A seguir

  1. Saiba como criar e gerenciar recursos de VM e TPU
  2. Execute um guia de início rápido do Cloud TPU.