Configurar o ambiente do Cloud TPU

Antes de usar os recursos do Cloud TPU para treinar ou executar inferência em modelos, siga estas etapas:

Configurar o projeto do Google Cloud

Você precisa ter uma conta e um projeto do Google Cloud para usar o Cloud TPU.

  1. No console doGoogle Cloud , faça login na sua Conta do Google ou inscreva-se em uma nova conta.

  2. Crie um projeto do Google Cloud . Para saber mais, consulte Criar um projeto.

  3. Ative o faturamento para o projeto do Google Cloud .

    A configuração de faturamento é obrigatória para usar o Google Cloud . Você só vai receber cobranças depois que começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.

    O faturamento do uso de todas as versões do Cloud TPU segue os preços regionais padrão mostrados na página de preços do Cloud TPU.

  4. Instale a CLI do Google Cloud. A CLI do Google Cloud é um conjunto de bibliotecas e ferramentas para acessar e gerenciar os recursos e serviços do Google Cloud .

  5. Configure o comando gcloud instalado como parte da CLI do Google Cloud.

    Execute os comandos a seguir para configurar a gcloud e usar o projeto do Google Cloud.

    $ gcloud config set project PROJECT_ID
  6. Verifique se o faturamento está ativado para o projeto do Google Cloud .

    A configuração de faturamento é obrigatória para usar o Google Cloud . Você só vai receber cobranças depois que começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.

    O faturamento do uso de todas as versões do Cloud TPU segue os preços regionais padrão mostrados na página de preços do Cloud TPU.

Configurar o ambiente para usar o Cloud TPU

Antes de solicitar um Cloud TPU, ative a API Cloud TPU e verifique se você tem permissões para gerenciar o acesso no projeto e criar um Cloud TPU. Também recomendamos que você crie uma conta de serviço gerenciada pelo usuário para anexar à TPU.

  1. Ative a API Cloud TPU no console do Google Cloud ou usando a gcloud CLI no Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com

    Console

    1. No console do Google Cloud , acesse a página da API Cloud TPU.

    Acessar a página da API Cloud TPU

    1. Clique em Ativar.
  2. Verifique se você tem os seguintes papéis no projeto:

    Siga as instruções em Conferir o acesso atual para saber quais principais têm acesso ao projeto, à pasta ou à organização. Para conferir seu próprio acesso, na coluna Principal, encontre a linha que tem seu endereço de e-mail. Se o seu endereço de e-mail não está nessa coluna, você não tem papéis. Na coluna Papel da linha que tem seu endereço de e-mail, verifique se a lista inclui os papéis necessários.

    Se você não tiver um papel necessário, conceda esse papel ou peça que um administrador faça isso.

  3. Crie um agente de serviço do Cloud TPU:

    Os agentes de serviço são um tipo de identidade de serviço mantida pelo Google que é usada pelo serviço Cloud TPU para realizar operações no projeto do Google Cloud . Por exemplo, o agente de serviço é usado para criar e gerenciar recursos do Cloud TPU.

      $ gcloud beta services identity create --service tpu.googleapis.com --project PROJECT_ID
  4. Crie uma conta de serviço de TPU:

    As contas de serviço funcionam como credenciais para as VMs de TPU. Os papéis anexados a uma conta de serviço concedem acesso a recursos do Google Cloud . Recomendamos usar uma conta de serviço gerenciada pelo usuário e conceder apenas as permissões necessárias para a VM de TPU. Para usar uma conta de serviço gerenciada pelo usuário, especifique-a ao criar uma VM de TPU usando a flag --service-account.

    1. Siga as instruções em Criar contas de serviço para criar uma conta de serviço gerenciada pelo usuário.

    2. Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à conta de serviço acesso aos serviços do Google Cloud que a TPU vai acessar. Os papéis a seguir são recomendados para que a TPU acesse serviços doGoogle Cloud que são usados com frequência.

Preparação para criar um Cloud TPU

Antes de criar um Cloud TPU, é necessário solicitar cota. Também recomendamos considerar o uso de recursos em fila e os parâmetros que você quer usar para configurar a TPU.

  1. Escolha uma opção de consumo.

    As opções de consumo são os métodos usados para solicitar capacidade do Cloud TPU. Escolha uma opção de consumo com base nos seguintes fatores:

    • A rapidez com que você precisa da capacidade.
    • Por quanto tempo você precisa da capacidade.
    • Se você precisa da capacidade por um período fixo ou flexível.
    • Se a capacidade pode ser interrompida.
    • Preços

    Para mais informações, consulte Opções de consumo do Cloud TPU.

  2. Faça uma solicitação de cota:

    As cotas de TPU são limites quanto ao número de núcleos do Cloud TPU que podem ser usados com um projeto doGoogle Cloud . Cada versão de TPU está associada a uma cota própria. Para criar um Cloud TPU, o projeto do Google Cloud precisa ter cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela será criada. Para mais informações sobre alocação, tipos e solicitações de cota, consulte Cotas.

    Ao criar TPUs com o Google Kubernetes Engine ou a Vertex AI, você precisa ter cota para esses serviços. Para mais informações sobre as cotas do GKE, consulte Planejar a configuração da TPU com o GKE. Para mais informações sobre as cotas da Vertex AI, consulte Cotas e limites da Vertex AI.

  3. Determine se você quer usar recursos em fila.

    Criar um Cloud TPU como um recurso em fila é uma prática recomendada. Os recursos em fila permitem que você receba capacidade assim que ela estiver disponível. Você pode especificar um horário de início e de término opcional para quando a solicitação deve ser atendida.

    Há diferentes comandos da gcloud CLI para trabalhar com recursos em fila. Para mais informações, consulte o guia do usuário sobre recursos em fila.

  4. Determine os parâmetros de criação do Cloud TPU:

    • Zona: defina a flag --zone com a zona em que você quer criar uma TPU. Você precisa ter cota alocada nessa zona. Para mais informações, consulte Regiões e zonas de TPU.

    • Configuração de TPU: se não for preciso especificar uma topologia personalizada ou você estiver usando a TPU v2 ou v3, defina a flag --accelerator-type como vVERSION-TENSORCORES. Substitua VERSION pelo número da versão de TPU que você quer usar. Substitua TENSORCORES pelo número de TensorCores que você quer usar.

      Para personalizar a topologia física da TPU, use as flags --version e --topology. Defina a flag --version com a versão de TPU que você quer usar. Defina a flag --topology com a topologia que você quer usar.

      Para mais informações sobre as configurações de TPU, incluindo configurações e variantes de topologia disponíveis, consulte Versões de TPU.

    • Versão do software: ao solicitar um recurso em fila, defina a flag --runtime-version com o nome da versão do software que você quer usar. Caso contrário, use a flag --version. As versões de software de TPU estão disponíveis para os frameworks TensorFlow, PyTorch e JAX. Para mais informações sobre as versões de software disponíveis, consulte Versões de software de VMs de TPU.

    • Conta de serviço: defina --service-account com o endereço de e-mail de uma conta de serviço, se você tiver criado uma, para anexá-la à TPU. Se o campo ficar em branco, a conta de serviço padrão do Compute Engine será usada.

    • Tipo de cota: adicione a flag que corresponde ao tipo de cota que você quer usar:

      Tipo de cota Flag
      Reservada --reserved
      VMs spot --spot
      Preemptiva (indisponível para recursos em fila; use --spot). --preemptible
      On demand Nenhuma flag adicional é necessária.
    • Configuração avançada: é possível adicionar outras flags à solicitação para configurar a TPU. Consulte a documentação de gcloud compute tpus tpu-vm create e as seções abaixo para mais informações:

Para conferir exemplos de como criar um Cloud TPU, consulte Introdução.

A seguir

  1. Saiba como criar e gerenciar recursos de VM e TPU.
  2. Confira um guia de início rápido do Cloud TPU.