Configurar o ambiente do Cloud TPU

Antes de usar os recursos do Cloud TPU para treinar ou executar inferência em modelos, é preciso seguir estas etapas de configuração:

Configurar seu projeto do Google Cloud

É preciso ter uma conta e um projeto do Google Cloud para usar a Cloud TPU.

  1. No console do Google Cloud, faça login na sua Conta do Google ou inscreva-se para uma nova conta.

  2. Instale a CLI do Google Cloud. A CLI do Google Cloud é uma interface para acessar e gerenciar recursos e serviços do Google Cloud.

  3. Selecione ou crie um projeto do Google Cloud:

    No Console do Google Cloud, selecione ou crie um projeto do Cloud usando o seletor de projetos.

    No Cloud Shell, defina o ID do projeto usando a CLI gcloud. O ID do projeto é o nome mostrado no console do Google Cloud.

    $ gcloud config set project PROJECT-ID
    
  4. Verifique se a cobrança está ativada para o seu projeto do Google Cloud.

    A configuração de faturamento é obrigatória para todo o uso do Google Cloud. Você só será cobrado depois que começar a usar os recursos do Google Cloud. Para mais informações, consulte a documentação do Cloud Billing.

    O faturamento de todas as versões do Cloud TPU segue os preços regionais padrão mostrados na página de preços do Cloud TPU.

Configurar o ambiente para usar o Cloud TPU

Antes de solicitar um Cloud TPU, ative a API Cloud TPU e verifique se você tem permissões para gerenciar o acesso no projeto e criar uma Cloud TPU. Também é recomendável criar uma conta de serviço gerenciado pelo usuário para anexar à TPU.

  1. Ative a API Cloud TPU no console do Google Cloud ou usando a CLI gcloud no Cloud Shell:

    gcloud

    $ gcloud services enable tpu.googleapis.com
    

    Console

    1. No console do Google Cloud, acesse a página da API Cloud TPU.

    Acessar a página da API Cloud TPU

    1. Selecione Ativar.
  2. Verifique se você tem os seguintes papéis no projeto:

    Siga as instruções em Visualizar acesso atual para saber quem tem acesso ao seu projeto, pasta ou organização. Para ver seu próprio acesso, encontre a linha que tem seu endereço de e-mail na coluna Principal. Se o seu endereço de e-mail não estiver nessa coluna, você não tem nenhuma função. Na coluna Papel da linha com seu endereço de e-mail, verifique se a lista de papéis inclui os papéis necessários.

    Se você não tiver um papel obrigatório, conceda-o ou peça a um administrador para fazer isso.

  3. Crie uma conta de serviço da TPU:

    As contas de serviço permitem que o serviço do Cloud TPU acesse outros serviços do Google Cloud. Uma conta de serviço gerenciado pelo usuário é uma prática recomendada do Google Cloud. Anexe uma conta de serviço à TPU ao criá-la usando a sinalização --service-account.

    1. Siga as instruções em Criar contas de serviço para criar uma conta de serviço.

    2. Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à sua conta de serviço acesso aos serviços do Google Cloud que a TPU acessará. Os papéis a seguir são recomendados para que a TPU acesse os serviços do Google Cloud mais usados.

Preparação para criar um Cloud TPU

Antes de criar um Cloud TPU, é necessário solicitar uma cota. Considere também usar recursos na fila, bem como quais parâmetros você quer usar para configurar a TPU.

  1. Solicitação de cotas:

    Para criar um Cloud TPU, seu projeto do Google Cloud precisa ter uma cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela será criada. Por exemplo, se você quiser criar uma TPU v4-8 em us-central2-b, solicite uma cota de 8 núcleos da TPU v4 em us-central2-b. Para mais informações sobre as zonas em que o Cloud TPU está disponível, consulte Regiões e zonas da TPU.

    A cota é alocada de maneira diferente dependendo da versão da TPU. Diferentes tipos de cota têm expectativas de disponibilidade distintas. Para mais informações sobre alocação de cotas, tipos de cota e como solicitá-las, consulte Cotas.

  2. Determine se você quer usar recursos na fila.

    Criar uma Cloud TPU como um recurso em fila é uma prática recomendada. Os recursos na fila permitem que você receba capacidade quando ela estiver disponível. Você pode especificar um horário opcional de início e término para o preenchimento da solicitação.

    Há diferentes comandos da CLI gcloud para trabalhar com recursos na fila. Para mais informações, consulte o Guia do usuário de Recursos na fila.

  3. Determine os parâmetros de criação da Cloud TPU:

    • Zona: defina a sinalização --zone como a zona em que você quer criar uma TPU. É preciso ter uma cota alocada nesta zona. Para mais informações, consulte Regiões e zonas da TPU.

    • Configuração de TPU: se você não precisar especificar uma topologia personalizada ou estiver usando a TPU v2 ou v3, defina a sinalização --accelerator-type como vVERSION-TENSORCORES. Substitua VERSION pelo número da versão da TPU que você quer usar. Substitua TENSORCORES pelo número de TensorCores que você quer usar.

      Para personalizar a topologia física da TPU, use as sinalizações --version e --topology. Defina a sinalização --version como a versão da TPU que você quer usar. Defina a sinalização --topology como a topologia que você quer usar.

      Para mais informações sobre configurações de TPU, incluindo configurações compatíveis e variantes de topologia, consulte Versões de TPU.

    • Versão do software: se você estiver solicitando um recurso na fila, defina a sinalização --runtime-version como o nome da versão do software que você quer usar. Caso contrário, use a sinalização --version. As versões do software de TPU estão disponíveis para os frameworks do TensorFlow, PyTorch e JAX. Para mais informações sobre as versões de software compatíveis, consulte Versões de software da VM de TPU.

    • Conta de serviço: defina --service-account como o endereço de e-mail de uma conta de serviço, caso tenha criado uma, para anexar essa conta à sua TPU. Se estiver vazio, a conta de serviço padrão do Compute Engine será usada.

    • Tipo de cota: se você quiser criar uma TPU usando cota reservada, adicione a sinalização --reserved à solicitação.

      Se você quiser criar uma TPU usando a cota preemptiva e solicitar um recurso na fila, adicione a sinalização --best-effort à solicitação.

      Se você quiser criar uma TPU usando a cota preemptiva e não estiver solicitando um recurso na fila, adicione a sinalização --preemptible à solicitação.

      Se quiser criar uma TPU usando a cota sob demanda, não será preciso adicionar outras sinalizações.

    • Configuração avançada: é possível adicionar outras sinalizações à solicitação para configurar a TPU. Consulte a documentação do gcloud compute tpus tpu-vm create e as seções a seguir em Gerenciar TPUs para mais informações:

Para exemplos de como criar um Cloud TPU, consulte os Primeiros passos.

A seguir

  1. Saiba como criar e gerenciar recursos de VM e TPU
  2. Execute um guia de início rápido do Cloud TPU.