Configurar o ambiente do Cloud TPU
Antes de usar os recursos do Cloud TPU para treinar ou executar inferência em modelos, siga estas etapas:
- Configurar o projeto do Google Cloud .
- Configurar o ambiente para usar o Cloud TPU.
- Preparar-se para solicitar um Cloud TPU.
Configurar o projeto do Google Cloud
Você precisa ter uma conta e um projeto do Google Cloud para usar o Cloud TPU.
No console doGoogle Cloud , faça login na sua Conta do Google ou inscreva-se em uma nova conta.
Crie um projeto do Google Cloud . Para saber mais, consulte Criar um projeto.
Ative o faturamento para o projeto do Google Cloud .
A configuração de faturamento é obrigatória para usar o Google Cloud . Você só vai receber cobranças depois que começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.
O faturamento do uso de todas as versões do Cloud TPU segue os preços regionais padrão mostrados na página de preços do Cloud TPU.
Instale a CLI do Google Cloud. A CLI do Google Cloud é um conjunto de bibliotecas e ferramentas para acessar e gerenciar os recursos e serviços do Google Cloud .
Configure o comando
gcloudinstalado como parte da CLI do Google Cloud.Execute os comandos a seguir para configurar a
gcloude usar o projeto do Google Cloud.$ gcloud config set project PROJECT_ID
Verifique se o faturamento está ativado para o projeto do Google Cloud .
A configuração de faturamento é obrigatória para usar o Google Cloud . Você só vai receber cobranças depois que começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.
O faturamento do uso de todas as versões do Cloud TPU segue os preços regionais padrão mostrados na página de preços do Cloud TPU.
Configurar o ambiente para usar o Cloud TPU
Antes de solicitar um Cloud TPU, ative a API Cloud TPU e verifique se você tem permissões para gerenciar o acesso no projeto e criar um Cloud TPU. Também recomendamos que você crie uma conta de serviço gerenciada pelo usuário para anexar à TPU.
Ative a API Cloud TPU no console do Google Cloud ou usando a gcloud CLI no Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Console
- No console do Google Cloud , acesse a página da API Cloud TPU.
Acessar a página da API Cloud TPU
- Clique em Ativar.
Verifique se você tem os seguintes papéis no projeto:
- Administrador da conta de serviço: necessário para criar uma conta de serviço.
- Administrador do IAM no projeto: necessário para conceder um papel em um projeto.
- Administrador da TPU: necessário para criar uma TPU.
Siga as instruções em Conferir o acesso atual para saber quais principais têm acesso ao projeto, à pasta ou à organização. Para conferir seu próprio acesso, na coluna Principal, encontre a linha que tem seu endereço de e-mail. Se o seu endereço de e-mail não está nessa coluna, você não tem papéis. Na coluna Papel da linha que tem seu endereço de e-mail, verifique se a lista inclui os papéis necessários.
Se você não tiver um papel necessário, conceda esse papel ou peça que um administrador faça isso.
Crie um agente de serviço do Cloud TPU:
Os agentes de serviço são um tipo de identidade de serviço mantida pelo Google que é usada pelo serviço Cloud TPU para realizar operações no projeto do Google Cloud . Por exemplo, o agente de serviço é usado para criar e gerenciar recursos do Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project PROJECT_ID
Crie uma conta de serviço de TPU:
As contas de serviço funcionam como credenciais para as VMs de TPU. Os papéis anexados a uma conta de serviço concedem acesso a recursos do Google Cloud . Recomendamos usar uma conta de serviço gerenciada pelo usuário e conceder apenas as permissões necessárias para a VM de TPU. Para usar uma conta de serviço gerenciada pelo usuário, especifique-a ao criar uma VM de TPU usando a flag
--service-account.Siga as instruções em Criar contas de serviço para criar uma conta de serviço gerenciada pelo usuário.
Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder à conta de serviço acesso aos serviços do Google Cloud que a TPU vai acessar. Os papéis a seguir são recomendados para que a TPU acesse serviços doGoogle Cloud que são usados com frequência.
- Administrador da TPU: necessário para ter acesso total aos recursos da TPU.
- Administrador do Storage: necessário para acessar o Cloud Storage.
- Gravador de registros: necessário para gravar registros com a API Logging.
- Gravador de métricas do Monitoring: necessário para gravar métricas no Cloud Monitoring.
Preparação para criar um Cloud TPU
Antes de criar um Cloud TPU, é necessário solicitar cota. Também recomendamos considerar o uso de recursos em fila e os parâmetros que você quer usar para configurar a TPU.
Escolha uma opção de consumo.
As opções de consumo são os métodos usados para solicitar capacidade do Cloud TPU. Escolha uma opção de consumo com base nos seguintes fatores:
- A rapidez com que você precisa da capacidade.
- Por quanto tempo você precisa da capacidade.
- Se você precisa da capacidade por um período fixo ou flexível.
- Se a capacidade pode ser interrompida.
- Preços
Para mais informações, consulte Opções de consumo do Cloud TPU.
Faça uma solicitação de cota:
As cotas de TPU são limites quanto ao número de núcleos do Cloud TPU que podem ser usados com um projeto doGoogle Cloud . Cada versão de TPU está associada a uma cota própria. Para criar um Cloud TPU, o projeto do Google Cloud precisa ter cota para a versão e o tamanho da TPU que você quer criar e a zona em que ela será criada. Para mais informações sobre alocação, tipos e solicitações de cota, consulte Cotas.
Ao criar TPUs com o Google Kubernetes Engine ou a Vertex AI, você precisa ter cota para esses serviços. Para mais informações sobre as cotas do GKE, consulte Planejar a configuração da TPU com o GKE. Para mais informações sobre as cotas da Vertex AI, consulte Cotas e limites da Vertex AI.
Determine se você quer usar recursos em fila.
Criar um Cloud TPU como um recurso em fila é uma prática recomendada. Os recursos em fila permitem que você receba capacidade assim que ela estiver disponível. Você pode especificar um horário de início e de término opcional para quando a solicitação deve ser atendida.
Há diferentes comandos da gcloud CLI para trabalhar com recursos em fila. Para mais informações, consulte o guia do usuário sobre recursos em fila.
Determine os parâmetros de criação do Cloud TPU:
Zona: defina a flag
--zonecom a zona em que você quer criar uma TPU. Você precisa ter cota alocada nessa zona. Para mais informações, consulte Regiões e zonas de TPU.Configuração de TPU: se não for preciso especificar uma topologia personalizada ou você estiver usando a TPU v2 ou v3, defina a flag
--accelerator-typecomovVERSION-TENSORCORES. Substitua VERSION pelo número da versão de TPU que você quer usar. Substitua TENSORCORES pelo número de TensorCores que você quer usar.Para personalizar a topologia física da TPU, use as flags
--versione--topology. Defina a flag--versioncom a versão de TPU que você quer usar. Defina a flag--topologycom a topologia que você quer usar.Para mais informações sobre as configurações de TPU, incluindo configurações e variantes de topologia disponíveis, consulte Versões de TPU.
Versão do software: ao solicitar um recurso em fila, defina a flag
--runtime-versioncom o nome da versão do software que você quer usar. Caso contrário, use a flag--version. As versões de software de TPU estão disponíveis para os frameworks TensorFlow, PyTorch e JAX. Para mais informações sobre as versões de software disponíveis, consulte Versões de software de VMs de TPU.Conta de serviço: defina
--service-accountcom o endereço de e-mail de uma conta de serviço, se você tiver criado uma, para anexá-la à TPU. Se o campo ficar em branco, a conta de serviço padrão do Compute Engine será usada.Tipo de cota: adicione a flag que corresponde ao tipo de cota que você quer usar:
Tipo de cota Flag Reservada --reservedVMs spot --spotPreemptiva (indisponível para recursos em fila; use --spot).--preemptibleOn demand Nenhuma flag adicional é necessária. Configuração avançada: é possível adicionar outras flags à solicitação para configurar a TPU. Consulte a documentação de
gcloud compute tpus tpu-vm createe as seções abaixo para mais informações:
Para conferir exemplos de como criar um Cloud TPU, consulte Introdução.
A seguir
- Saiba como criar e gerenciar recursos de VM e TPU.
- Confira um guia de início rápido do Cloud TPU.