Configure o ambiente da Cloud TPU
Antes de poder usar recursos da Cloud TPU para preparar ou executar inferência em modelos, tem de seguir os passos seguintes:
- Configure o seu Google Cloud projeto
- Configure o seu ambiente para usar a Cloud TPU
- Prepare-se para pedir uma Cloud TPU
Configure o seu Google Cloud projeto
Tem de ter uma Google Cloud conta e um projeto para usar a Cloud TPU.
Na Google Cloud consola, inicie sessão na sua Conta Google ou inscreva-se numa nova conta.
Crie um Google Cloud projeto. Para mais informações, consulte Crie um projeto.
Ative a faturação para o seu Google Cloud projeto.
A configuração de faturação é necessária para toda a Google Cloud utilização. Só lhe é cobrado um valor depois de começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.
A faturação da utilização de todas as versões do Cloud TPU segue os preços regionais padrão apresentados na página de preços do Cloud TPU.
Instale a CLI Google Cloud. A CLI Google Cloud é um conjunto de bibliotecas e ferramentas para aceder e gerir Google Cloud recursos e serviços.
Configure o comando
gcloud
que instalou como parte da CLI gcloud.Execute os seguintes comandos para configurar o
gcloud
para usar o seu projeto Google Cloud.$ gcloud config set project PROJECT_ID
Certifique-se de que a faturação está ativada para o seu Google Cloud projeto.
A configuração de faturação é necessária para toda a Google Cloud utilização. Só lhe é cobrado um valor depois de começar a usar os recursos do Google Cloud . Para mais informações, consulte a documentação do Cloud Billing.
A faturação da utilização de todas as versões do Cloud TPU segue os preços regionais padrão apresentados na página de preços do Cloud TPU.
Configure o seu ambiente para usar o Cloud TPU
Antes de pedir uma Cloud TPU, tem de ativar a API Cloud TPU e garantir que tem autorizações para gerir o acesso no seu projeto e para criar uma Cloud TPU. Também recomendamos que crie uma conta de serviço gerida pelo utilizador para anexar à sua TPU.
Ative a API Cloud TPU a partir da Google Cloud consola ou através da CLI gcloud no Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Consola
- Na Google Cloud consola, aceda à página da API Cloud TPU.
Aceda à página da API Cloud TPU
- Clique em Ativar.
Certifique-se de que tem as seguintes funções no seu projeto:
- Administrador da conta de serviço: necessário para criar uma conta de serviço
- Administrador de IAM do projeto: necessário para conceder uma função num projeto
- Administrador da TPU: necessário para criar uma TPU
Siga as instruções em Ver acesso atual para ver que responsáveis têm acesso ao seu projeto, pasta ou organização. Para ver o seu próprio acesso, na coluna Principal, encontre a linha que tem o seu endereço de email. Se o seu endereço de email não estiver nessa coluna, significa que não tem funções. Na coluna Função da linha com o seu endereço de email, verifique se a lista de funções inclui as funções necessárias.
Se não tiver uma função necessária, conceda a função ou peça a um administrador para o fazer.
Crie um agente de serviço da Cloud TPU:
Os agentes de serviço, um tipo de identidade de serviço, são identidades de serviço mantidas pela Google que são usadas pelo serviço Cloud TPU para realizar operações no seu projeto Google Cloud . Por exemplo, o agente de serviço é usado para criar e gerir recursos do Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project PROJECT_ID
Crie uma conta de serviço de TPU:
As contas de serviço funcionam como credenciais para as suas VMs de TPU. As funções anexadas a uma conta de serviço concedem acesso a Google Cloud recursos. Recomendamos que use uma conta de serviço gerida pelo utilizador, concedendo apenas as autorizações necessárias à sua VM de TPU. Quando usar uma conta de serviço gerida pelo utilizador, tem de especificá-la quando criar uma VM de TPU com a flag
--service-account
.Siga as instruções em Crie contas de serviço para criar uma conta de serviço gerida pelo utilizador.
Siga as instruções em Faça a gestão do acesso a projetos, pastas e organizações para conceder ao seu serviço acesso à conta dos Google Cloud serviços aos quais a TPU vai aceder. Recomendamos as seguintes funções para que a sua TPU aceda aosGoogle Cloud serviços usados com frequência.
- Administrador da TPU: necessário para acesso total aos recursos da TPU
- Administrador de armazenamento: necessário para aceder ao Cloud Storage
- Logs Writer: necessário para escrever registos com a Logging API
- Escritor de métricas de monitorização: necessário para escrever métricas no Cloud Monitoring
Prepare-se para criar uma Cloud TPU
Antes de criar um TPU na nuvem, tem de pedir quota. Também deve considerar usar recursos em fila, bem como os parâmetros que quer usar para configurar a TPU.
Escolha uma opção de consumo.
As opções de consumo são os métodos usados para pedir capacidade do Cloud TPU. Escolha uma opção de consumo com base nos seguintes fatores:
- Com que rapidez precisa da capacidade
- Durante quanto tempo precisa da capacidade
- Se precisa de capacidade durante um período fixo ou flexível
- Se a sua capacidade pode ser antecipada
- Preços
Para mais informações, consulte as opções de consumo de Cloud TPU.
Quota de pedidos:
As quotas de TPUs são limites ao número de núcleos de Cloud TPU que pode usar com um Google Cloud projeto. Cada versão da TPU está associada à sua própria quota. Para criar uma TPU na nuvem, o seu Google Cloud projeto tem de ter quota para a versão e o tamanho da TPU que quer criar e a zona onde a quer criar. Para mais informações sobre a atribuição de quotas, os tipos de quotas e como pedir quotas, consulte o artigo Quotas.
Se estiver a criar TPUs com o Google Kubernetes Engine ou a Vertex AI, precisa de quota para esses serviços. Para mais informações sobre as quotas do GKE, consulte o artigo Planeie a configuração da TPU com o GKE. Para mais informações sobre as quotas da Vertex AI, consulte o artigo Quotas e limites da Vertex AI.
Determine se quer usar recursos em fila.
Criar uma Cloud TPU como um recurso em fila é uma prática recomendada. Os recursos em fila permitem-lhe receber capacidade assim que estiver disponível. Pode especificar uma hora de início e de fim opcional para quando o pedido deve ser preenchido.
Existem diferentes comandos da CLI gcloud para trabalhar com recursos em fila. Para mais informações, consulte o manual do utilizador dos recursos em fila.
Determine os parâmetros de criação da Cloud TPU:
Zona: defina a flag
--zone
para a zona onde quer criar uma TPU. Tem de ter uma quota atribuída nesta zona. Para mais informações, consulte o artigo Regiões e zonas de TPUs.Configuração da TPU: se não precisar de especificar uma topologia personalizada ou estiver a usar a TPU v2 ou v3, defina a flag
--accelerator-type
comovVERSION-TENSORCORES
. Substitua VERSION pelo número da versão da TPU que quer usar. Substitua TENSORCORES pelo número de TensorCores que quer usar.Se quiser personalizar a topologia física da TPU, use as flags
--version
e--topology
. Defina o sinalizador--version
para a versão da TPU que quer usar. Defina o sinalizador--topology
para a topologia que quer usar.Para mais informações sobre as configurações de TPU, incluindo configurações compatíveis e variantes de topologia, consulte o artigo Versões de TPU.
Versão do software: se estiver a pedir um recurso em fila, defina a flag
--runtime-version
para o nome da versão do software que quer usar. Caso contrário, use a flag--version
. As versões de software da TPU estão disponíveis para as frameworks TensorFlow, PyTorch e JAX. Para mais informações sobre as versões de software suportadas, consulte o artigo Versões de software da VM de TPU.Conta de serviço: defina
--service-account
para o endereço de email de uma conta de serviço, se tiver criado uma, para anexar a conta de serviço à sua TPU. Se estiver vazio, é usada a conta de serviço do Compute Engine predefinida.Tipo de quota: adicione a flag que corresponde ao tipo de quota que quer usar:
Tipo de quota Bandeira Reservadas --reserved
VMs do Spot --spot
Preemptível (não disponível para recursos em fila; use --spot
em alternativa)--preemptible
A pedido Não é necessária nenhuma flag adicional Configuração avançada: pode adicionar flags adicionais ao seu pedido para configurar a TPU. Consulte a documentação do
gcloud compute tpus tpu-vm create
e as secções seguintes para mais informações:
Para ver exemplos de como criar uma TPU do Google Cloud, consulte o artigo Começar.
O que se segue?
- Saiba como criar e gerir recursos de VMs e TPUs
- Execute um início rápido da Cloud TPU