Configurar o ambiente do Cloud TPU
Antes de poder usar os recursos do Cloud TPU para treinar ou executar inferência em modelos, siga estas etapas de configuração:
- Configurar seu projeto do Google Cloud
- Configurar o ambiente para usar o Cloud TPU
- Prepare-se para solicitar uma Cloud TPU
Configurar seu projeto do Google Cloud
Você precisa ter uma conta e um projeto do Google Cloud para usar o Cloud TPU.
No console do Google Cloud, faça login na sua Conta do Google ou criar uma nova conta.
Instale a CLI do Google Cloud. A CLI do Google Cloud é uma interface para acessar e gerenciar recursos e serviços do Google Cloud.
Selecione ou crie um projeto do Google Cloud:
No console do Google Cloud, selecione ou crie um projeto do Cloud no seletor de projetos.
No Cloud Shell, defina o ID do projeto usando a CLI gcloud. O ID do projeto é o nome do projeto mostrado no console do Google Cloud.
$ gcloud config set project PROJECT-ID
Verifique se a cobrança está ativada para o seu projeto do Google Cloud.
A configuração de faturamento é necessária para todo o uso do Google Cloud. Você só vai receber cobranças depois de começar a usar os recursos do Google Cloud. Para mais informações, consulte a documentação do Cloud Billing.
O faturamento para o uso de todas as versões do Cloud TPU segue os preços regionais padrão mostrado na página de preços do Cloud TPU.
Configurar o ambiente para usar o Cloud TPU
Antes de solicitar um Cloud TPU, é necessário ativar a API Cloud TPU e verificar se você tem permissões para gerenciar o acesso no projeto e criar um Cloud TPU. Também é recomendável criar um serviço gerenciado pelo usuário para anexar à TPU.
Ative a API Cloud TPU no console do Google Cloud ou usando o CLI gcloud no Cloud Shell:
gcloud
$ gcloud services enable tpu.googleapis.com
Console
- No console do Google Cloud, acesse a página da API Cloud TPU.
Acessar a página da API Cloud TPU
- Clique em Ativar.
Verifique se você tem os seguintes papéis no projeto:
- Administrador da conta de serviço: necessário para criar uma conta de serviço.
- Administrador de IAM do projeto: necessário para conceder um papel em um projeto.
- Administrador da TPU: necessária para criar uma TPU
Siga as instruções Visualizar o acesso atual para ver que tem acesso ao projeto, pasta ou organização. Para visualizar o seu próprio acesso, na coluna Principal, localize a linha que tem seu endereço de e-mail. Se seu endereço de e-mail não estiver nessa coluna, você não tem papéis. Na coluna Papel da linha com seu endereço de e-mail, verifique se o lista de papéis inclui os papéis necessários.
Se você não tiver um papel necessário, conceder o papel ou peça para um administrador fazer isso.
Crie um agente de serviço do Cloud TPU:
Os agentes de serviço, um tipo de identidade de serviço, são mantidos pelo Google e usados pelo serviço do Cloud TPU para realizar operações no seu projeto do Google Cloud. Por exemplo, o serviço é usado para criar e gerenciar recursos da Cloud TPU.
$ gcloud beta services identity create --service tpu.googleapis.com --project $PROJECT_ID
Crie uma conta de serviço da TPU:
As contas de serviço funcionam como credenciais para as VMs da TPU. Papéis anexados a um que a conta de serviço conceda acesso aos recursos do Google Cloud. Recomendamos o uso de um conta de serviço gerenciado pelo usuário, concedendo apenas as permissões exigidas pelos VM da TPU. Ao usar uma conta serviço gerenciado pelo usuário, você precisa especificá-la ao você estiver criando uma VM de TPU usando a sinalização
--service-account
.Siga as instruções em Criar contas de serviço. para criar uma conta de serviço gerenciado pelo usuário.
Siga as instruções em Gerenciar o acesso a projetos, pastas e organizações para conceder ao serviço. o acesso da conta aos serviços do Google Cloud que a TPU acessa. As funções a seguir são recomendadas para que a TPU acesse os serviços do Google Cloud usados com frequência.
- Administrador da TPU: para acesso total aos recursos da TPU
- Administrador do Storage: necessário para acessar o Cloud Storage.
- Gravador de registros: necessário para gravar registros com a API Logging
- Gravador de métricas do Monitoring: necessário para gravar métricas no Cloud Monitoring
Preparação para criar um Cloud TPU
Antes de criar um Cloud TPU, é preciso solicitar cota. Considere também usando recursos na fila, bem como os parâmetros que você quer usar para configurar a TPU.
Cota de solicitação:
Para criar um Cloud TPU, seu projeto do Google Cloud precisa ter cota para a versão e o tamanho da TPU que você quer criar e a zona quiser criá-la. Por exemplo, se você quiser criar uma TPU v4-8 em
us-central2-b
, solicite uma cota de 8 núcleos de TPU v4 emus-central2-b
. Para mais informações sobre zonas em que o Cloud TPU está disponível, consulte Regiões e zonas de TPU.A cota é alocada de maneira diferente, dependendo da versão da TPU. Tipos diferentes de cota têm diferentes expectativas de disponibilidade. Para mais informações sobre alocação de cotas, tipos de cotas e como solicitar cotas, consulte Cotas.
Determine se você quer usar recursos na fila.
Criar um Cloud TPU como um recurso na fila é uma prática recomendada. Os recursos em fila permitem que você receba capacidade quando ela estiver disponível. Você pode especificar horários de início e término opcionais em que a solicitação deve ser preenchida.
Há diferentes comandos da CLI gcloud para trabalhar com filas do Google Cloud. Para mais informações, consulte o guia do usuário sobre recursos em fila.
Determine os parâmetros de criação do Cloud TPU:
Zona: defina a flag
--zone
como a zona em que você quer criar uma TPU. Você precisa ter uma cota alocada nesta zona. Para mais informações, consulte Regiões e zonas de TPU.Configuração de TPU: se não for preciso especificar uma topologia personalizada. você estiver usando TPU v2 ou v3, defina a sinalização
--accelerator-type
comovVERSION-TENSORCORES
. Substituir VERSION pelo número da versão da TPU que você quer usar. Substituir TENSORCORES pelo número de TensorCores que você quer usar.Se você quiser personalizar a topologia física da TPU, use as flags
--version
e--topology
. Defina a flag--version
como a TPU que você quer usar. Defina a flag--topology
como a topologia que você quer usar.Para mais informações sobre as configurações de TPU, incluindo as configurações com suporte e as variantes de topologia, consulte Versões de TPU.
Versão do software: se você estiver solicitando um recurso na fila, defina o
--runtime-version
para o nome da versão do software que você quer usar. Caso contrário, use a sinalização--version
. Versões de software da TPU estão disponíveis para frameworks do TensorFlow, do PyTorch e do JAX. Para mais informações sobre as versões de software com suporte, consulte Versões de software de VM de TPU.Conta de serviço: defina
--service-account
como o endereço de e-mail de uma conta de serviço, se você tiver criado uma, para anexar a conta de serviço ao TPU. Se estiver vazia, a conta de serviço padrão do Compute Engine será usado.Tipo de cota: adicione a flag que corresponde ao tipo de cota que você quer usar:
Tipo da cota Sinalização Reservado --reserved
VMs spot --spot
Preemptivo (não disponível para recursos em fila. Use --spot
)--preemptible
Sob demanda Nenhuma flag adicional é necessária Configuração avançada: é possível adicionar mais sinalizações à solicitação para configurar sua TPU. Consulte a documentação do
gcloud compute tpus tpu-vm create
. e nas seções a seguir para mais informações:
Para conferir exemplos de como criar uma Cloud TPU, consulte Começar.
A seguir
- Aprenda a criar e gerenciar recursos de VM e TPU
- Execute um guia de início rápido do Cloud TPU.