O Cloud TPU v4 já está em disponibilidade geral! Para começar a usar os pods do Cloud TPU v4 nas suas cargas de trabalho de IA, preencha este formulário

Cloud TPU

Acelere as cargas de trabalho de machine learning com os aceleradores de hardware desenvolvidos pelo Google.

Acelere os modelos de machine learning com os supercomputadores do Google

O Cloud TPU permite que as empresas acelerem os modelos de machine learning, incluindo processamento de linguagem natural (PLN), classificação e recomendações e visão computacional. Desenvolvedores, pesquisadores e empresas podem usar os mesmos circuitos integrados de machine learning (ASICs, na sigla em inglês) personalizados que se aplicam ao modelo de pesquisa do Google, YouTube e LaMDA. 

Treine e itere rapidamente em modelos de machine learning.

O Cloud TPU minimiza o tempo e a precisão de um treinamento de modelos de rede neural grandes e complexos. Modelos que levariam semanas para serem treinados em outro hardware. 

Gerencie cargas de trabalho em grande escala com flexibilidade

As TPUs foram projetadas especificamente para modelos com cálculos de matriz e modelos grandes com tamanhos de lotes grandes e efetivos. Com as VMs de TPU, é fácil empregar frameworks de ML conhecidos

Reduzir custos e aumentar a sustentabilidade

O Cloud TPU oferece desempenho em baixo custo por dólar em escala para várias cargas de trabalho de ML. E agora o Cloud TPU v4 oferece aos clientes 2,2x mais ~1,4 vezes mais FLOPs por dólar em comparação com o Cloud TPU v3.

Cloud TPUs para cada carga de trabalho e orçamento

A Cloud TPU foi criada para executar modelos de machine learning de última geração com serviços de IA no Google Cloud. A rede personalizada de alta velocidade oferece mais de 100 petaflops de desempenho em um único pod, uma capacidade computacional suficiente para transformar seus negócios ou criar a próxima inovação de pesquisa.

Compatibilidade com versões anteriores completas

Os pods da TPU v4 do Cloud são a última geração dos aceleradores de ML personalizados do Google e agora estão disponíveis no GA. Ele mantém a compatibilidade com versões anteriores do Cloud TPU v2 e v3, mas tem um aumento duas vezes maior que a TPU v3 do Cloud em desempenho bruto de computação por ícone. Cada chip TPU v4 também contém um único núcleo lógico, permitindo o uso de 32 GiB de memória total de um programa, em comparação com 8 GiB na v2 e 16 GiB na v3. Saiba quais produtos do Cloud TPU funcionam melhor para suas necessidades exclusivas de projeto.

Execute cargas de trabalho de machine learning em Cloud TPUs com frameworks de machine learning, como TensorFlow, Pytorch e JAX. Nossos guias de início rápido fornecem uma breve introdução de como trabalhar com VMs do Cloud TPU e explicam como instalar um framework de ML e executar um aplicativo de amostra em uma VM do Cloud TPU.

Economize dinheiro usando TPUs do Cloud preemptivas

Economize dinheiro usando as Cloud TPUs preemptivas para cargas de trabalho de machine learning tolerantes a falhas, como longas execuções de treinamentos com checkpoints ou previsão em lote de grandes conjuntos de dados. A Cloud TPU preemptiva tem custo 70% menor que as instâncias por demanda. Dessa forma, todos os itens estão mais acessíveis que nunca, desde seus primeiros testes até pesquisas de hiperparâmetros em larga escala. Acesse nossa página de preços para entender como a Cloud TPU pode processar suas cargas de trabalho de machine learning de maneira econômica.

Saiba como a TPU v4 ajudou nossos clientes

Próximos passos

Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.

Precisa de ajuda para começar?
Trabalhe com um parceiro confiável
Continue navegando

Vá além

Inicie seu próximo projeto, veja tutoriais interativos e gerencie sua conta.

Precisa de ajuda para começar?
Trabalhe com um parceiro confiável
Veja dicas e práticas recomendadas

Os produtos de IA do Cloud estão em conformidade com as políticas de SLA do Google Cloud. Eles oferecem garantias de latência ou disponibilidade diferentes de outros serviços do Google Cloud.