Não tem certeza se as TPUs são adequadas? Saiba quando usar GPUs ou CPUs em instâncias do Compute Engine para executar cargas de trabalho de machine learning.
Visão geral
GPU é um processador especializado originalmente projetado para manipular gráficos do computador. A estrutura paralela é ideal para algoritmos que processam grandes blocos de dados normalmente encontrados em cargas de trabalho de IA. Saiba mais.
A TPU é um circuito integrado específico de aplicativos (ASIC, na sigla em inglês) projetado pelo Google para redes neurais. As TPUs têm recursos especializados, como a unidade de multiplicação de matrizes (MXU) e a topologia de interconexão proprietária, que as tornam ideais para acelerar o treinamento e a inferência de IA.
Versões da Cloud TPU
Versão da Cloud TPU | Descrição | Disponibilidade |
---|---|---|
Cloud TPU v5p | O Cloud TPU mais potente para treinar modelos de IA | O Cloud TPU v5p estará disponível na América do Norte (região leste dos EUA) |
Cloud TPU v5e | A Cloud TPU mais eficiente, versátil e escalonável | O Cloud TPU v5e está com disponibilidade geral na América do Norte (regiões oeste/leste dos EUA) |
O Cloud TPU v5p está disponível na América do Norte (us-east5) durante o pré-lançamento.
Cloud TPU v5p
O Cloud TPU mais potente para treinar modelos de IA
O Cloud TPU v5p estará disponível na América do Norte (região leste dos EUA)
Cloud TPU v5e
A Cloud TPU mais eficiente, versátil e escalonável
O Cloud TPU v5e está com disponibilidade geral na América do Norte (regiões oeste/leste dos EUA)
O Cloud TPU v5p está disponível na América do Norte (us-east5) durante o pré-lançamento.
Como funciona
Tenha uma visão detalhada da magia das TPUs do Google Cloud, incluindo uma visão rara dos data centers em que tudo isso acontece. Os clientes usam Cloud TPUs para executar algumas das maiores cargas de trabalho de IA do mundo, e essa potência vem de muito mais do que apenas um chip. Neste vídeo, confira os componentes do sistema de TPU, incluindo rede de data center, interruptores de circuito óptico, sistemas de resfriamento com água, verificação biométrica de segurança e muito mais.
Usos comuns
O Treinamento multislice do Cloud TPU é uma tecnologia de pilha completa que permite o treinamento rápido, fácil e confiável de modelos de IA em grande escala em dezenas de milhares de chips de TPU.
O Treinamento multislice do Cloud TPU é uma tecnologia de pilha completa que permite o treinamento rápido, fácil e confiável de modelos de IA em grande escala em dezenas de milhares de chips de TPU.
O Cloud TPU v5e permite a inferência de alto desempenho e economia para uma ampla variedade de cargas de trabalho de IA, incluindo os modelos de IA generativa e LLMs mais recentes. A TPU v5e oferece um desempenho de capacidade até 2,5 vezes maior por dólar e velocidade até 1,7 vezes maior em relação ao Cloud TPU v4. Cada chip TPU v5e fornece até 393 trilhões de operações int8 por segundo, permitindo que modelos complexos façam previsões rápidas. Um pod de TPU v5e oferece até 100 quatrilhões de operações int8 por segundo ou 100 petaOps de capacidade de computação.
O Cloud TPU v5e permite a inferência de alto desempenho e economia para uma ampla variedade de cargas de trabalho de IA, incluindo os modelos de IA generativa e LLMs mais recentes. A TPU v5e oferece um desempenho de capacidade até 2,5 vezes maior por dólar e velocidade até 1,7 vezes maior em relação ao Cloud TPU v4. Cada chip TPU v5e fornece até 393 trilhões de operações int8 por segundo, permitindo que modelos complexos façam previsões rápidas. Um pod de TPU v5e oferece até 100 quatrilhões de operações int8 por segundo ou 100 petaOps de capacidade de computação.
Combine a eficiência das Cloud TPUs com a flexibilidade e a escalonabilidade do GKE para criar e implantar modelos de machine learning com mais rapidez e facilidade do que nunca. Com as Cloud TPUs disponíveis no GKE, é possível ter um único ambiente de operações consistente para todas as cargas de trabalho, padronizando pipelines de MLOps automatizados.
Combine a eficiência das Cloud TPUs com a flexibilidade e a escalonabilidade do GKE para criar e implantar modelos de machine learning com mais rapidez e facilidade do que nunca. Com as Cloud TPUs disponíveis no GKE, é possível ter um único ambiente de operações consistente para todas as cargas de trabalho, padronizando pipelines de MLOps automatizados.
Para clientes que procuram uma maneira mais simples de desenvolver modelos de IA, implante a Cloud TPU v5e com a Vertex AI, uma plataforma completa para criar Modelos de IA em infraestrutura totalmente gerenciada, criados especificamente para veiculação de baixa latência e treinamento de alto desempenho.
Para clientes que procuram uma maneira mais simples de desenvolver modelos de IA, implante a Cloud TPU v5e com a Vertex AI, uma plataforma completa para criar Modelos de IA em infraestrutura totalmente gerenciada, criados especificamente para veiculação de baixa latência e treinamento de alto desempenho.
Preços
Preços da Cloud TPU | Todos os preços da Cloud TPU são calculados por hora de chip | ||
---|---|---|---|
Versão da Cloud TPU | Preço de avaliação (USD) | Compromisso de um ano (USD) | Compromisso de três anos (USD) |
Cloud TPU v5p | Starting at US$ 4.2000 por chip/hora | Starting at US$ 2.9400 por chip/hora | Starting at US$ 1.8900 por chip/hora |
Cloud TPU v5e | Starting at US$ 1.2000 por chip/hora | Starting at US$ 0,8400 por chip/hora | Starting at US$ 0,5400 por chip/hora |
Os preços da Cloud TPU variam de acordo com o produto e a região. Confira os detalhes aqui.
Preços da Cloud TPU
Todos os preços da Cloud TPU são calculados por hora de chip
Cloud TPU v5p
Starting at
US$ 4.2000
por chip/hora
Starting at
US$ 2.9400
por chip/hora
Starting at
US$ 1.8900
por chip/hora
Cloud TPU v5e
Starting at
US$ 1.2000
por chip/hora
Starting at
US$ 0,8400
por chip/hora
Starting at
US$ 0,5400
por chip/hora
Os preços da Cloud TPU variam de acordo com o produto e a região. Confira os detalhes aqui.