Estamos lançando o Cloud TPU v5e, a versão mais econômica, versátil e escalonável até o momento.

Cloud Tensor Processing Units (Cloud TPUs)

Acelere o desenvolvimento de IA com Google Cloud TPUs

As Cloud TPUs otimizam o desempenho e o custo para todas as cargas de trabalho de IA, do treinamento à inferência. Usando uma infraestrutura de data center de nível internacional, as TPUs oferecem alta confiabilidade, disponibilidade e segurança.

Não tem certeza se as TPUs são adequadas? Saiba quando usar GPUs ou CPUs em instâncias do Compute Engine para executar cargas de trabalho de machine learning.

Informações gerais

O que é uma Unidade de Processamento de Tensor (TPU)?

As TPUs do Google Cloud são aceleradores de IA personalizados, otimizados para treinamento e inferência de grandes modelos de IA. Eles são ideais para diversos casos de uso, como bots de chat, geração de código, geração de conteúdo de mídia, fala sintética, serviços de visão, mecanismos de recomendação, modelos de personalização, entre outros. 

Quais são as vantagens das Cloud TPUs?

As Cloud TPUs foram projetadas para escalonar de maneira econômica para uma ampla variedade de cargas de trabalho de IA, abrangendo treinamento, ajuste e inferência. As Cloud TPUs oferecem a versatilidade de acelerar cargas de trabalho em frameworks de IA líderes, incluindo PyTorch e Jax eTensorFlow de dois minutos. Orquestre cargas de trabalho de IA em grande escala com perfeição com a integração da Cloud TPU no Google Kubernetes Engine (GKE). Os clientes que procuram a maneira mais simples de desenvolver modelos de IA também podem aproveitar as Cloud TPUs na Vertex AI, uma plataforma de IA totalmente gerenciada.

Quando usar Cloud TPUs?

As Cloud TPUs são otimizadas para treinar modelos de aprendizado profundo grandes e complexos que apresentam muitos cálculos de matriz, por exemplo, criando modelos de linguagem grandes (LLMs). As Cloud TPUs também têm o SparseCores, que são processadores de fluxo de dados que aceleram modelos que dependem de embeddings encontrados em modelos de recomendação. Outros casos de uso incluem assistência médica, como modelagem da dobra de proteínas e descoberta de medicamentos.

Qual é a diferença entre as Cloud TPUs e as GPUs?

GPU é um processador especializado originalmente projetado para manipular gráficos do computador. A estrutura paralela é ideal para algoritmos que processam grandes blocos de dados normalmente encontrados em cargas de trabalho de IA. Saiba mais

A TPU é um circuito integrado específico de aplicativos (ASIC, na sigla em inglês) projetado pelo Google para redes neurais. As TPUs têm recursos especializados, como a unidade de multiplicação de matrizes (MXU) e a topologia de interconexão proprietária, que as tornam ideais para acelerar o treinamento e a inferência de IA.

Versões da Cloud TPU

Cloud TPU v5e

A Cloud TPU mais eficiente, versátil e escalonável.

O Cloud TPU v5e estará disponível na América do Norte (regiões oeste/central/leste dos EUA), EMEA (Países Baixos) e APAC (Singapura).

Cloud TPU v4

O Cloud TPU mais potente para treinar modelos de IA.

A Cloud TPUv4 está disponível na região us-central2

Versão da Cloud TPU Descrição Disponibilidade

Cloud TPU v5e

A Cloud TPU mais eficiente, versátil e escalonável.

O Cloud TPU v5e estará disponível na América do Norte (regiões oeste/central/leste dos EUA), EMEA (Países Baixos) e APAC (Singapura).

Cloud TPU v4

O Cloud TPU mais potente para treinar modelos de IA.

A Cloud TPUv4 está disponível na região us-central2

Como funciona

Tenha uma visão detalhada da magia das TPUs do Google Cloud, incluindo uma visão rara dos data centers em que tudo isso acontece. Os clientes usam Cloud TPUs para executar algumas das maiores cargas de trabalho de IA do mundo, e essa potência vem de muito mais do que apenas um chip. Neste vídeo, confira os componentes do sistema de TPU, incluindo rede de data center, interruptores de circuito óptico, sistemas de resfriamento com água, verificação biométrica de segurança e muito mais.

Usos comuns

Execute cargas de trabalho de treinamento de IA em grande escala

Ajuste modelos básicos de IA

Disponibilize cargas de trabalho de inferência de IA em grande escala

Cloud TPU no GKE

Cloud TPU na Vertex AI

Preços

Preços da Cloud TPU

Todos os preços da Cloud TPU são calculados por hora de chip

Cloud TPU v5e

A partir de

US$ 1,200

por chip/hora

A partir de

US$ 0,8400

por chip/hora

A partir de

US$ 0,5400

por chip/hora

Cloud TPU v4

A partir de

US$ 3,2200

por chip/hora

A partir de

US$ 2,0286

por chip/hora

A partir de

US$ $1,4490

por chip/hora

Preços da Cloud TPU Todos os preços da Cloud TPU são calculados por hora de chip
Versão da Cloud TPU Preço de avaliação (USD) Compromisso de um ano (USD) Compromisso de três anos (USD)
Cloud TPU v5e

A partir de

US$ 1,200

por chip/hora

A partir de

US$ 0,8400

por chip/hora

A partir de

US$ 0,5400

por chip/hora

Cloud TPU v4

A partir de

US$ 3,2200

por chip/hora

A partir de

US$ 2,0286

por chip/hora

A partir de

US$ $1,4490

por chip/hora

CALCULADORA DE PREÇOS

Estime os custos mensais da Cloud TPU, incluindo preços e taxas específicos da região.
Estime seus custos

COTA PERSONALIZADA

Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Solicitar um orçamento

Comece sua prova de conceito

Teste as Cloud TPUs gratuitamente

Comece agora

Confira uma rápida introdução sobre como usar as Cloud TPUs

Saiba mais

Executar o TensorFlow na VM da Cloud TPU

Confira o guia

Executar o JAX na VM da Cloud TPU

Confira o guia

Executar o PyTorch na VM da Cloud TPU

Confira o guia