Cloud Tensor Processing Units (Cloud TPUs)

Acelere o desenvolvimento de IA com as Google Cloud TPUs

As Cloud TPUs otimizam o desempenho e o custo para todas as cargas de trabalho de IA, do treinamento à inferência. Usando uma infraestrutura de data center de nível internacional, as TPUs oferecem alta confiabilidade, disponibilidade e segurança.

Não tem certeza se as TPUs são adequadas? Saiba quando usar GPUs ou CPUs em instâncias do Compute Engine para executar cargas de trabalho de machine learning.

Visão geral

O que é uma Unidade de Processamento de Tensor (TPU)?

As TPUs do Google Cloud são aceleradores de IA personalizados, otimizados para treinamento e inferência de grandes modelos de IA. Eles são ideais para diversos casos de uso, como bots de chat, geração de código, geração de conteúdo de mídia, fala sintética, serviços de visão, mecanismos de recomendação, modelos de personalização, entre outros.

Quais são as vantagens das Cloud TPUs?

As Cloud TPUs foram projetadas para escalonar de maneira econômica para uma ampla variedade de cargas de trabalho de IA, abrangendo treinamento, ajuste e inferência. As Cloud TPUs oferecem a versatilidade de acelerar cargas de trabalho em frameworks de IA líderes, incluindo PyTorch e Jax eTensorFlow de dois minutos. Orquestre cargas de trabalho de IA em grande escala com perfeição com a integração da Cloud TPU no Google Kubernetes Engine (GKE). Os clientes que procuram a maneira mais simples de desenvolver modelos de IA também podem aproveitar as Cloud TPUs na Vertex AI, uma plataforma de IA totalmente gerenciada.

Quando usar Cloud TPUs?

As Cloud TPUs são otimizadas para treinar modelos de aprendizado profundo grandes e complexos que apresentam muitos cálculos de matriz, por exemplo, criando modelos de linguagem grandes (LLMs). As Cloud TPUs também têm o SparseCores, que são processadores de fluxo de dados que aceleram modelos que dependem de embeddings encontrados em modelos de recomendação. Outros casos de uso incluem assistência médica, como modelagem da dobra de proteínas e descoberta de medicamentos.

Qual é a diferença entre Cloud TPUs e GPUs?

GPU é um processador especializado originalmente projetado para manipular gráficos do computador. A estrutura paralela é ideal para algoritmos que processam grandes blocos de dados normalmente encontrados em cargas de trabalho de IA. Saiba mais.

A TPU é um circuito integrado específico de aplicativos (ASIC, na sigla em inglês) projetado pelo Google para redes neurais. As TPUs têm recursos especializados, como a unidade de multiplicação de matrizes (MXU) e a topologia de interconexão proprietária, que as tornam ideais para acelerar o treinamento e a inferência de IA.

Versões da Cloud TPU

Versão da Cloud TPUDescriçãoDisponibilidade

Cloud TPU v5p

O Cloud TPU mais potente para treinar modelos de IA

O Cloud TPU v5p estará disponível na América do Norte (região leste dos EUA)

Cloud TPU v5e

A Cloud TPU mais eficiente, versátil e escalonável

O Cloud TPU v5e está com disponibilidade geral na América do Norte (regiões oeste/leste dos EUA)

O Cloud TPU v5p está disponível na América do Norte (us-east5) durante o pré-lançamento.

Cloud TPU v5p

Descrição

O Cloud TPU mais potente para treinar modelos de IA

Disponibilidade

O Cloud TPU v5p estará disponível na América do Norte (região leste dos EUA)

Cloud TPU v5e

Descrição

A Cloud TPU mais eficiente, versátil e escalonável

Disponibilidade

O Cloud TPU v5e está com disponibilidade geral na América do Norte (regiões oeste/leste dos EUA)

O Cloud TPU v5p está disponível na América do Norte (us-east5) durante o pré-lançamento.

Como funciona

Tenha uma visão detalhada da magia das TPUs do Google Cloud, incluindo uma visão rara dos data centers em que tudo isso acontece. Os clientes usam Cloud TPUs para executar algumas das maiores cargas de trabalho de IA do mundo, e essa potência vem de muito mais do que apenas um chip. Neste vídeo, confira os componentes do sistema de TPU, incluindo rede de data center, interruptores de circuito óptico, sistemas de resfriamento com água, verificação biométrica de segurança e muito mais.

Substitua por vídeo da TPU!

Usos comuns

Execute cargas de trabalho de treinamento de IA em grande escala

Treinamento de IA avançado, escalonável e eficiente

O Treinamento multislice do Cloud TPU é uma tecnologia de pilha completa que permite o treinamento rápido, fácil e confiável de modelos de IA em grande escala em dezenas de milhares de chips de TPU.

Escalonamento quase linear para dezenas de milhares de chips com o Treinamento multislice

Treinamento de IA avançado, escalonável e eficiente

O Treinamento multislice do Cloud TPU é uma tecnologia de pilha completa que permite o treinamento rápido, fácil e confiável de modelos de IA em grande escala em dezenas de milhares de chips de TPU.

Escalonamento quase linear para dezenas de milhares de chips com o Treinamento multislice

Ajuste modelos básicos de IA

Adapte LLMs para seus aplicativos com Pytorch/XLA

Ajuste os modelos de base com eficiência aproveitando seus próprios dados de treinamento que representam seu caso de uso. O Cloud TPU v5e oferece um desempenho de ajuste de LLM até 1,9 vezes mais alto por dólar em comparação com o Cloud TPU v4.

Ajuste de desempenho do LLM da Cloud TPU/$

    Adapte LLMs para seus aplicativos com Pytorch/XLA

    Ajuste os modelos de base com eficiência aproveitando seus próprios dados de treinamento que representam seu caso de uso. O Cloud TPU v5e oferece um desempenho de ajuste de LLM até 1,9 vezes mais alto por dólar em comparação com o Cloud TPU v4.

    Ajuste de desempenho do LLM da Cloud TPU/$

      Disponibilize cargas de trabalho de inferência de IA em grande escala

      Maximize o desempenho/$ com uma infraestrutura de IA que escalona

      O Cloud TPU v5e permite a inferência de alto desempenho e economia para uma ampla variedade de cargas de trabalho de IA, incluindo os modelos de IA generativa e LLMs mais recentes. A TPU v5e oferece um desempenho de capacidade até 2,5 vezes maior por dólar e velocidade até 1,7 vezes maior em relação ao Cloud TPU v4. Cada chip TPU v5e fornece até 393 trilhões de operações int8 por segundo, permitindo que modelos complexos façam previsões rápidas. Um pod de TPU v5e oferece até 100 quatrilhões de operações int8 por segundo ou 100 petaOps de capacidade de computação.

      Saiba mais aqui
      Pod da Cloud TPU v5e

      Maximize o desempenho/$ com uma infraestrutura de IA que escalona

      O Cloud TPU v5e permite a inferência de alto desempenho e economia para uma ampla variedade de cargas de trabalho de IA, incluindo os modelos de IA generativa e LLMs mais recentes. A TPU v5e oferece um desempenho de capacidade até 2,5 vezes maior por dólar e velocidade até 1,7 vezes maior em relação ao Cloud TPU v4. Cada chip TPU v5e fornece até 393 trilhões de operações int8 por segundo, permitindo que modelos complexos façam previsões rápidas. Um pod de TPU v5e oferece até 100 quatrilhões de operações int8 por segundo ou 100 petaOps de capacidade de computação.

      Saiba mais aqui
      Pod da Cloud TPU v5e

      Cloud TPU no GKE

      Escalonamento simplificado com o GKE

      Combine a eficiência das Cloud TPUs com a flexibilidade e a escalonabilidade do GKE para criar e implantar modelos de machine learning com mais rapidez e facilidade do que nunca. Com as Cloud TPUs disponíveis no GKE, é possível ter um único ambiente de operações consistente para todas as cargas de trabalho, padronizando pipelines de MLOps automatizados.

      TPU na arquitetura do GKE

      Escalonamento simplificado com o GKE

      Combine a eficiência das Cloud TPUs com a flexibilidade e a escalonabilidade do GKE para criar e implantar modelos de machine learning com mais rapidez e facilidade do que nunca. Com as Cloud TPUs disponíveis no GKE, é possível ter um único ambiente de operações consistente para todas as cargas de trabalho, padronizando pipelines de MLOps automatizados.

      TPU na arquitetura do GKE

      Cloud TPU na Vertex AI

      Treinamento e previsões da Vertex AI com Cloud TPUs

      Para clientes que procuram uma maneira mais simples de desenvolver modelos de IA, implante a Cloud TPU v5e com a Vertex AI, uma plataforma completa para criar Modelos de IA em infraestrutura totalmente gerenciada, criados especificamente para veiculação de baixa latência e treinamento de alto desempenho.

      Treinamento e previsões da Vertex AI com Cloud TPUs

      Para clientes que procuram uma maneira mais simples de desenvolver modelos de IA, implante a Cloud TPU v5e com a Vertex AI, uma plataforma completa para criar Modelos de IA em infraestrutura totalmente gerenciada, criados especificamente para veiculação de baixa latência e treinamento de alto desempenho.

      Preços

      Preços da Cloud TPUTodos os preços da Cloud TPU são calculados por hora de chip
      Versão da Cloud TPUPreço de avaliação (USD)Compromisso de um ano (USD)Compromisso de três anos (USD)

      Cloud TPU v5p

      Starting at

      US$ 4.2000

      por chip/hora

      Starting at

      US$ 2.9400

      por chip/hora

      Starting at

      US$ 1.8900

      por chip/hora

      Cloud TPU v5e

      Starting at

      US$ 1.2000

      por chip/hora

      Starting at

      US$ 0,8400

      por chip/hora

      Starting at

      US$ 0,5400

      por chip/hora

      Os preços da Cloud TPU variam de acordo com o produto e a região. Confira os detalhes aqui.

      Preços da Cloud TPU

      Todos os preços da Cloud TPU são calculados por hora de chip

      Cloud TPU v5p

      Preço de avaliação (USD)

      Starting at

      US$ 4.2000

      por chip/hora

      Compromisso de um ano (USD)

      Starting at

      US$ 2.9400

      por chip/hora

      Compromisso de três anos (USD)

      Starting at

      US$ 1.8900

      por chip/hora

      Cloud TPU v5e

      Preço de avaliação (USD)

      Starting at

      US$ 1.2000

      por chip/hora

      Compromisso de um ano (USD)

      Starting at

      US$ 0,8400

      por chip/hora

      Compromisso de três anos (USD)

      Starting at

      US$ 0,5400

      por chip/hora

      Os preços da Cloud TPU variam de acordo com o produto e a região. Confira os detalhes aqui.

      CALCULADORA DE PREÇOS

      Estime os custos mensais da Cloud TPU, incluindo preços e taxas específicos da região.

      COTA PERSONALIZADA

      Fale com nossa equipe de vendas e receba uma cotação personalizada para sua organização.

      Comece sua prova de conceito

      Teste as Cloud TPUs gratuitamente

      Confira uma rápida introdução sobre como usar as Cloud TPUs

      Executar o TensorFlow na VM da Cloud TPU

      Executar o JAX na VM da Cloud TPU

      Executar o PyTorch na VM da Cloud TPU

      Google Cloud
      • ‪English‬
      • ‪Deutsch‬
      • ‪Español‬
      • ‪Español (Latinoamérica)‬
      • ‪Français‬
      • ‪Indonesia‬
      • ‪Italiano‬
      • ‪Português (Brasil)‬
      • ‪简体中文‬
      • ‪繁體中文‬
      • ‪日本語‬
      • ‪한국어‬
      Console
      • Transformação digital
      • Acelere a recuperação dos negócios e garanta um futuro melhor. Use soluções que permitam o uso de nuvem híbrida e de várias nuvens, gerem insights inteligentes e mantenham seus funcionários conectados.
      • Economize com nossa abordagem de preços transparente
      • Os preços de pagamento por utilização do Google Cloud oferecem economia automática com base no uso mensal e preços com desconto para recursos pré-pagos. Entre em contato hoje mesmo para receber uma cotação.
      Google Cloud