Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Preços da Cloud TPU

As Cloud TPUs são supercomputadores personalizados projetados para executar modelos de machine learning de ponta no Google Cloud, com desempenho líder de mercado líder de mercado. Os exaflops do poder de computação podem ajudar você a transformar seu negócio ou criar a próxima inovação de pesquisa.

Saiba mais sobre como os pods da Cloud TPU v4 ajudam os pesquisadores e desenvolvedores de ML a enviar os limites da IA de forma sustentável e eficiente.

Saiba quais produtos do Cloud TPU funcionam melhor para as suas necessidades de projeto.

Como funcionam os preços do Cloud TPU

Produtos

Os pods da Cloud TPU v4 são a última geração dos aceleradores de ML personalizados do Google e agora estão disponíveis no GA. Todas as formas de fatia do pod da TPU v4 usam o mesmo sistema de preços da v4.

No entanto, os preços e as cotas da Cloud TPU v2 e v3 são divididos em dois sistemas:

  • Preços de TPU de dispositivo único para dispositivos de TPU individuais que estão disponíveis sob demanda ou como dispositivos preemptivos (70% de desconto no preço de tabela de avaliação). Os tipos de TPU de dispositivo único são independentes e não têm conexões de rede diretas com outros dispositivos de TPU em um data center do Google. Se as cargas de trabalho exigirem mais núcleos de TPU e um pool de memória maior, use uma fração do pod da TPU.
  • Preços do Pod de TPU para clusters de dispositivos TPU conectados entre si por redes dedicadas de alta velocidade. Esses tipos de TPU estão disponíveis se você tiver uma cota de avaliação, cota preemptiva (70% de desconto no preço de tabela de avaliação) ou adquirir um compromisso de um ou três anos.

Para saber mais sobre a TPU v2, v3 e v4, consulte Arquitetura do sistema da TPU.

As cobranças para uma Cloud TPU serão acumuladas enquanto seu nó de TPU estiver em estado READY. Você receberá uma cobrança no fim de cada ciclo de faturamento listando o uso e as cobranças desse ciclo.

Opções de uso

Tipo Produtos de TPU Faturamento Mais adequado para:
Contrato de três anos (3D CUD) Pods da TPU v4, pods da TPU v3 e pods da TPU v2 Mensal, com base na cota reservada Usuários de ML que precisam de acesso consistente a mais de 512 núcleos de capacidade
Contrato de um ano (um ano de desconto por uso contínuo) Pods da TPU v4, pods da TPU v3 e pods da TPU v2 Mensal, com base na cota reservada Usuários de ML que precisam de acesso consistente a 32 a 512 núcleos de capacidade
Avaliação (sob demanda) Pods da TPU v4, pods da TPU v3, pods da TPU v2, TPU v3*, TPU v2* A cada hora, com base no uso real Usuários de ML que querem fazer alguns experimentos ou comparativos de mercado de curto prazo
Preemptiva Pods da TPU v4, TPU v3*, pods v3 da TPU, TPU v2*, pods da TPU v2 A cada hora, com base no uso real Usuários de ML que querem executar cargas de trabalho em lote / tolerantes a falhas

*Dispositivos únicos com oito núcleos. Na página SKU, esses dispositivos são chamados de aceleradores Tpu-v2 ou Tpu-v3.

Chips, núcleos e VMs

Uma VM da TPU (máquina virtual da TPU) tem 4 chips e 8 núcleos. O faturamento no console do Google Cloud é exibido em horas de VM.Por exemplo, o preço sob demanda para um único host do Cloud TPU v4, que inclui quatro chips TPU v4, é exibido como US $12,88 por hora. Os dados de uso no console do Google Cloud também são medidos em horas de VM.

Acesso gratuito por TRC

Clientes novos recebem US$ 300 em créditos para usar no Google Cloud. Comece agora.

Se você é pesquisador, estudante, engenheiro, artista ou empreendedor, considere se inscrever no programa TPU Cloud Research. Os membros do TRC recebem acesso gratuito a um grande cluster de Cloud TPUs e compartilham o trabalho com o mundo usando publicações revisadas por pares, código aberto, postagens de blog, vídeos e outras mídias. Veja alguns exemplos de publicações compatíveis com TRC.

Inscreva-se para acelerar sua pesquisa hoje mesmo.

Componentes do preço

Preços do Cloud TPU v4

O Cloud TPU v4 é a última geração dos aceleradores de machine learning personalizados do Google. Agora está disponível no GA. Ele mantém a compatibilidade com versões anteriores com o Cloud TPU v2 e v3, mas tem um aumento de mais de 2 vezes em relação ao Cloud TPU v3 no desempenho de computação bruto por chip. Cada chip TPU v4 também contém um único núcleo lógico, permitindo o uso de 32 GiB de memória total de um programa, em comparação com 8 GiB na v2 e 16 GiB na v3. As frações de pods da Cloud TPU v4 estão conectadas com uma interconexão personalizada que usa uma topologia de malha 3D, um upgrade da malha 2D na v2 e na v3 e estão disponíveis em configurações que variam de quatro chips (uma VM de TPU) a milhares de chips.

Os pods da Cloud TPU v4 estão disponíveis em us-central2-b, o data center do Google que opera com 90% de energia livre de carbono a cada hora, na mesma grade. Esse é o maior hub de ML disponível publicamente no mundo, com até 9 exaflops de desempenho agregado máximo.

A tabela a seguir mostra os preços das configurações do Cloud TPU v4. O preço de v4 é baseado no número de ícones na topologia. Há dois núcleos em cada ícone.

Preços da TPU v4 Preço por chip-hora % de desconto sob demanda
sob demanda / avaliação US$ 3,22
Reserva de CUD (desconto de uso contínuo) de 1Y US$ 2,03 37%
Reserva de CUD 3Y (desconto por compromisso de uso) US$ 1,45 55%
Preemptiva US$ 0,97 70%

Preços do Cloud TPU v2 e v3

Os preços e a cota da TPU v2 e v3 da Cloud são divididos em dois sistemas:

  • Preço do tipo de TPU de dispositivo único para dispositivos de TPU individuais que estão disponíveis sob demanda ou como dispositivos preemptivos. Não é possível combinar vários tipos de TPU de dispositivo único para colaborar em uma única carga de trabalho.
  • Preços do tipo de pod da TPU para clusters de dispositivos de TPU conectados entre si por redes dedicadas de alta velocidade. Esses tipos de TPU só estarão disponíveis se você tiver uma cota de avaliação ou adquirir um compromisso de um ou três anos.

Consulte a documentação da Arquitetura do sistema de TPU para ver detalhes sobre a arquitetura e as diferenças entre a v2, a v3 e a v4.

Preço para dispositivos únicos

Os tipos de TPU de dispositivo único são cobrados em incrementos de um segundo e estão disponíveis para preço sob demanda ou preço preemptivo.

Os tipos de TPU de dispositivo único são dispositivos independentes de TPU sem conexões de rede diretas com outros dispositivos desse tipo em um data center do Google. Se sua carga de trabalho exigir mais núcleos de TPU e um pool de memória maior, use um tipo de pod da TPU.

Uma TPU preemptiva pode ser interrompida a qualquer momento se a Cloud TPU exigir acesso aos recursos para outra tarefa. As cobranças por uma TPU preemptiva são muito mais baixas do que as de uma TPU normal. Não haverá cobranças pelas TPUs preemptivas se elas forem interrompidas no primeiro minuto após a criação.

Preços dos tipos de pods da TPU

Os tipos de pods da TPU fornecem acesso a vários dispositivos TPU conectados em uma rede dedicada de alta velocidade. Esses tipos de TPU oferecem maior capacidade de computação e um pool maior de memória do que um único nó de TPU. Para usar os tipos de pods da TPU, é preciso solicitar cota usando uma das seguintes opções:

  • Solicitar acesso à cota de avaliação para testar o desempenho dos tipos de pods da TPU. Os nós da TPU criados por meio da cota de avaliação são cobrados em incrementos de um segundo, mas não garantem o mesmo nível de serviço que os dispositivos da TPU sob demanda ou dispositivos criados por meio da cota de uso contínuo. A cota de avaliação permanece no projeto apenas por um tempo limitado.
  • Assine o contrato de um ou três anos e crie nós da TPU com até 2.048 núcleos. Os compromissos permitem o acesso a núcleos reservados a qualquer momento durante a vigência do contrato. Será cobrada uma taxa mensal definida pela duração do prazo, mesmo que você não use recursos de TPU.

Configure seus nós de TPU com os seguintes tipos de TPU:

Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Para saber mais sobre as diferenças entre as versões e configurações de TPUs, leia o documento Arquitetura do sistema de TPUs.

Otimizar o custo

O Cloud TPU v4 oferece até 35% de economia em modelos baseados em Transformadores e até 50% em ResNet em comparação com A100 no Azure.

Comparação de custos da Cloud TPU v4

A economia é especialmente significativa, já que modelos reais, como GPT-3 e PaLM, são muito maiores do que os modelos BERT e ResNet usados no comparativo de mercado MLPerf: o PaLM é um modelo de parâmetro de 540 bilhões de dados, enquanto o modelo BERT usado no comparativo de mercado MLPerf tem apenas 340 milhões de parâmetros, uma diferença de 1,000 Com base na nossa experiência, os benefícios das TPUs aumentarão significativamente com o escalonamento e tornarão o caso mais atraente para o treinamento no Cloud TPU v4.

Estime seu custo

Estime o custo do uso da Cloud TPU com a calculadora de preços do Compute Engine, escolha "Cloud TPU" na barra superior.

Vá além

Solicite uma cotação personalizada

Com os preços de pagamento por utilização do Google Cloud, você paga apenas pelos serviços que usa. Fale com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato com a equipe de vendas