Preços da Cloud TPU
As Cloud TPUs são supercomputadores personalizados projetados para executar modelos de machine learning de ponta no Google Cloud, com desempenho líder de mercado líder de mercado. Os exaflops do poder de computação podem ajudar você a transformar seu negócio ou criar a próxima inovação de pesquisa.
Saiba mais sobre como os pods da Cloud TPU v4 ajudam os pesquisadores e desenvolvedores de ML a enviar os limites da IA de forma sustentável e eficiente.
Saiba quais produtos do Cloud TPU funcionam melhor para as suas necessidades de projeto.
Como funcionam os preços do Cloud TPU
Produtos
Os pods da Cloud TPU v4 são a última geração dos aceleradores de ML personalizados do Google e agora estão disponíveis no GA. Todas as formas de fatia do pod da TPU v4 usam o mesmo sistema de preços da v4.
No entanto, os preços e as cotas da Cloud TPU v2
e v3
são divididos em dois sistemas:
- Preços de TPU de dispositivo único para dispositivos de TPU individuais que estão disponíveis sob demanda ou como dispositivos preemptivos (70% de desconto no preço de tabela de avaliação). Os tipos de TPU de dispositivo único são independentes e não têm conexões de rede diretas com outros dispositivos de TPU em um data center do Google. Se as cargas de trabalho exigirem mais núcleos de TPU e um pool de memória maior, use uma fração do pod da TPU.
- Preços do Pod de TPU para clusters de dispositivos TPU conectados entre si por redes dedicadas de alta velocidade. Esses tipos de TPU estão disponíveis se você tiver uma cota de avaliação, cota preemptiva (70% de desconto no preço de tabela de avaliação) ou adquirir um compromisso de um ou três anos.
Para saber mais sobre a TPU v2, v3 e v4, consulte Arquitetura do sistema da TPU.
As cobranças para uma Cloud TPU serão acumuladas enquanto seu nó de TPU estiver em estado READY
.
Você receberá uma cobrança no fim de cada ciclo de faturamento listando o uso e as cobranças desse ciclo.
Opções de uso
Tipo | Produtos de TPU | Faturamento | Mais adequado para: |
---|---|---|---|
Contrato de três anos (3D CUD) | Pods da TPU v4, pods da TPU v3 e pods da TPU v2 | Mensal, com base na cota reservada | Usuários de ML que precisam de acesso consistente a mais de 512 núcleos de capacidade |
Contrato de um ano (um ano de desconto por uso contínuo) | Pods da TPU v4, pods da TPU v3 e pods da TPU v2 | Mensal, com base na cota reservada | Usuários de ML que precisam de acesso consistente a 32 a 512 núcleos de capacidade |
Avaliação (sob demanda) | Pods da TPU v4, pods da TPU v3, pods da TPU v2, TPU v3*, TPU v2* | A cada hora, com base no uso real | Usuários de ML que querem fazer alguns experimentos ou comparativos de mercado de curto prazo |
Preemptiva | Pods da TPU v4, TPU v3*, pods v3 da TPU, TPU v2*, pods da TPU v2 | A cada hora, com base no uso real | Usuários de ML que querem executar cargas de trabalho em lote / tolerantes a falhas |
*Dispositivos únicos com oito núcleos. Na página SKU, esses dispositivos são chamados de aceleradores Tpu-v2 ou Tpu-v3.
Chips, núcleos e VMs
Uma VM da TPU (máquina virtual da TPU) tem 4 chips e 8 núcleos. O faturamento no console do Google Cloud é exibido em horas de VM.Por exemplo, o preço sob demanda para um único host do Cloud TPU v4, que inclui quatro chips TPU v4, é exibido como US $12,88 por hora. Os dados de uso no console do Google Cloud também são medidos em horas de VM.
Acesso gratuito por TRC
Clientes novos recebem US$ 300 em créditos para usar no Google Cloud. Comece agora.
Se você é pesquisador, estudante, engenheiro, artista ou empreendedor, considere se inscrever no programa TPU Cloud Research. Os membros do TRC recebem acesso gratuito a um grande cluster de Cloud TPUs e compartilham o trabalho com o mundo usando publicações revisadas por pares, código aberto, postagens de blog, vídeos e outras mídias. Veja alguns exemplos de publicações compatíveis com TRC.
Inscreva-se para acelerar sua pesquisa hoje mesmo.
Componentes do preço
Preços do Cloud TPU v4
O Cloud TPU v4 é a última geração dos aceleradores de machine learning personalizados do Google. Agora está disponível no GA. Ele mantém a compatibilidade com versões anteriores com o Cloud TPU v2 e v3, mas tem um aumento de mais de 2 vezes em relação ao Cloud TPU v3 no desempenho de computação bruto por chip. Cada chip TPU v4 também contém um único núcleo lógico, permitindo o uso de 32 GiB de memória total de um programa, em comparação com 8 GiB na v2 e 16 GiB na v3. As frações de pods da Cloud TPU v4 estão conectadas com uma interconexão personalizada que usa uma topologia de malha 3D, um upgrade da malha 2D na v2 e na v3 e estão disponíveis em configurações que variam de quatro chips (uma VM de TPU) a milhares de chips.
Os pods da Cloud TPU v4 estão disponíveis em us-central2-b, o data center do Google que opera com 90% de energia livre de carbono a cada hora, na mesma grade. Esse é o maior hub de ML disponível publicamente no mundo, com até 9 exaflops de desempenho agregado máximo.
A tabela a seguir mostra os preços das configurações do Cloud TPU v4. O preço de v4
é baseado no número de ícones na topologia. Há dois núcleos
em cada ícone.
Preços da TPU v4 | Preço por chip-hora | % de desconto sob demanda |
---|---|---|
sob demanda / avaliação | US$ 3,22 | |
Reserva de CUD (desconto de uso contínuo) de 1Y | US$ 2,03 | 37% |
Reserva de CUD 3Y (desconto por compromisso de uso) | US$ 1,45 | 55% |
Preemptiva | US$ 0,97 | 70% |
Preços do Cloud TPU v2 e v3
Os preços e a cota da TPU v2 e v3 da Cloud são divididos em dois sistemas:
- Preço do tipo de TPU de dispositivo único para dispositivos de TPU individuais que estão disponíveis sob demanda ou como dispositivos preemptivos. Não é possível combinar vários tipos de TPU de dispositivo único para colaborar em uma única carga de trabalho.
- Preços do tipo de pod da TPU para clusters de dispositivos de TPU conectados entre si por redes dedicadas de alta velocidade. Esses tipos de TPU só estarão disponíveis se você tiver uma cota de avaliação ou adquirir um compromisso de um ou três anos.
Consulte a documentação da Arquitetura do sistema de TPU para ver detalhes sobre a arquitetura e as diferenças entre a v2, a v3 e a v4.
Preço para dispositivos únicos
Os tipos de TPU de dispositivo único são cobrados em incrementos de um segundo e estão disponíveis para preço sob demanda ou preço preemptivo.
Os tipos de TPU de dispositivo único são dispositivos independentes de TPU sem conexões de rede diretas com outros dispositivos desse tipo em um data center do Google. Se sua carga de trabalho exigir mais núcleos de TPU e um pool de memória maior, use um tipo de pod da TPU.
Uma TPU preemptiva pode ser interrompida a qualquer momento se a Cloud TPU exigir acesso aos recursos para outra tarefa. As cobranças por uma TPU preemptiva são muito mais baixas do que as de uma TPU normal. Não haverá cobranças pelas TPUs preemptivas se elas forem interrompidas no primeiro minuto após a criação.
Preços dos tipos de pods da TPU
Os tipos de pods da TPU fornecem acesso a vários dispositivos TPU conectados em uma rede dedicada de alta velocidade. Esses tipos de TPU oferecem maior capacidade de computação e um pool maior de memória do que um único nó de TPU. Para usar os tipos de pods da TPU, é preciso solicitar cota usando uma das seguintes opções:
- Solicitar acesso à cota de avaliação para testar o desempenho dos tipos de pods da TPU. Os nós da TPU criados por meio da cota de avaliação são cobrados em incrementos de um segundo, mas não garantem o mesmo nível de serviço que os dispositivos da TPU sob demanda ou dispositivos criados por meio da cota de uso contínuo. A cota de avaliação permanece no projeto apenas por um tempo limitado.
- Assine o contrato de um ou três anos e crie nós da TPU com até 2.048 núcleos. Os compromissos permitem o acesso a núcleos reservados a qualquer momento durante a vigência do contrato. Será cobrada uma taxa mensal definida pela duração do prazo, mesmo que você não use recursos de TPU.
Configure seus nós de TPU com os seguintes tipos de TPU:
Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.
Para saber mais sobre as diferenças entre as versões e configurações de TPUs, leia o documento Arquitetura do sistema de TPUs.
Otimizar o custo
O Cloud TPU v4 oferece até 35% de economia em modelos baseados em Transformadores e até 50% em ResNet em comparação com A100 no Azure.
A economia é especialmente significativa, já que modelos reais, como GPT-3 e PaLM, são muito maiores do que os modelos BERT e ResNet usados no comparativo de mercado MLPerf: o PaLM é um modelo de parâmetro de 540 bilhões de dados, enquanto o modelo BERT usado no comparativo de mercado MLPerf tem apenas 340 milhões de parâmetros, uma diferença de 1,000 Com base na nossa experiência, os benefícios das TPUs aumentarão significativamente com o escalonamento e tornarão o caso mais atraente para o treinamento no Cloud TPU v4.
Estime seu custo
Estime o custo do uso da Cloud TPU com a calculadora de preços do Compute Engine, escolha "Cloud TPU" na barra superior.
Vá além
- Use o formulário de inscrição do Cloud TPU para comprar cotas e/ou saber mais sobre eles. Se preferir, entre em contato com nossa equipe de vendas.
- Leia a postagem do blog sobre o lançamento do Cloud TPU v4.
- Assista ao anúncio do TPU v4 do Google I/O 2022.
- Saiba mais sobre a configuração do registro da TPU v4 MLPerf 2.0.
- Leia a página política de cotas da Cloud TPU para saber como solicitar uma cota para diferentes tipos de TPU.
- Verifique as regiões e zonas em que a Cloud TPU está disponível.
- Veja as Notas de lançamento para atualizações futuras nos preços.
- Leia a documentação do Cloud TPU.
- Dê os primeiros passos com o Cloud TPU.
- Saiba mais sobre as soluções e os casos de uso do Cloud TPU.