Cloud TPU

Treine e execute modelos de machine learning mais rápido do que nunca.

Descrição do conteúdo do vídeo.

Como capacitar empresas com IA do Google Cloud

O machine learning resultou em inovações nos negócios e nas pesquisas que abrangem desde a segurança de rede até diagnósticos médicos. Desenvolvemos a Unidade de Processamento de Tensor (TPU) para que inovações semelhantes possam ser alcançadas por qualquer um. A Cloud TPU é o ASIC de machine learning personalizado usado em produtos do Google, como o Tradutor, o Fotos, a Pesquisa, o Assistente e o Gmail. Veja como usar a TPU e o machine learning para acelerar o sucesso da sua empresa, principalmente em escala.
Imagem da infraestrutura de TPU da IA do Cloud.

Projetada para IA no Google Cloud

A Cloud TPU foi criada para executar modelos de machine learning de última geração com serviços de IA no Google Cloud. A rede personalizada de alta velocidade oferece mais de 100 petaflops de desempenho em um único pod, uma capacidade computacional suficiente para transformar seus negócios ou criar a próxima inovação de pesquisa.

Imagem de iteração rápida

Iteração mais rápida nas soluções de ML

Treinar modelos de machine learning é como compilar um código: é necessário atualizar frequentemente e da maneira mais eficiente possível. Os modelos de ML precisam ser treinados repetidamente à medida que aplicativos são desenvolvidos, implantados e aprimorados. O desempenho robusto e de baixo custo da Cloud TPU a torna ideal para equipes de machine learning que pretendem fazer iterações rápidas e frequentes nas soluções.

Modelos comprovados de última geração

É possível criar suas próprias soluções baseadas em machine learning para muitos casos de uso no mundo real. Basta trazer seus dados, fazer o download de um modelo de referência otimizado para o Google e começar o treinamento.

Teste a demonstração

Quer saber mais sobre como a Cloud TPU é ajustada para seus aplicativos de machine learning?

Teste a demonstração a ou leia o blog.

Desempenho e comparativos de mercado de machine learning

Para ver uma comparação entre a Cloud TPU e outros aceleradores, leia o blog ou veja os resultados do comparativo de mercado com o MLPerf.

Oferta da Cloud TPU

Imagens e descrições das ofertas de TPU do Google Cloud.

A Cloud TPUv4 está disponível. Para solicitar uma cotação da TPUv4, entre em contato com um representante de vendas.

Características da Cloud TPU

Biblioteca de modelos

Comece a aproveitar imediatamente nossas crescentes bibliotecas de modelos otimizados para a Cloud TPU. Elas oferecem desempenho, acurácia e qualidade aperfeiçoados em classificação de imagens, detecção de objetos, modelamento de idiomas, reconhecimento de fala e muito mais.

Conecte Cloud TPUs a tipos de máquinas personalizados

É possível se conectar às Cloud TPUs a partir de tipos personalizados de Deep Learning VM Image, que ajudam a equilibrar perfeitamente velocidades de processamento, memória e recursos de armazenamento de alto desempenho para suas cargas de trabalho.

Integração total com o Google Cloud

Em essência, os serviços de dados e análise das Cloud TPUs e do Google Cloud são totalmente integrados a outras ofertas do Google Cloud, como o Google Kubernetes Engine (GKE). Portanto, ao executar cargas de trabalho de machine learning em Cloud TPUs, você aproveita as tecnologias líderes do setor de armazenamento, rede e análise de dados do Google Cloud.

Cloud TPU preemptiva

Economize dinheiro usando as Cloud TPUs preemptivas para cargas de trabalho de machine learning tolerantes a falhas, como longas execuções de treinamentos com checkpoints ou previsão em lote de grandes conjuntos de dados. A Cloud TPU preemptiva tem custo 70% menor que as instâncias por demanda. Dessa forma, todos os itens estão mais acessíveis que nunca, desde seus primeiros testes até pesquisas de hiperparâmetros em larga escala.

O potencial de usar Pods da Cloud TPU para acelerar nossa pesquisa de aprendizado profundo e manter baixa complexidade e custos operacionais é um grande atrativo. Leva um pouco mais de 24 horas para treinarmos modelos em nosso cluster de GPU local. Levará, dependendo do tamanho do pod da TPU, de 7 horas a 15 minutos.

Ben Mabey, vice-presidente de Engenharia da Recursion Pharmaceuticals

Nossos clientes

Preços

As cobranças da Cloud TPU se baseiam no uso preemptivo e não preemptivo (sob demanda) para o treinamento de modelos de machine learning. Para saber mais, consulte o guia de preços.

Preços de um único dispositivo Cloud TPU

Veja na tabela a seguir os preços por região para o uso de um único dispositivo da Cloud TPU.

Versão Sob demanda Preemptiva
Cloud TPU v2 US$ 4,50/TPU/hora US$ 1,35/TPU/hora
Cloud TPU v3 US$ 8,00/TPU/hora US$ 2,40/TPU/hora

Preços do pod da Cloud TPU

Na tabela a seguir, mostramos os preços para usar frações de um Pod da Cloud TPU.

Pod da Cloud TPU v2 Preço de avaliação/hora Preço de compromisso por 1 ano (desconto de 37%) Preço de compromisso por 3 anos (desconto de 55%)
Fração do pod de 32 núcleos US$ 24 US$ 132.451 US$ 283.824
Fração do pod de 128 núcleos US$ 96 US$ 529.805 US$ 1.135.296
Fração do pod de 256 núcleos US$ 192 US$ 1.059.610 US$ 2.270.592
Fração do pod de 512 núcleos US$ 384 US$ 2.119.219 US$ 4.541.184
Pod da Cloud TPU v3 Preço de avaliação/hora Preço de compromisso por 1 ano (desconto de 37%) Preço de compromisso por 3 anos (desconto de 55%)
Fração do pod de 32 núcleos US$ 32 US$ 176.601 US$ 378.432

Para solicitar uma configuração do Pod do Cloud TPU ou uma cotação para frações maiores do Pod do Cloud TPU v3, entre em contato com um representante de vendas. O pod do Cloud TPUv4 já está disponível. Para solicitar uma cotação do Cloud TPU v4, entre em contato com um representante de vendas.

Próximos passos

Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.

Precisa de ajuda para começar?
Trabalhe com um parceiro confiável
Continue navegando

Próximos passos

Inicie seu próximo projeto, veja tutoriais interativos e gerencie sua conta.

Precisa de ajuda para começar?
Trabalhe com um parceiro confiável
Veja dicas e práticas recomendadas

Os produtos de IA do Cloud estão em conformidade com as políticas de SLA do Google Cloud. Eles oferecem garantias de latência ou disponibilidade diferentes de outros serviços do Google Cloud.