Unidade de Processamento de Tensor (TPU) Ironwood

Ironwood: a 7ª geração de TPUs do Google Cloud projetada para inferência

Treine, ajuste e disponibilize modelos e conjuntos de dados maiores com eficiência usando a TPU mais avançada até agora.

Solicite mais informações sobre o Ironwood.

Nome

Sobrenome

E-mail comercial

Código de chamada

Telefone comercial

Cargo

Nome da empresa

Quero receber notícias, atualizações de produtos, informações sobre eventos e ofertas especiais relacionadas ao Google Cloud.

Entendo que meus dados pessoais serão processados de acordo com a Política de Privacidade do Google.

Sua infraestrutura está pronta para a era da inferência?

O Ironwood é a Unidade de Processamento de Tensor (TPU) mais potente, capaz e eficiente em termos de energia do Google até o momento, projetada para impulsionar modelos de IA de raciocínio e inferência em grande escala. Com base na vasta experiência no desenvolvimento de TPUs para os serviços internos do Google e clientes do Google Cloud, o Ironwood foi criado para lidar com as demandas computacionais e de memória de modelos como modelos de linguagem grandes (LLMs), misturas de especialistas (MoEs) e tarefas de raciocínio avançadas. Ele oferece suporte a cargas de trabalho de treinamento e disponibilização na arquitetura de hipercomputador de IA do Google Cloud.

Otimizado para modelos de linguagem grandes (LLMs): o Ironwood foi criado especificamente para acelerar as demandas crescentes de LLMs e aplicativos de IA generativa.
Tecnologia de interconexão aprimorada: aproveite as melhorias na tecnologia de interconexão de TPU, que permite uma comunicação mais rápida e reduz a latência.
Computação de alto desempenho: tenha ganhos significativos de desempenho para uma ampla variedade de tarefas de inferência.
IA sustentável: a Ironwood continua o compromisso do Google Cloud com a sustentabilidade, oferecendo desempenho excepcional com eficiência energética otimizada.

O Ironwood integra maior densidade de computação, capacidade de memória e largura de banda de interconexão com ganhos significativos na eficiência energética. Esses recursos foram criados para permitir maior capacidade de processamento e latência mais baixa para cargas de trabalho exigentes de treinamento e disponibilização de IA, principalmente aquelas que envolvem modelos grandes e complexos. As TPUs Ironwood operam na arquitetura de hipercomputador de IA do Google Cloud.

Os produtos de IA do Google Cloud estão em conformidade com nossas políticas de SLA. Elas oferecem garantias de latência ou disponibilidade diferentes de outros serviços do Google Cloud.