Família de máquinas otimizada para HPC no Compute Engine


As instâncias otimizadas para HPC são ideais para cargas de trabalho de computação intensiva e de alto desempenho (HPC). As instâncias otimizadas para HPC oferecem o melhor desempenho por núcleo e são criadas em uma arquitetura que utiliza recursos como acesso à memória não uniforme (NUMA) para um desempenho uniforme confiável e ideal.

Máquina Cargas de trabalho
Série de máquinas H4D (prévia)
  • Cargas de trabalho de HPC e de vários nós
  • Manufatura
  • Previsão do tempo
  • Automação de design eletrônico (EDA)
  • Saúde e ciências biológicas
  • Computação científica
Série de máquinas H3
  • Cargas de trabalho de HPC
  • Dinâmica de fluidos computacionais
  • Segurança em caso de colisão
  • Genomics
  • Modelos financeiros
  • Computação científica e de engenharia geral

As seguintes séries de máquinas estão disponíveis nesta família de máquinas:

  • As instâncias H4D (prévia) são alimentadas por processadores AMD EPYC Turin, que têm uma frequência base de 2,7 GHz e uma frequência máxima de 4,1 GHz. As instâncias H4D têm 192 núcleos (vCPUs) e até 1.488 GB de memória. As instâncias H4D podem ser usadas com armazenamento SSD local e rede Cloud RDMA.
  • As instâncias H3 são alimentadas por dois processadores escalonáveis Intel Xeon de 4a geração (chamados de Sapphire Rapids) que têm uma frequência all-core de 3,0 GHz. As instâncias H3 têm 88 vCPUs e 352 GB de memória DDR5.

Série de máquinas H4D

As instâncias H4D usam a tecnologia dos processadores AMD EPYC Turin de 5ª geração e dos processadores de descarga Titanium.

As instâncias H4D oferecem alto desempenho, baixo custo e escalonabilidade para cargas de trabalho com vários nós. As instâncias H4D são de linha de execução única e otimizadas para aplicativos com acoplamento rígido que escalonam em vários nós. Aproveitando tecnologias como rede de 200 Gbps habilitada para RDMA e Cluster Director, essas instâncias priorizam o desempenho e as otimizações específicas da carga de trabalho. Além disso, é possível usar o Dynamic Workload Scheduler para implantação de cluster programada ou imediata, o que torna o H4D ideal para necessidades de carga de trabalho de HPC.

Uma instância H4D usa todas as vCPUs em um servidor host inteiro. As instâncias H4D podem usar toda a largura de banda da rede do host e vêm com uma taxa de largura de banda de rede padrão de até 200 Gbps. No entanto, a largura de banda da instância para a Internet está limitada a 1 Gbps.

O multithreading simultâneo (SMT) está desativado para instâncias H4D e não pode ser ativado. Também não há compromissos excessivos para garantir a consistência ideal da performance.

As instâncias H4D estão disponíveis sob demanda ou com descontos por compromisso de uso (CUDs) de um e três anos. Para comparar esses métodos, consulte Modelos de provisionamento de instâncias do Compute Engine.

Limitações do H4D

A série de máquinas H4D tem as seguintes restrições:

  • Os tipos de máquina H4D estão disponíveis apenas em um tipo de máquina predefinido. Os tipos de máquina personalizados não estão disponíveis.
  • Não é possível usar GPUs com instâncias H4D.
  • A transferência de dados de saída é limitada a 1 Gbps.
  • Não é possível criar imagens de máquina com base em instâncias H4D.
  • As imagens de máquina H4D não podem ser usadas para criar discos.
  • Não é possível compartilhar discos entre instâncias, seja no modo de vários gravadores ou no modo somente leitura.
  • O desempenho do Hyperdisk Balanced é limitado a 15.000 IOPS e 240 MBps de capacidade de processamento.
  • A migração em tempo real não é compatível com instâncias H4D.

Tipos de máquina H4D

Tipos de máquina vCPUs1 Memória (GB) SSD Titanium Largura de banda de saída padrão (Gbps)2 Nós NUMA
h4d-highmem-192-lssd 192 1.488 (10 x 375 GiB)
3.750 GiB
Até 200 Gbps 2

1 Uma vCPU representa um núcleo inteiro, sem multissegmentação simultânea (SMT).
2 A largura de banda de saída padrão não pode exceder o número informado. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda de rede.

Tipos de disco compatíveis com H4D

As instâncias H4D podem usar os seguintes tipos de armazenamento em blocos:

  • Hiperdisco equilibrado (hyperdisk-balanced)
  • SSD Titanium local

Limites de disco e capacidade

As seguintes restrições são aplicadas:

  • O número de volumes do Hyperdisk não pode exceder 64 por VM.
  • A capacidade total máxima de disco em todos os discos não pode exceder 512 TiB.

Para detalhes sobre os limites de capacidade, consulte Limites de capacidade de hiperdisco por VM.

Os limites de armazenamento da série H4D são descritos na seguinte tabela:

Número máximo de discos por instância
Tipos de máquina Todos os tipos de
Hyperdisk
Hiperdisco equilibrado Capacidade de processamento do hiperdisco Hiperdisco extremo
h4d-highmem-192-lssd 64 8 0 0

Suporte de rede para instâncias H4D

As instâncias H4D exigem interfaces de rede gVNIC. O H4D é compatível com até 200 Gbps de largura de banda para rede padrão. A largura de banda de saída da instância para a Internet é limitada a 1 Gbps.

As instâncias compatíveis com RDMA exigem pelo menos duas interfaces de rede (vNICs). Uma vNIC é usada para redes normais e está totalmente conectada à rede do Google e, opcionalmente, à Internet. Essa vNIC usa o driver gVNIC. A outra vNIC usa um driver Intel iDPF/iRDMA e é usada para comunicação RDMA. A vNIC do RDMA não se conecta à Internet.

Antes de migrar para a H4D ou criar instâncias H4D, verifique se a imagem do sistema operacional usada é totalmente compatível com a H4D. As imagens totalmente compatíveis incluem suporte para largura de banda de rede de 200 Gbps. Se você estiver usando o Cloud RDMA, a imagem do SO também precisará ser compatível com o tipo de interface de rede IRDMA. Se a instância H4D estiver usando um sistema operacional que não tem suporte total ou tem versões anteriores dos drivers de rede, talvez ela não consiga alcançar a largura de banda máxima da rede para instâncias H4D.

Experiência de manutenção para instâncias H4D

Durante o ciclo de vida de uma instância do Compute Engine, a máquina host em que a instância é executada passa por vários eventos de host. Um evento de host pode incluir a manutenção regular da infraestrutura do Compute Engine ou, em casos raros, um erro de host. O Compute Engine também aplica alguns upgrades leves não destrutivos para o hipervisor e a rede em segundo plano.

A série de máquinas H4D oferece os seguintes recursos relacionados à manutenção do host:

Tipo de máquina Frequência típica de eventos de manutenção programada Comportamento de manutenção Notificação avançada Manutenção sob demanda Simular manutenção
h4d-highmem-192-lssd Mínimo de 30 dias Termina com permanência de dados no SSD local 7 dias Sim Sim

As frequências de manutenção mostradas na tabela anterior são aproximações, não garantias. O Compute Engine pode, às vezes, realizar manutenção com mais frequência.

Série de máquinas H3

As instâncias H3 usam a tecnologia da 4a geração de processadores escalonáveis Intel Xeon (codinome Sapphire Rapids), memória DDR5 e processadores de descarga Titanium.

As instâncias H3 oferecem o melhor custo-benefício para cargas de trabalho de computação de alto desempenho (HPC) com uso intensivo de computação no Compute Engine. As instâncias H3 são de linha de execução única e ideais para várias cargas de trabalho de modelagem e simulação, incluindo dinâmica de fluidos computacional, segurança contra falhas, genômica, modelagem financeira e computação científica e de engenharia em geral. As instâncias H3 oferecem suporte ao posicionamento compacto, otimizado para aplicativos com acoplamento rígido que escalonam em vários nós.

A série H3 está disponível em um tamanho único que abrange um servidor host inteiro. Para economizar nos custos de licenciamento, é possível personalizar o número de núcleos visíveis, mas o preço pela instância será cobrado. As instâncias H3 podem usar toda a largura de banda da rede do host e vêm com uma taxa de largura de banda de rede padrão de até 200 Gbps. No entanto, a largura de banda da instância para a Internet está limitada a 1 Gbps.

O multithreading simultâneo (SMT) está desativado para instâncias H3 e não pode ser ativado. Também não há compromissos excessivos para garantir a consistência ideal da performance.

As instâncias H3 estão disponíveis sob demanda ou com descontos por compromisso de uso (CUDs) de um e três anos. As instâncias H3 podem ser usadas com o Google Kubernetes Engine.

Limitações do H3

A série de máquinas H3 tem as seguintes restrições:

  • A série de máquinas H3 está disponível apenas em um tipo de máquina predefinido. Os formatos de máquina personalizados não estão disponíveis.
  • Não é possível usar GPUs com instâncias H3.
  • A transferência de dados de saída é limitada a 1 Gbps.
  • O desempenho do Persistent Disk e do Google Cloud Hyperdisk é limitado a 15.000 IOPS e 240 MBps de capacidade de processamento.
  • As instâncias H3 não são compatíveis com imagens de máquina.
  • As instâncias H3 são compatíveis apenas com a interface de armazenamento NVMe.
  • As imagens de instância H3 não podem ser usadas para criar discos.
  • As instâncias H3 não são compatíveis com compartilhamento de discos entre instâncias, seja no modo de vários gravadores ou no modo somente leitura.

Tipos de máquina H3

As instâncias H3 estão disponíveis como uma configuração predefinida com 88 vCPUs e 352 GB de memória.

Tipos de máquina vCPUs1 Memória (GB) SSD local Largura de banda de saída padrão (Gbps)2
h3-standard-88 88 352 Sem suporte Até 200 Gbps

1 Uma vCPU representa um núcleo inteiro, sem multissegmentação simultânea (SMT).
2 A largura de banda de saída padrão não pode exceder o número informado. A largura de banda de saída real depende do endereço IP de destino e de outros fatores. Consulte Largura de banda de rede.

Tipos de disco compatíveis com H3

As instâncias H3 podem usar os seguintes tipos de armazenamento em blocos:

  • Disco permanente equilibrado (pd-balanced)
  • Hiperdisco equilibrado (hyperdisk-balanced)
  • Capacidade de processamento do hiperdisco (hyperdisk-throughput)

Limites de disco e capacidade

Se o tipo de máquina for compatível, é possível anexar uma combinação de volumes do Hyperdisk e do Persistent Disk a uma instância, mas as seguintes restrições se aplicam:

  • O número combinado de volumes do Hyperdisk e Persistent Disk não pode exceder 128 por instância.
  • A capacidade total máxima de disco (em TiB) em todos os tipos de disco não pode exceder:

    • 512 TiB para todos os Hyperdisks
    • 512 TiB para uma combinação de Hyperdisk e Persistent Disk
    • 257 TiB para todos os Persistent Disks

Para detalhes sobre os limites de capacidade, consulte Limites de tamanho e anexação do Hyperdisk e Capacidade máxima do Persistent Disk.

Os limites de armazenamento da série H3 são descritos na seguinte tabela:

Número máximo de discos por instância
Tipos de máquina Todos os tipos de disco 1 Todos os tipos de
Hyperdisk
Hiperdisco equilibrado Capacidade de processamento do hiperdisco Hiperdisco extremo
h3-standard-88 128 64 8 64 0

1 Esse limite se aplica ao Persistent Disk e Hyperdisk, mas não inclui discos SSD locais.

Suporte de rede para instâncias H3

As instâncias H3 exigem interfaces de rede gVNIC. O H3 é compatível com até 200 Gbps de largura de banda para rede padrão.

Antes de migrar para o H3 ou criar instâncias H3, verifique se a imagem do sistema operacional que você usa é compatível com o driver gVNIC. Para ter o melhor desempenho possível nas instâncias H3, na guia Recursos de rede da tabela de detalhes do SO, escolha uma imagem do SO que seja compatível com "Rede Tier_1" e "Largura de banda de rede de 200 Gbps". Essas imagens incluem um driver gVNIC atualizado, mesmo que o SO convidado mostre a versão do driver gve como 1.0.0. Se a instância H3 estiver usando um sistema operacional com uma versão mais antiga do driver gVNIC, isso ainda será compatível, mas a instância poderá ter um desempenho abaixo do ideal, como menos largura de banda de rede ou maior latência.

Se você usar uma imagem do SO personalizada com a série de máquinas H3, poderá instalar manualmente o driver da gVNIC mais recente. A versão do driver gVNIC v1.4.2 ou mais recente é recomendada para uso com instâncias H3. O Google recomenda usar a versão mais recente do driver da gVNIC para aproveitar os recursos adicionais e as correções de bugs.

Experiência de manutenção para instâncias H3

Durante o ciclo de vida de uma instância do Compute Engine, a máquina host em que a instância é executada passa por vários eventos de host. Um evento de host pode incluir a manutenção regular da infraestrutura do Compute Engine ou, em casos raros, um erro de host. O Compute Engine também aplica alguns upgrades leves não destrutivos para o hipervisor e a rede em segundo plano.

A série de máquinas H3 oferece os seguintes recursos relacionados à manutenção do host:

Tipo de máquina Frequência típica de eventos de manutenção programada Comportamento de manutenção Notificação avançada Manutenção sob demanda Simular manutenção
h3-standard-88 Mínimo de 30 dias Migração em tempo real 7 dias Sim Sim

As frequências de manutenção mostradas na tabela anterior são aproximações, não garantias. O Compute Engine pode, às vezes, realizar manutenção com mais frequência.

A seguir