A família de máquinas com otimização para aceleradores foi projetada pelo Google Cloud para oferecer o desempenho e a eficiência necessários às cargas de trabalho aceleradas por GPU, como inteligência artificial (IA), machine learning (ML) e computação de alto desempenho (HPC).
A família de máquinas com otimização para aceleradores está disponível nas seguintes séries de máquinas: A3, A2 e G2. Cada tipo de máquina em uma série tem um modelo específico e um número de GPUs NVIDIA anexadas. Também é possível anexar alguns modelos de GPU a tipos de máquinas de uso geral N1.
Recomendação de série de máquinas por tipo de carga de trabalho
Na seção a seguir, apresentamos as séries de máquinas recomendadas com base nas cargas de trabalho da GPU.
Tipo de carga de trabalho | Série ou tipo de máquina recomendado |
---|---|
Pré-treinamento de modelos | A3 Ultra, A3 Mega, A3 High, A2 Para identificar a melhor opção, consulte Recomendações para modelos de pré-treinamento na documentação do Hypercomputer de IA. |
Ajuste de modelos | A3 Mega, A3 High, A2 Para identificar a melhor opção, consulte Recomendações para ajustar modelos na documentação do Hypercomputer de IA. |
Como veicular a inferência | A3 Ultra, A3 Mega, A3 High, A2 Para identificar a melhor opção, consulte Recomendações para veicular inferência na documentação do Hypercomputer de IA. |
Cargas de trabalho com uso intensivo de gráficos | G2, N1+T4 |
Computação de alto desempenho | Para cargas de trabalho de computação de alto desempenho, qualquer série de máquinas otimizada para aceleradores funciona bem. O melhor ajuste depende da quantidade de computação que precisa
ser transferida para a GPU. Para mais informações, consulte Recomendações para HPC na documentação do hipercomputador de IA. |
Preços e descontos
Todos os tipos de máquina com otimização para aceleradores são compatíveis com as seguintes opções de desconto e consumo:
- Descontos por uso contínuo (CUDs) baseados em recursos
- Spot VMs
- Reservas:
as reservas podem ser obtidas por um dos seguintes métodos:
- Diretamente pela API de reserva
- Solicitar capacidade usando o cluster do Hypercompute. O cluster do Hypercompute está disponível na pré-visualização e oferece suporte apenas aos tipos de máquina A3 Ultra. Esse método provisiona blocos de capacidade alocada com densidade, que são ideais para executar cargas de trabalho de grande escala.
Os tipos de máquina com otimização para aceleradores são faturados por suas GPUs anexadas, vCPU predefinida, memória e SSD local empacotado (se aplicável). Para mais informações sobre preços de VMs otimizadas para aceleradores, consulte a seção Família de tipos de máquinas otimizados para aceleradores na página de preços de instâncias de VM.
A série de máquinas A3
A série de máquinas A3 tem até 224 vCPUs e 2.944 GB de memória. Essa série de máquinas é otimizada para uso intenso de computação e memória, treinamento de ML vinculado à rede e cargas de trabalho de HPC.
A série de máquinas A3 também oferece os seguintes recursos:
Recurso | A3 Ultra | A3 Mega, High, Edge |
---|---|---|
GPUs anexas | GPUs NVIDIA H200 SXM anexadas, que oferecem 141 GB de memória de GPU por GPU e memória maior e mais rápida para oferecer suporte a modelos de linguagem grandes e cargas de trabalho de HPC. |
GPUs NVIDIA H100 SXM anexadas, que oferecem 80 GB de memória por GPU e são ideais para grandes modelos de linguagem baseados em transformadores, bancos de dados e HPC. |
Plataforma de CPU | Processador escalonável Intel Xeon de 5ª geração (Emerald Rapids) e oferece até 4,0 GHz de frequência turbo máxima sustentada com um núcleo. Para mais informações sobre esse processador, consulte Plataforma de CPU. |
Processador escalonável Intel Xeon de 4a geração (Sapphire Rapids) e oferece até 3,3 GHz de frequência turbo máxima sustentada com um núcleo. Para mais informações sobre esse processador, consulte Plataforma de CPU. |
Escala do NVLink líder do setor | As GPUs NVIDIA H200 fornecem o pico largura de banda de GPU NVLink de 900 GB/s, unidirecionalmente. Com a topologia de NVLink completa entre oito GPUs em um sistema, a largura de banda NVLink agregada é de até 7,2 TB/s. |
As GPUs NVIDIA H100 fornecem largura de banda de GPU NVLink de pico de 450 GB/s, unidirecionalmente. Com a topologia de NVLink completa entre oito GPUs em um sistema, a largura de banda NVLink agregada é de até 7,2 TB/s. |
Protocolos de rede | Para esse tipo de máquina, a RDMA sobre Ethernet convergente (RoCE, na sigla em inglês) aumenta o desempenho da rede ao
combinar
placas de interface de rede (NICs) NVIDIA ConnectX-7 com nossa
rede alinhada a trilhos de quatro vias em todo o data center. Ao usar RDMA sobre Ethernet Convergente (RoCE),
o tipo de máquina a3-ultragpu-8g alcança uma capacidade de processamento muito maior
entre as VMs em um cluster quando comparado a outros
tipos de máquina otimizados para acelerador A3.
|
|
Melhor velocidade de computação e rede | Oferece até quatro vezes mais velocidade de rede em comparação com a série de máquinas A2 da geração anterior. Para mais informações sobre redes, consulte Larguras de banda de rede e GPUs. |
Oferece até 2,5 vezes a velocidade de rede em comparação com a geração anterior da série de máquinas A2. Para mais informações sobre redes, consulte Larguras de banda de rede e GPUs. |
Otimizações de virtualização | A topologia Express de interconexão de componentes periféricos (PCIe) das VMs A3 fornece informações de localidade mais precisas que as cargas de trabalho podem usar para otimizar as transferências de dados. As GPUs também expõem a redefinição de nível de função (FLR) para recuperação graciosa de falhas e suporte a operações atômicas para melhorias de simultaneidade em determinados cenários. |
|
Armazenamento |
O SSD local pode ser usado como discos de trabalho rápidos ou para alimentar dados nas GPUs, evitando gargalos de E/S. O SSD local é anexado da seguinte maneira:
Você também pode anexar até 512 TiB de disco permanente e Hyperdisk a esses tipos de máquina nestas séries para aplicativos que exigem maior desempenho de armazenamento. |
|
Suporte para políticas de posicionamento compacto | Oferece mais controle sobre o posicionamento físico das suas VMs em data centers. Isso permite menor latência e maior largura de banda para a colocação de VMs em uma única zona de disponibilidade. Para mais informações, consulte Sobre as políticas de posicionamento compacto. |
Os seguintes tipos de máquina estão disponíveis para a série A3.
Tipo de máquina A3 Ultra
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3e) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Contagem de NICs físicas | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-ultragpu-8g |
8 | 1128 | 224 | 2.952 | 12.000 | 10 | 3.600 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações do A3 Ultra
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam um tipo de máquina A3 Ultra.
- Você só pode usar um tipo de máquina A3 Ultra em determinadas regiões e zonas.
- Não é possível usar discos permanentes (regionais ou zonais) em uma VM que usa o tipo de máquina A3 ultra.
- O tipo de máquina A3 Ultra só está disponível na plataforma de CPU Emerald Rapids.
- Se a VM usa um tipo de máquina A3 Ultra, não é possível mudar o tipo. Se você precisar alterar o tipo de máquina, crie uma nova VM.
- Não é possível mudar o tipo de máquina de uma VM para um tipo de máquina A3 Ultra. Se você precisar de uma VM que use um tipo de máquina A3 Ultra, crie uma nova VM.
- Os tipos de máquina A3 Ultra não oferecem suporte a locatário único.
- Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 Ultra.
- Só é possível reservar capacidade usando o Hypercompute Cluster.
Tipo de máquina A3 Mega
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Contagem de NICs físicas | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-megagpu-8g |
8 | 640 | 208 | 1.872 | 6.000 | 9 | 1.800 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações do A3 Mega
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam um tipo de máquina A3 Mega.
- Só é possível usar um tipo de máquina A3 Mega em determinadas regiões e zonas.
- Não é possível usar discos permanentes regionais em uma VM que usa o tipo de máquina A3 Mega.
- O tipo de máquina A3 Mega só está disponível na plataforma de CPU Sapphire Rapids.
- Se a VM usa um tipo de máquina A3 Mega, não é possível mudar o tipo. Se você precisar alterar o tipo de máquina, crie uma nova VM.
- Não é possível mudar o tipo de máquina de uma VM para um tipo de máquina A3 Mega. Se você precisar de uma VM que use um tipo de máquina A3 Mega, crie uma nova VM.
- Os tipos de máquina A3 Mega não oferecem suporte a locatário único.
- Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 Mega.
Tipo de máquina A3 High
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Contagem de NICs físicas | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-highgpu-1g |
1 | 80 | 26 | 234 | 750 | 1 | 25 |
a3-highgpu-2g |
2 | 160 | 52 | 468 | 1.500 | 1 | 50 |
a3-highgpu-4g |
4 | 320 | 104 | 936 | 3.000 | 1 | 100 |
a3-highgpu-8g |
8 | 640 | 208 | 1.872 | 6.000 | 5 | 1.000 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações altas A3
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam um tipo de máquina A3 High.
- Só é possível usar um tipo de máquina A3 High em determinadas regiões e zonas.
- Não é possível usar discos permanentes regionais em uma VM que usa o tipo de máquina A3 High.
- O tipo de máquina A3 High só está disponível na plataforma de CPU Sapphire Rapids.
- Se a VM usa um tipo de máquina A3 High, não é possível mudar o tipo. Se você precisar alterar o tipo de máquina, crie uma nova VM.
- Não é possível mudar o tipo de máquina de uma VM para um tipo de máquina A3 High. Se você precisar de uma VM que use um tipo de máquina A3 High, crie uma nova VM.
- Os tipos de máquina A3 High não oferecem suporte a locatário único.
- Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 High.
- Para os tipos de máquina
a3-highgpu-1g
,a3-highgpu-2g
ea3-highgpu-4g
, as seguintes limitações se aplicam:-
Para esses tipos de máquina,
é necessário usar VMs spot ou um recurso que use o
Dynamic Workload Scheduler (DWS),
como solicitações de redimensionamento em um MIG. Para instruções detalhadas sobre essas opções, consulte o
seguinte:
- Para criar VMs do Spot, consulte
Criar uma VM otimizada para aceleradores
e defina o modelo de provisionamento como
SPOT
. - Para criar uma solicitação de redimensionamento em um MIG que usa o Dynamic Workload Scheduler, consulte Criar um MIG com VMs de GPU.
- Para criar VMs do Spot, consulte
Criar uma VM otimizada para aceleradores
e defina o modelo de provisionamento como
- Não é possível usar o Hyperdisk Balanced com estes tipos de máquina.
- Não é possível criar reservas.
-
Para esses tipos de máquina,
é necessário usar VMs spot ou um recurso que use o
Dynamic Workload Scheduler (DWS),
como solicitações de redimensionamento em um MIG. Para instruções detalhadas sobre essas opções, consulte o
seguinte:
Tipo de máquina A3 Edge
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Contagem de NICs físicas | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|---|
a3-edgegpu-8g |
8 | 640 | 208 | 1.872 | 6.000 | 5 |
|
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações do A3 Edge
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam um tipo de máquina A3 Edge.
- Só é possível usar um tipo de máquina A3 Edge em determinadas regiões e zonas.
- Não é possível usar discos permanentes regionais em uma VM que usa o tipo de máquina A3 Edge.
- O tipo de máquina A3 Edge só está disponível na plataforma de CPU Sapphire Rapids.
- Se a VM usa um tipo de máquina A3 Edge, não é possível mudar o tipo. Se você precisar alterar o tipo de máquina, crie uma nova VM.
- Não é possível mudar o tipo de máquina de uma VM para um tipo de máquina A3 Edge. Se você precisar de uma VM que use um tipo de máquina A3 Edge, crie uma nova VM.
- Os tipos de máquina A3 do Edge não oferecem suporte a locatários individuais.
- Não é possível executar sistemas operacionais Windows em um tipo de máquina A3 Edge.
Tipos de disco compatíveis com a série A3
As VMs A3 Ultra podem usar os seguintes tipos de armazenamento em blocos:
- Hiperdisco equilibrado (
hyperdisk-balanced
): esse é o único tipo de disco com suporte para o disco de inicialização. - Hiperdisco extremo (
hyperdisk-extreme
) - SSD local: adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM* | ||||||
---|---|---|---|---|---|---|
Tipos de máquina |
Todos os discos† | Hiperdisco equilibrado | Capacidade de processamento do hiperdisco | Hyperdisk ML | Hiperdisco extremo | Discos SSD locais anexados |
a3-ultragpu-8g |
128 | 128 | N/A | N/A | 8 | 32 |
*O uso de hiperdiscos é cobrado separadamente do
preço por tipo de máquina. Para saber os preços de disco, consulte
Preços do Hyperdisk.
†Esse limite se aplica ao Hyperdisk, mas não inclui
discos SSD locais.
As VMs A3 Mega podem usar os seguintes tipos de armazenamento em blocos:
- Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hiperdisco equilibrado (
hyperdisk-balanced
) - Hyperdisk ML (
hyperdisk-ml
) - Hiperdisco extremo (
hyperdisk-extreme
) - Capacidade de processamento do hiperdisco (
hyperdisk-throughput
) - SSD local: adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM* | ||||||
---|---|---|---|---|---|---|
Tipos de máquina |
Todos os discos† | Hiperdisco equilibrado | Capacidade de processamento do hiperdisco | Hyperdisk ML | Hiperdisco extremo | Discos SSD locais anexados |
a3-megagpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
*O uso de hiperdiscos e discos permanentes é cobrado separadamente dos preços por tipo de máquina. Para saber os preços de disco, consulte
Preços de disco permanente e hiperdisco.
†Esse limite se aplica ao Persistent Disk e Hyperdisk, mas não inclui
discos SSD locais.
As VMs A3 High podem usar os seguintes tipos de armazenamento em blocos:
- Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hiperdisco equilibrado (
hyperdisk-balanced
): compatível apenas coma3-highgpu-8g
- Hyperdisk ML (
hyperdisk-ml
) - Hiperdisco extremo (
hyperdisk-extreme
) - Capacidade de processamento do hiperdisco (
hyperdisk-throughput
) - SSD local: adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM* | ||||||
---|---|---|---|---|---|---|
Tipos de máquina |
Todos os discos† | Hiperdisco equilibrado | Capacidade de processamento do hiperdisco | Hyperdisk ML | Hiperdisco extremo | Discos SSD locais anexados |
a3-highgpu-1g |
128 | N/A | 64 | 64 | N/A | 2 |
a3-highgpu-2g |
128 | N/A | 64 | 64 | N/A | 4 |
a3-highgpu-4g |
128 | N/A | 64 | 64 | 8 | 8 |
a3-highgpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
*O uso de hiperdiscos e discos permanentes é cobrado separadamente dos preços por tipo de máquina. Para saber os preços de disco, consulte
Preços de disco permanente e hiperdisco.
†Esse limite se aplica ao Persistent Disk e Hyperdisk, mas não inclui
discos SSD locais.
As VMs A3 Edge podem usar os seguintes tipos de armazenamento em blocos:
- Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hiperdisco equilibrado (
hyperdisk-balanced
) - Hyperdisk ML (
hyperdisk-ml
) - Hiperdisco extremo (
hyperdisk-extreme
) - Capacidade de processamento do hiperdisco (
hyperdisk-throughput
) - SSD local: adicionado automaticamente às VMs criadas usando qualquer um dos tipos de máquina A3
Número máximo de discos por VM* | ||||||
---|---|---|---|---|---|---|
Tipos de máquina | Todos os discos† | Hiperdisco equilibrado | Capacidade de processamento do hiperdisco | Hyperdisk ML | Hiperdisco extremo | SSD local anexado |
a3-edgegpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
*O uso de hiperdiscos e discos permanentes é cobrado separadamente dos preços por tipo de máquina. Para saber os preços de disco, consulte
Preços de disco permanente e hiperdisco.
†Esse limite se aplica ao Persistent Disk e Hyperdisk, mas não inclui
discos SSD locais.
Limites de disco e capacidade
Se o tipo de máquina oferecer suporte, é possível usar uma combinação de volumes do Hyperdisk e do Persistent Disk em uma VM, mas as seguintes restrições se aplicam:
- O número combinado de volumes do Hyperdisk e Persistent Disk não pode exceder 128 por VM.
A capacidade total máxima de disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquina com menos de 32 vCPUs:
- 257 TiB para todos os Hyperdisks ou todos os Persistent Disks
- 257 TiB para uma combinação de Hyperdisk e Persistent Disk
Para tipos de máquina com 32 ou mais vCPUs:
- 512 TiB para todos os Hyperdisks
- 512 TiB para uma combinação de hiperdisco e disco permanente
- 257 TiB para todos os Persistent Disks
Para detalhes sobre os limites de capacidade, consulte Limites de capacidade de hiperdisco por VM e Capacidade máxima do Persistent Disk.
A série de máquinas A2
A série de máquinas A2 está disponível nos tipos de máquina A2 Standard e A2 Ultra. Esses tipos de máquina têm de 12 a 96 vCPUs e até 1.360 GB de memória.
A série de máquinas A2 também oferece os seguintes recursos:
GPUs NVIDIA anexadas: cada tipo de máquina A2 tem GPUs NVIDIA A100. Elas estão disponíveis nas opções A100 de 40 GB e A100 de 80 GB.
Escala do NVLink líder do setor que fornece GPU de pico para a largura de banda de GPU NVLink de 600 GBps. Por exemplo, sistemas com 16 GPUs têm uma largura de banda NVLink agregada de até 9,6 TBps. Essas 16 GPUs podem ser usadas como um único acelerador de alto desempenho com espaço de memória unificado para fornecer até 10 petaFLOPS de capacidade de computação e até 20 petaFLOPS de capacidade de computação de inferência que podem ser usados para inteligência artificial, aprendizado profundo e cargas de trabalho de machine learning.
Velocidade de computação de última geração: as GPUs NVIDIA A100 anexadas oferecem melhoria de 10 vezes a velocidade de computação em comparação com as GPUs NVIDIA V100 da geração anterior.
Com a série de máquinas A2, você pode ter até 100 Gbps de largura de banda de rede.
Armazenamento: para discos de trabalho rápidos ou para inserir dados nas GPUs e evitar gargalos de E/S, os tipos de máquina A2 são compatíveis com SSD local da seguinte maneira:
- Para os tipos de máquina A2 padrão, é possível adicionar até 3.000 GiB de SSD local.
- Para os tipos de máquina A2 Ultra, o SSD local é anexado automaticamente quando você cria a VM.
Também é possível anexar até 257 TiB de armazenamento em disco permanente a VMs A2 para aplicativos que exigem esse desempenho de armazenamento maior.
Suporte à política de posicionamento compacto: oferece mais controle sobre o posicionamento físico das suas VMs em data centers. Isso permite menor latência e maior largura de banda para a colocação de VMs em uma única zona de disponibilidade. Para mais informações, consulte Reduzir a latência usando políticas de posicionamento compactas.
Tipos de máquina A2 ultra
Esses tipos de máquina têm um número fixo de GPUs A100 de 80 GB. O SSD local é anexado automaticamente às VMs criadas usando os tipos de ultramáquina A2.
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g |
1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g |
2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g |
4 | 320 | 48 | 680 | 1.500 | 50 |
a2-ultragpu-8g |
8 | 640 | 96 | 1.360 | 3.000 | 100 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações da A2 Ultra
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam tipos de máquina A2 ultra.
- Você só pode usar tipos de máquinas A2 ultra em determinadas regiões e zonas.
- Os tipos de máquina A2 ultra só estão disponíveis na plataforma Cascade Lake.
- Se a VM usa um tipo de máquina ultra A2, não é possível mudar o tipo de máquina. Se você precisar usar outro tipo de máquina ultra A2 ou qualquer outro tipo de máquina, crie uma nova VM.
- Não é possível trocar nenhum tipo de máquina por um tipo de máquina A2 ultra. Se você precisar de uma VM que use uma série de máquinas A2 ultra, crie uma nova VM.
- Não é possível fazer um formato rápido dos SSDs locais anexados em VMs do Windows que usam tipos de máquina A2 ultra. Para formatar esses SSDs locais, é preciso usar
o utilitário diskpart
e especificar
format fs=ntfs label=tmpfs
.
Tipos de máquina A2 padrão
Esses tipos de máquina têm um número fixo de GPUs A100 de 40 GB.
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g |
1 | 40 | 12 | 85 | Sim | 24 |
a2-highgpu-2g |
2 | 80 | 24 | 170 | Sim | 32 |
a2-highgpu-4g |
4 | 160 | 48 | 340 | Sim | 50 |
a2-highgpu-8g |
8 | 320 | 96 | 680 | Sim | 100 |
a2-megagpu-16g |
16 | 640 | 96 | 1.360 | Sim | 100 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações padrão A2
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam tipos de máquina A2 padrão.
- Só é possível usar tipos de máquina padrão A2 em determinadas regiões e zonas.
- Os tipos de máquina A2 padrão só estão disponíveis na plataforma Cascade Lake.
- Se a VM usa um tipo de máquina padrão A2, só é possível trocar esse tipo A2 padrão por outro tipo A2 padrão. Não é possível mudar para outro tipo de máquina. Para mais informações, consulte Modificar VMs otimizadas para aceleradores.
- Você não pode usar o sistema operacional Windows com tipos de máquina A2 <codea2-megagpu-16g< code="" dir="ltr" translate="no">. Ao usar sistemas operacionais Windows, escolha um tipo de máquina diferente do padrão A2.</codea2-megagpu-16g<>
- Não é possível fazer um formato rápido dos SSDs locais anexados em VMs do Windows que usam tipos de máquina padrão A2. Para formatar esses SSDs locais, é preciso usar
o utilitário diskpart
e especificar
format fs=ntfs label=tmpfs
. - Os tipos de máquina A2 padrão não oferecem suporte a locatário único.
Tipos de disco compatíveis com a série A2
VMs A2 podem usar os seguintes tipos de armazenamento em blocos:
- Hyperdisk ML (
hyperdisk-ml
) - Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Disco permanente padrão (
pd-standard
) - SSD local: anexado automaticamente às VMs criadas usando os tipos de ultramáquina A2.
Se o tipo de máquina oferecer suporte, é possível usar uma combinação de volumes do Hyperdisk e do Persistent Disk em uma VM, mas as seguintes restrições se aplicam:
- O número combinado de volumes do Hyperdisk e Persistent Disk não pode exceder 128 por VM.
A capacidade total máxima de disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquina com menos de 32 vCPUs:
- 257 TiB para todos os Hyperdisks ou todos os Persistent Disks
- 257 TiB para uma combinação de Hyperdisk e Persistent Disk
Para tipos de máquina com 32 ou mais vCPUs:
- 512 TiB para todos os Hyperdisks
- 512 TiB para uma combinação de hiperdisco e disco permanente
- 257 TiB para todos os Persistent Disks
Para detalhes sobre os limites de capacidade, consulte Limites de capacidade de hiperdisco por VM e Capacidade máxima do Persistent Disk.
A série de máquinas G2
A série de máquinas G2 está disponível em tipos de máquina padrão e tem de 4 a 96 vCPUs e até 432 GB de memória. Essa série de máquinas é otimizada para inferência e cargas de trabalho gráficas.
A série de máquinas G2 também oferece os seguintes recursos:
GPUs NVIDIA anexadas: cada tipo de máquina G2 tem GPUs NVIDIA L4.
Taxas de inferência aprimoradas: os tipos de máquina G2 oferecem suporte ao tipo de dados FP8 (ponto flutuante de 8 bits), que acelera as taxas de inferência de ML e reduz os requisitos de memória.
Desempenho gráfico de última geração: as GPUs NVIDIA L4 oferecem até três vezes mais performance usando gráficos de terceira geração Núcleos de RT e tecnologia NVIDIA DLSS 3 (amostragem de aprendizado profundo).
Largura de banda de rede de alto desempenho: com a série de máquinas G2, é possível ter até 100 Gbps de largura de banda de rede.
Armazenamento: é possível adicionar até 3.000 GiB de SSD local a VMs da G2. Isso pode ser usado como discos de trabalho rápidos ou para alimentar dados nas GPUs, evitando os gargalos de E/S.
Também é possível anexar volumes de hiperdisco e de disco permanente às VMs G2 para aplicativos que exigem mais armazenamento permanente. A capacidade máxima de armazenamento depende do número de vCPUs que a VM tem. Para mais detalhes, consulte Tipos de disco compatíveis.
Suporte à política de posicionamento compacto: oferece mais controle sobre o posicionamento físico das suas VMs em data centers. Isso permite menor latência e maior largura de banda para a colocação de VMs em uma única zona de disponibilidade. Para mais informações, consulte Reduzir a latência usando políticas de posicionamento compactas.
Tipos de máquina G2
Cada tipo de máquina G2 tem um número fixo de GPUs NVIDIA L4 e vCPUs anexadas. Cada tipo de máquina G2 também tem uma memória padrão e um intervalo de memória personalizado. O intervalo de memória personalizado define a quantidade de memória que pode ser alocada à VM para cada tipo de máquina. É possível especificar a memória personalizada durante a criação da VM.
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB GDDR6) | Contagem de vCPU† | Memória padrão da VM (GB) | Intervalo de memória personalizada da VM (GB) | Suporte máximo para SSD local (GiB) | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 |
1 | 24 | 4 | 16 | 16 a 32 | 375 | 10 |
g2-standard-8 |
1 | 24 | 8 | 32 | 32 a 54 | 375 | 16 |
g2-standard-12 |
1 | 24 | 12 | 48 | 48 a 54 | 375 | 16 |
g2-standard-16 |
1 | 24 | 16 | 64 | 54 a 64 | 375 | 32 |
g2-standard-24 |
2 | 48 | 24 | 96 | 96 a 108 | 750 | 32 |
g2-standard-32 |
1 | 24 | 32 | 128 | 96 a 128 | 375 | 32 |
g2-standard-48 |
4 | 96 | 48 | 192 | 192 a 216 | 1.500 | 50 |
g2-standard-96 |
8 | 192 | 96 | 384 | 384 a 432 | 3.000 | 100 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações da G2
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam tipos de máquina G2.
- Só é possível usar os tipos de máquinas G2 em determinadas regiões e zonas.
- Os tipos de máquina G2 só estão disponíveis na plataforma Cascade Lake.
- Os discos permanentes padrão (
pd-standard
) não são compatíveis com VMs que usam tipos de máquina padrão G2. Para saber quais são os tipos de disco compatíveis, consulte Tipos de disco compatíveis com a G2. - Não é possível criar GPUs de várias instâncias nos tipos de máquina G2.
- Se precisar mudar o tipo de máquina de uma VM G2, consulte Modificar VMs otimizadas para aceleradores.
- Não é possível usar o Deep Learning VM Images como discos de inicialização para suas VMs que usam os tipos de máquina G2.
- O driver padrão atual para o Container-Optimized OS não oferece suporte a GPUs L4 em execução nos tipos de máquina G2. O Container-Optimized OS também é compatível apenas com um conjunto selecionado de drivers.
Se você quiser usar o Container-Optimized OS em tipos de máquina G2, leia as seguintes observações:
- Use uma versão do Container-Optimized OS que seja compatível com a versão mínima recomendada do driver NVIDIA ou
525.60.13
. Para mais informações, consulte as Notas de lançamento do Container-Optimized OS. - Ao instalar o driver,
especifique a versão mais recente disponível que funciona para as GPUs L4.
Por exemplo,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Use uma versão do Container-Optimized OS que seja compatível com a versão mínima recomendada do driver NVIDIA ou
- Use a CLI do Google Cloud ou REST para criar VMs G2 nos seguintes cenários:
- Você quer especificar valores de memória personalizados.
- Você quer personalizar o número de núcleos de CPU visíveis.
Tipos de disco compatíveis com a série G2
As VMs G2 podem usar os seguintes tipos de armazenamento em blocos:
- Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hyperdisk ML (
hyperdisk-ml
) - Capacidade de processamento do hiperdisco (
hyperdisk-throughput
) - SSD local
Se o tipo de máquina oferecer suporte, é possível usar uma combinação de volumes do Hyperdisk e do Persistent Disk em uma VM, mas as seguintes restrições se aplicam:
- O número combinado de volumes do Hyperdisk e Persistent Disk não pode exceder 128 por VM.
A capacidade total máxima de disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquina com menos de 32 vCPUs:
- 257 TiB para todos os Hyperdisks ou todos os Persistent Disks
- 257 TiB para uma combinação de Hyperdisk e Persistent Disk
Para tipos de máquina com 32 ou mais vCPUs:
- 512 TiB para todos os Hyperdisks
- 512 TiB para uma combinação de hiperdisco e disco permanente
- 257 TiB para todos os Persistent Disks
Para detalhes sobre os limites de capacidade, consulte Limites de capacidade de hiperdisco por VM e Capacidade máxima do Persistent Disk.