A família de máquinas com otimização para aceleradores foi projetada pelo Google Cloud para oferecer o desempenho e a eficiência necessários às cargas de trabalho aceleradas por GPU, como inteligência artificial (IA), machine learning (ML) e computação de alto desempenho (HPC).
A família de máquinas com otimização para aceleradores está disponível nas seguintes séries de máquinas: A3, A2 e G2. Cada tipo de máquina em uma série tem um modelo específico e um número de GPUs NVIDIA anexadas. Também é possível anexar alguns modelos de GPU a tipos de máquinas de uso geral N1.
Recomendação de série de máquinas por tipo de carga de trabalho
Na seção a seguir, apresentamos as séries de máquinas recomendadas com base nas cargas de trabalho da GPU.
Grandes modelos de IA
Tipo de carga de trabalho | Tamanho original | Boa alternativa |
---|---|---|
Treinamento de vários servidores (distribuídos) | A3 Mega | A3 Alto, A2 |
Inferência | A3 High, A3 Edge | A2 |
Para provisionar clusters para executar o modelo e o treinamento em grande escala, consulte Executar treinamentos e ajustes de modelos em grande escala.
Modelos convencionais
Tipo de carga de trabalho | Tamanho original | Boa alternativa (na ordem recomendada) |
---|---|---|
Treinamento de vários servidores (distribuídos) | A3 Mega, A3 High |
|
Treinamento de servidor único | A3 High, A3 Edge |
|
Inferência | A3 Edge, G2 |
|
Para provisionar clusters para executar modelos principais, consulte Executar treinamentos e ajustes de modelos principais.
Cargas de trabalho com uso intensivo de gráficos
Tipo de carga de trabalho | Melhor ajuste (na ordem recomendada) |
---|---|
Streaming e transcodificação de vídeo, estações de trabalho de virtuais remotas, gêmeos digitais |
|
Para provisionar VMs para cargas de trabalho com muitos gráficos, consulte estas opções.
Computação de alto desempenho
Para cargas de trabalho de computação de alto desempenho, qualquer série de máquinas otimizada para aceleradores funciona bem. O melhor ajuste depende da quantidade de computação que precisa ser transferida para a GPU.
Preços e desconto
Todos os tipos de máquina com otimização para aceleradores são compatíveis com as seguintes opções de desconto e consumo:
Os tipos de máquina com otimização para aceleradores são faturados por suas GPUs anexadas, vCPU predefinida, memória e SSD local empacotado (se aplicável). Para mais informações sobre preços de VMs otimizadas para aceleradores, consulte a seção Família de tipos de máquinas otimizados para aceleradores na página de preços de instâncias de VM.
A série de máquinas A3
A série de máquinas A3 tem 208 vCPUs e 1.872 GB de memória. Essa série de máquinas é otimizada para uso intenso de computação e memória, treinamento de ML vinculado à rede e cargas de trabalho de HPC.
A série de máquinas A3 também oferece os seguintes recursos:
Hardware de última geração: cada tipo de máquina A3 tem GPUs NVIDIA H100 SXM anexadas, que oferecem 80 GB de memória por GPU e são ideais para grandes modelos de linguagem baseados em transformadores, bancos de dados e HPC.
Essa série de máquinas é criada com o processador escalonável Intel Xeon de 4a geração (Sapphire Rapids) e oferece até 3,3 GHz de frequência turbo máxima sustentada com um núcleo.
Escala NVLink líder do setor: as GPUs NVIDIA H100 fornecem largura de banda de GPU NVLink de pico de 450 GB/s, unidirecionalmente. Com a topologia de NVLink completa entre oito GPUs em um sistema, a largura de banda NVLink agregada é de até 7,2 TB/s. Essas GPUs podem ser usadas como um único acelerador de alto desempenho com espaço de memória unificado para fornecer até 25 petaFLOPS de capacidade de computação de IA/DL/ML e até 50 petaFLOPS de poder de computação de inferência.
Melhoria na velocidade de computação e na rede: a série de máquinas A3 oferece até 2,5 vezes a velocidade de rede em comparação com a geração anterior da série de máquinas A2. Para mais informações sobre redes, consulte Redes e a série de máquinas A3.
Otimizações de virtualização: a topologia Express de interconexão de componentes periféricos (PCIe) das VMs do A3 fornece informações de localidade mais precisas que as cargas de trabalho podem usar para otimizar as transferências de dados.
As GPUs NVIDIA H100 também expõem a redefinição de nível de função (FLR) para recuperação graciosa de falhas e compatibilidade com operações atômicas para melhorias de simultaneidade em determinados cenários.
Armazenamento: 6.000 GiB de SSD local são adicionados automaticamente a VMs criadas usando qualquer um dos tipos de máquina A3. O SSD local pode ser usado como discos de trabalho rápidos ou para alimentar dados nas GPUs, evitando gargalos de E/S.
Você pode anexar até 257 TiB de Persistent Disk a esses tipos de máquina nestas séries para aplicativos que exigem maior desempenho de armazenamento.
Suporte à política de posicionamento compacto: oferece mais controle sobre o posicionamento físico das suas VMs em data centers. Isso permite menor latência e maior largura de banda para a colocação de VMs em uma única zona de disponibilidade. A política de posicionamento compacto é compatível com até 96 VMs em um subconjunto de latência mais baixa da rede, dentro de uma determinada zona. Para mais informações, consulte Reduzir a latência usando políticas de posicionamento compactas.
Os seguintes tipos de máquina estão disponíveis para a série A3.
Tipo de máquina A3 Mega
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Contagem de NICs físicas | Largura de banda máxima da rede (Gbps)‡ | Protocolo de rede |
---|---|---|---|---|---|---|---|---|
a3-megagpu-8g |
8 | 640 | 208 | 1.872 | 6.000 | 9 | 1.800 | GPUDirect-TCPXO |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Tipo de máquina A3 High
Ao provisionar tipos de máquinaa3-highgpu-1g
, a3-highgpu-2g
ou a3-highgpu-4g
, é necessário usar VMs do Spot ou um recurso que use o
Dynamic Workload Scheduler (DWS),
como solicitações de redimensionamento em um MIG. Para instruções detalhadas sobre essas opções, consulte o
seguinte:
- Para criar VMs do Spot, consulte
Criar uma VM otimizada para aceleradores
e defina o modelo de provisionamento como
SPOT
. - Para criar uma solicitação de redimensionamento em um MIG que usa o Dynamic Workload Scheduler, consulte Criar um MIG com VMs de GPU.
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Contagem de NICs físicas | Largura de banda máxima da rede (Gbps)‡ | Protocolo de rede |
---|---|---|---|---|---|---|---|---|
a3-highgpu-1g |
1 | 80 | 26 | 234 | 750 | 1 | 25 | GPUDirect-TCPX |
a3-highgpu-2g |
2 | 160 | 52 | 468 | 1.500 | 1 | 50 | GPUDirect-TCPX |
a3-highgpu-4g |
4 | 320 | 104 | 936 | 3.000 | 1 | 100 | GPUDirect-TCPX |
a3-highgpu-8g |
8 | 640 | 208 | 1.872 | 6.000 | 5 | 1.000 | GPUDirect-TCPX |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Tipo de máquina A3 Edge
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Contagem de NICs físicas | Largura de banda máxima da rede (Gbps)‡ | Protocolo de rede |
---|---|---|---|---|---|---|---|---|
a3-edgegpu-8g |
8 | 640 | 208 | 1.872 | 6.000 | 5 |
|
GPUDirect-TCPX |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Tipos de disco compatíveis com a série A3
VMs A3 podem usar os seguintes tipos de armazenamento em blocos:
- Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hyperdisk Balanced (
hyperdisk-balanced
): o Hyperdisk Balanced tem suporte apenas paraa3-megagpu-8g
,a3-highgpu-8g
ea3-edgegpu-8g
e tipos de máquina. - Hyperdisk ML (
hyperdisk-ml
) - Hiperdisco extremo (
hyperdisk-extreme
) - Capacidade de processamento do hiperdisco (
hyperdisk-throughput
) - SSD local: adicionado automaticamente às VMs criadas usando o tipo de máquina A3
A3 Mega
Número máximo de discos por VM* | ||||||
---|---|---|---|---|---|---|
Tipos de máquina |
Todos os discos† | Hiperdisco equilibrado | Capacidade de processamento do hiperdisco | Hyperdisk ML | Hiperdisco extremo | Discos SSD locais anexados |
a3-megagpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
A3 Alto
Número máximo de discos por VM* | ||||||
---|---|---|---|---|---|---|
Tipos de máquina |
Todos os discos† | Hiperdisco equilibrado | Capacidade de processamento do hiperdisco | Hyperdisk ML | Hiperdisco extremo | Discos SSD locais anexados |
a3-highgpu-1g |
128 | N/A | 64 | 64 | N/A | 2 |
a3-highgpu-2g |
128 | N/A | 64 | 64 | N/A | 4 |
a3-highgpu-4g |
128 | N/A | 64 | 64 | 8 | 8 |
a3-highgpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
A3 Edge
Número máximo de discos por VM* | ||||||
---|---|---|---|---|---|---|
Tipos de máquina | Todos os discos† | Hiperdisco equilibrado | Capacidade de processamento do hiperdisco | Hyperdisk ML | Hiperdisco extremo | SSD local anexado |
a3-edgegpu-8g |
128 | 32 | 64 | 64 | 8 | 16 |
*O uso de hiperdiscos e discos permanentes é cobrado separadamente dos preços por tipo de máquina. Para saber os preços de disco, consulte
Preços de disco permanente e hiperdisco.
†Esse limite se aplica ao Persistent Disk e Hyperdisk, mas não inclui
discos SSD locais.
Limites de disco e capacidade
É possível usar uma combinação de volumes do Persistent Disk e Hyperdisk com uma VM, mas as restrições a seguir se aplicam:
- O número combinado de volumes do Hyperdisk e Persistent Disk não pode exceder 128 por VM.
A capacidade total máxima de disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquina com menos de 32 vCPUs:
- 257 TiB para todos os Hyperdisks ou todos os Persistent Disks
- 257 TiB para uma combinação de Hyperdisk e Persistent Disk
Para tipos de máquina com 32 ou mais vCPUs:
- 512 TiB para todos os Hyperdisks
- 512 TiB para uma combinação de hiperdisco e disco permanente
- 257 TiB para todos os Persistent Disks
Para detalhes sobre os limites de capacidade, consulte Limites de capacidade de hiperdisco por VM e Capacidade máxima do Persistent Disk.
Rede e a série de máquinas A3
A série de máquinas A3 oferece uma melhoria de até 2,5 vezes na velocidade de computação em comparação
com a série de máquinas A2. O tipo de máquina a3-highgpu-8g
oferece 10 vezes mais largura de banda de rede
em comparação com os tipos de máquina A2 da geração anterior.
O tipo de máquina a3-megagpu-8g
oferece o dobro da largura de banda de rede quando
comparado com a3-highgpu-8g
e 20 vezes a largura de banda de rede em comparação com os tipos de máquina A2.
- VMs A3 com uma única NIC: para VMs A3 com 1 a 4 GPUs anexadas, apenas uma placa de interface de rede física (NIC) está disponível.
- VMs A3 multi-NIC: para VMs A3 com 8 GPUs anexadas,
várias NICs físicas estão disponíveis. Para esses tipos de máquina A3, as NICs são organizadas da seguinte maneira em
um barramento Peripheral Component Interconnect Express (PCIe):
- Para o tipo de máquina A3 Mega: um arranjo de NIC de 8+1 está disponível. Com esse arranjo, oito NICs compartilham o mesmo barramento PCIe, e uma NIC reside em um barramento PCIe separado.
- Para o tipo de máquina A3 High: um arranjo de NIC de 4+1 está disponível. Com esse arranjo, quatro NICs compartilham o mesmo barramento PCIe, e uma NIC reside em um barramento PCIe separado.
- Para o tipo de máquina A3 Edge: um arranjo de NIC de 4+1 está disponível. Com esse arranjo, quatro NICs compartilham o mesmo barramento PCIe, e uma NIC reside em um barramento PCIe separado. Essas cinco NICs fornecem uma largura de banda de rede total de 400 Gbps para cada VM.
As NICs que compartilham o mesmo barramento PCIe têm um alinhamento de acesso à memória não uniforme (NUMA) de um NIC por duas GPUs NVIDIA H100 de 80 GB. Essas NICs são ideais para comunicação dedicada de GPU para GPU de alta largura de banda. A NIC física que reside em um barramento PCIe separado é ideal para outras necessidades de rede.
Protocolos de rede
A série de máquinas A3 oferece melhor desempenho do cluster de GPU com GPUDirect-TCPX e GPUDirect-TCPXO.
- Para os tipos de máquina A3 Edge e A3 High, o GPUDirect-TCPX
aumenta a performance da rede, permitindo que os payloads de pacotes de dados
sejam transferidos diretamente da memória da GPU para a interface de rede. Ao usar
o GPUDirect-TCPX, o tipo de máquina
a3-highgpu-8g
alcança uma capacidade de processamento muito maior entre as VMs em um cluster quando comparado aos tipos de máquina otimizados para aceleradores A2 ou G2. - Para os tipos de máquina A3 Mega, o GPUDirect-TCPXO melhora ainda mais o
GPUDirect-TCPX, transferindo o processamento do protocolo TCP para os núcleos
ACC do SmartNIC. Ao usar o GPUDirect-TCPXO, o
tipo de máquina
a3-megagpu-8g
dobra a largura de banda da rede em comparação com o tipo de máquinaa3-highgpu-8g
.
Limitações da série A3
As limitações a seguir se aplicam a VMs que usam os tipos de máquina A3 Edge, A3 High e A3 Mega:
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam tipos de máquina A3.
- Só é possível usar os tipos de máquinas A3 em determinadas regiões e zonas.
- Não é possível usar discos permanentes regionais em VMs que usam tipos de máquina A3.
- A série de máquinas A3 só está disponível na plataforma Sapphire Rapids.
- Se a VM usar um tipo de máquina A3, não será possível alterar o tipo. Se você precisar alterar o tipo de máquina, crie uma nova VM.
- Não é possível alterar o tipo de máquina de uma VM para um tipo de máquina A3. Se você precisar de uma VM que usa um tipo de máquina A3, você precisa criar uma nova VM.
- Os tipos de máquina A3 não dão suporte a locatários individuais.
- Não é possível executar sistemas operacionais Windows em tipos de máquina A3.
- Só é possível reservar tipos de máquina A3 por meio de determinadas reservas.
- Para os tipos de máquina
a3-highgpu-1g
,a3-highgpu-2g
ea3-highgpu-4g
, as seguintes limitações se aplicam:-
Para esses tipos de máquina,
é necessário usar VMs spot ou um recurso que use o
Dynamic Workload Scheduler (DWS),
como solicitações de redimensionamento em um MIG. Para instruções detalhadas sobre essas opções, consulte o
seguinte:
- Para criar VMs do Spot, consulte
Criar uma VM otimizada para aceleradores
e defina o modelo de provisionamento como
SPOT
. - Para criar uma solicitação de redimensionamento em um MIG que usa o Dynamic Workload Scheduler, consulte Criar um MIG com VMs de GPU.
- Para criar VMs do Spot, consulte
Criar uma VM otimizada para aceleradores
e defina o modelo de provisionamento como
- Não é possível usar o Hyperdisk Balanced com estes tipos de máquina.
- Não é possível criar reservas.
-
Para esses tipos de máquina,
é necessário usar VMs spot ou um recurso que use o
Dynamic Workload Scheduler (DWS),
como solicitações de redimensionamento em um MIG. Para instruções detalhadas sobre essas opções, consulte o
seguinte:
A série de máquinas A2
A série de máquinas A2 está disponível nos tipos de máquina A2 Standard e A2 Ultra. Esses tipos de máquina têm de 12 a 96 vCPUs e até 1.360 GB de memória.
A série de máquinas A2 também oferece os seguintes recursos:
GPUs NVIDIA anexadas: cada tipo de máquina A2 tem GPUs NVIDIA A100. Elas estão disponíveis nas opções A100 de 40 GB e A100 de 80 GB.
Escala do NVLink líder do setor que fornece GPU de pico para a largura de banda de GPU NVLink de 600 GBps. Por exemplo, sistemas com 16 GPUs têm uma largura de banda NVLink agregada de até 9,6 TBps. Essas 16 GPUs podem ser usadas como um único acelerador de alto desempenho com espaço de memória unificado para fornecer até 10 petaFLOPS de capacidade de computação e até 20 petaFLOPS de capacidade de computação de inferência que podem ser usados para inteligência artificial, aprendizado profundo e cargas de trabalho de machine learning.
Velocidade de computação de última geração: as GPUs NVIDIA A100 anexadas oferecem melhoria de 10 vezes a velocidade de computação em comparação com as GPUs NVIDIA V100 da geração anterior.
Com a série de máquinas A2, você pode ter até 100 Gbps de largura de banda de rede.
Armazenamento: para discos de trabalho rápidos ou para inserir dados nas GPUs e evitar gargalos de E/S, os tipos de máquina A2 são compatíveis com SSD local da seguinte maneira:
- Para os tipos de máquina A2 padrão, é possível adicionar até 3.000 GiB de SSD local.
- Para os tipos de máquina A2 Ultra, o SSD local é anexado automaticamente quando você cria a VM.
Também é possível anexar até 257 TiB de armazenamento em Persistent Disk a VMs A2 para aplicativos que exigem esse desempenho de armazenamento maior.
Suporte à política de posicionamento compacto: oferece mais controle sobre o posicionamento físico das suas VMs em data centers. Isso permite menor latência e maior largura de banda para a colocação de VMs em uma única zona de disponibilidade. Para mais informações, consulte Reduzir a latência usando políticas de posicionamento compactas.
Tipos de disco compatíveis com A2
VMs A2 podem usar os seguintes tipos de armazenamento em blocos:
- Hyperdisk ML (
hyperdisk-ml
) - Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Disco permanente padrão (
pd-standard
) - SSD local: anexado automaticamente às VMs criadas usando os tipos de ultramáquina A2.
É possível usar uma combinação de volumes do Persistent Disk e Hyperdisk com uma VM, mas as restrições a seguir se aplicam:
- O número combinado de volumes do Hyperdisk e Persistent Disk não pode exceder 128 por VM.
A capacidade total máxima de disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquina com menos de 32 vCPUs:
- 257 TiB para todos os Hyperdisks ou todos os Persistent Disks
- 257 TiB para uma combinação de Hyperdisk e Persistent Disk
Para tipos de máquina com 32 ou mais vCPUs:
- 512 TiB para todos os Hyperdisks
- 512 TiB para uma combinação de hiperdisco e disco permanente
- 257 TiB para todos os Persistent Disks
Para detalhes sobre os limites de capacidade, consulte Limites de capacidade de hiperdisco por VM e Capacidade máxima do Persistent Disk.
Tipos de máquina A2 ultra
Esses tipos de máquina têm um número fixo de GPUs A100 de 80 GB. O SSD local é anexado automaticamente às VMs criadas usando os tipos de máquina A2 Ultra.
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|
a2-ultragpu-1g |
1 | 80 | 12 | 170 | 375 | 24 |
a2-ultragpu-2g |
2 | 160 | 24 | 340 | 750 | 32 |
a2-ultragpu-4g |
4 | 320 | 48 | 680 | 1.500 | 50 |
a2-ultragpu-8g |
8 | 640 | 96 | 1.360 | 3.000 | 100 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações da A2 Ultra
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam tipos de máquina A2 ultra.
- Você só pode usar tipos de máquinas A2 ultra em determinadas regiões e zonas.
- Não é possível usar discos permanentes regionais em VMs que usam tipos de máquina A2 ultra.
- Os tipos de máquina A2 ultra só estão disponíveis na plataforma Cascade Lake.
- Se a VM usa um tipo de máquina ultra A2, não é possível mudar o tipo de máquina. Se você precisar usar outro tipo de máquina ultra A2 ou qualquer outro tipo de máquina, crie uma nova VM.
- Não é possível trocar nenhum tipo de máquina por um tipo de máquina A2 ultra. Se você precisar de uma VM que use uma série de máquinas A2 ultra, crie uma nova VM.
- Não é possível fazer um formato rápido dos SSDs locais anexados em VMs do Windows que usam tipos de máquina A2 ultra. Para formatar esses SSDs locais, é preciso usar
o utilitário diskpart
e especificar
format fs=ntfs label=tmpfs
.
Tipos de máquina A2 padrão
Esses tipos de máquina têm um número fixo de GPUs A100 de 40 GB.
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB HBM3) |
Contagem de vCPU† | Memória da VM (GB) | SSD local anexado (GiB) | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|
a2-highgpu-1g |
1 | 40 | 12 | 85 | Sim | 24 |
a2-highgpu-2g |
2 | 80 | 24 | 170 | Sim | 32 |
a2-highgpu-4g |
4 | 160 | 48 | 340 | Sim | 50 |
a2-highgpu-8g |
8 | 320 | 96 | 680 | Sim | 100 |
a2-megagpu-16g |
16 | 640 | 96 | 1.360 | Sim | 100 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações padrão A2
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam tipos de máquina A2 padrão.
- Só é possível usar tipos de máquina padrão A2 em determinadas regiões e zonas.
- Não é possível usar discos permanentes regionais em VMs que usam tipos de máquina A2 padrão.
- Os tipos de máquina A2 padrão só estão disponíveis na plataforma Cascade Lake.
- Se a VM usa um tipo de máquina padrão A2, só é possível trocar esse tipo A2 padrão por outro tipo A2 padrão. Não é possível mudar para outro tipo de máquina. Para mais informações, consulte Modificar VMs otimizadas para aceleradores.
- Você não pode usar o sistema operacional Windows com tipos de máquina A2 <codea2-megagpu-16g< code="" dir="ltr" translate="no">. Ao usar sistemas operacionais Windows, escolha um tipo de máquina diferente do padrão A2.</codea2-megagpu-16g<>
- Não é possível fazer um formato rápido dos SSDs locais anexados em VMs do Windows que usam tipos de máquina padrão A2. Para formatar esses SSDs locais, é preciso usar
o utilitário diskpart
e especificar
format fs=ntfs label=tmpfs
. - Os tipos de máquina A2 padrão não dão suporte a locatários individuais.
A série de máquinas G2
A série de máquinas G2 está disponível em tipos de máquina padrão e tem de 4 a 96 vCPUs e até 432 GB de memória. Essa série de máquinas é otimizada para inferência e cargas de trabalho gráficas.
A série de máquinas G2 também oferece os seguintes recursos:
GPUs NVIDIA anexadas: cada tipo de máquina G2 tem GPUs NVIDIA L4.
Taxas de inferência aprimoradas: os tipos de máquina G2 oferecem suporte ao tipo de dados FP8 (ponto flutuante de 8 bits), que acelera as taxas de inferência de ML e reduz os requisitos de memória.
Desempenho gráfico de última geração: as GPUs NVIDIA L4 oferecem até três vezes mais performance usando gráficos de terceira geração Núcleos de RT e tecnologia NVIDIA DLSS 3 (amostragem de aprendizado profundo).
Largura de banda de rede de alto desempenho: com a série de máquinas G2, é possível ter até 100 Gbps de largura de banda de rede.
Armazenamento: é possível adicionar até 3.000 GiB de SSD local a VMs da G2. Isso pode ser usado como discos de trabalho rápidos ou para alimentar dados nas GPUs, evitando os gargalos de E/S.
Também é possível anexar volumes de hiperdisco e de disco permanente às VMs G2 para aplicativos que exigem mais armazenamento permanente. A capacidade máxima de armazenamento depende do número de vCPUs que a VM tem. Para mais detalhes, consulte Tipos de disco compatíveis.
Suporte à política de posicionamento compacto: oferece mais controle sobre o posicionamento físico das suas VMs em data centers. Isso permite menor latência e maior largura de banda para a colocação de VMs em uma única zona de disponibilidade. Para mais informações, consulte Reduzir a latência usando políticas de posicionamento compactas.
Tipos de disco compatíveis com a G2
As VMs G2 podem usar os seguintes tipos de armazenamento em blocos:
- Disco permanente equilibrado (
pd-balanced
) - Disco permanente SSD (desempenho) (
pd-ssd
) - Hyperdisk ML (
hyperdisk-ml
) - Capacidade de processamento do hiperdisco (
hyperdisk-throughput
) - SSD local
É possível usar uma combinação de volumes do Persistent Disk e Hyperdisk com uma VM, mas as restrições a seguir se aplicam:
- O número combinado de volumes do Hyperdisk e Persistent Disk não pode exceder 128 por VM.
A capacidade total máxima de disco (em TiB) em todos os tipos de disco não pode exceder:
Para tipos de máquina com menos de 32 vCPUs:
- 257 TiB para todos os Hyperdisks ou todos os Persistent Disks
- 257 TiB para uma combinação de Hyperdisk e Persistent Disk
Para tipos de máquina com 32 ou mais vCPUs:
- 512 TiB para todos os Hyperdisks
- 512 TiB para uma combinação de hiperdisco e disco permanente
- 257 TiB para todos os Persistent Disks
Para detalhes sobre os limites de capacidade, consulte Limites de capacidade de hiperdisco por VM e Capacidade máxima do Persistent Disk.
Tipos de máquina G2
Cada tipo de máquina G2 tem um número fixo de GPUs NVIDIA L4 e vCPUs anexadas. Cada tipo de máquina G2 também tem uma memória padrão e um intervalo de memória personalizado. O intervalo de memória personalizado define a quantidade de memória que pode ser alocada à VM para cada tipo de máquina. É possível especificar a memória personalizada durante a criação da VM.
Tipo de máquina | Contagem de GPUs | Memória da GPU* (GB GDDR6) | Contagem de vCPU† | Memória padrão da VM (GB) | Intervalo de memória personalizada da VM (GB) | Suporte máximo para SSD local (GiB) | Largura de banda máxima da rede (Gbps)‡ |
---|---|---|---|---|---|---|---|
g2-standard-4 |
1 | 24 | 4 | 16 | 16 a 32 | 375 | 10 |
g2-standard-8 |
1 | 24 | 8 | 32 | 32 a 54 | 375 | 16 |
g2-standard-12 |
1 | 24 | 12 | 48 | 48 a 54 | 375 | 16 |
g2-standard-16 |
1 | 24 | 16 | 64 | 54 a 64 | 375 | 32 |
g2-standard-24 |
2 | 48 | 24 | 96 | 96 a 108 | 750 | 32 |
g2-standard-32 |
1 | 24 | 32 | 128 | 96 a 128 | 375 | 32 |
g2-standard-48 |
4 | 96 | 48 | 192 | 192 a 216 | 1.500 | 50 |
g2-standard-96 |
8 | 192 | 96 | 384 | 384 a 432 | 3.000 | 100 |
*A memória da GPU é a memória em um dispositivo GPU que pode ser usada para
armazenamento temporário de dados. Ela é separada da memória da VM e foi
projetada especificamente para lidar com as demandas de largura de banda mais altas das
cargas de trabalho com uso intensivo de gráficos.
†Uma vCPU é implementada como um único hiperthread de hardware em uma das plataformas de CPU.
‡A largura de banda de saída máxima não pode exceder o número informado. A largura
de banda de saída real depende do endereço IP de destino e de outros fatores.
Consulte Largura de banda de rede.
Limitações da G2
- Você não recebe descontos por uso prolongado e descontos por compromisso de uso flexível no caso de VMs que usam tipos de máquina A2.
- Só é possível usar os tipos de máquinas G2 em determinadas regiões e zonas.
- Não é possível usar discos permanentes regionais em VMs que usam tipos de máquina G2.
- Os tipos de máquina G2 só estão disponíveis na plataforma Cascade Lake.
- Os discos permanentes padrão (
pd-standard
) não são compatíveis com VMs que usam tipos de máquina padrão G2. Para saber quais são os tipos de disco compatíveis, consulte Tipos de disco compatíveis com a G2. - Não é possível criar GPUs de várias instâncias nos tipos de máquina G2.
- Se precisar mudar o tipo de máquina de uma VM G2, consulte Modificar VMs otimizadas para aceleradores.
- Não é possível usar o Deep Learning VM Images como discos de inicialização para suas VMs que usam os tipos de máquina G2.
- O driver padrão atual para o Container-Optimized OS não oferece suporte a GPUs L4 em execução nos tipos de máquina G2. O Container-Optimized OS também é compatível apenas com um conjunto selecionado de drivers.
Se você quiser usar o Container-Optimized OS em tipos de máquina G2, leia as seguintes observações:
- Use uma versão do Container-Optimized OS que seja compatível com a versão mínima recomendada do driver NVIDIA ou
525.60.13
. Para mais informações, consulte as Notas de lançamento do Container-Optimized OS. - Ao instalar o driver,
especifique a versão mais recente disponível que funciona para as GPUs L4.
Por exemplo,
sudo cos-extensions install gpu -- -version=525.60.13
.
- Use uma versão do Container-Optimized OS que seja compatível com a versão mínima recomendada do driver NVIDIA ou
- Use a CLI do Google Cloud ou REST para criar VMs G2 nos seguintes cenários:
- Você quer especificar valores de memória personalizados.
- Você quer personalizar o número de núcleos de CPU visíveis.