Famiglia di macchine ottimizzate per l'acceleratore


La famiglia di macchine ottimizzate per l'acceleratore è progettata per Google Cloud offrire le prestazioni e l'efficienza necessarie per i carichi di lavoro accelerati da GPU, come l'intelligenza artificiale (AI), il machine learning (ML) e il computing ad alte prestazioni (HPC).

La famiglia di macchine ottimizzate per l'acceleratore è disponibile nelle seguenti serie di macchine: A4X, A4, A3, A2 e G2. Ogni tipo di macchina all'interno di una serie ha un modello e un numero specifico di GPU NVIDIA collegate. Puoi anche collegare alcuni modelli di GPU ai tipi di macchine N1 per uso generale.

Suggerimento per la serie di macchine in base al tipo di carico di lavoro

La sezione seguente fornisce le serie di macchine consigliate in base ai carichi di lavoro GPU.

Tipo di workload Tipo di macchina consigliato
Modelli di pre-addestramento A4X, A4, A3 Ultra, A3 Mega, A3 High e A2

Per identificare la soluzione più adatta, consulta Consigli per i modelli di preaddestramento nella documentazione di AI Hypercomputer.

Ottimizzazione dei modelli A4X, A4, A3 Ultra, A3 Mega, A3 High e A2

Per identificare la soluzione più adatta, consulta Consigli per la messa a punto dei modelli nella documentazione di AI Hypercomputer.

Inferenza di pubblicazione A4X, A4, A3 Ultra, A3 Mega, A3 High, A3 Edge e A2

Per identificare la soluzione più adatta, consulta Consigli per l'esecuzione dell'inferenza nella documentazione di AI Hypercomputer.

Carichi di lavoro ad alta intensità di grafica G2 e N1+T4
Computing ad alte prestazioni Per i carichi di lavoro di calcolo ad alte prestazioni, qualsiasi serie di macchine ottimizzata per l'acceleratore è adatta. La scelta migliore dipende dalla quantità di calcoli da offloadare sulla GPU.

Per ulteriori informazioni, consulta la sezione Consigli per l'HPC nella documentazione dell'ipercomputer AI.

Opzioni di prezzo e provisioning

I costi dei tipi di macchine ottimizzati per l'acceleratore dipendono da numero di GPU, vCPU predefinita, memoria e SSD locale in bundle (se applicabile). Gli sconti che possono essere applicati alle istanze ottimizzate per l'acceleratore variano in base all'opzione di provisioning utilizzata, come descritto nella tabella seguente. Per ulteriori informazioni sui prezzi delle istanze ottimizzate per l'acceleratore, consulta la sezione Famiglia di tipo di macchina ottimizzate per l'acceleratore nella pagina dei prezzi delle istanze VM.

On demand (impostazione predefinita) VM spot Avvio flessibile (anteprima) Prenotazioni
Serie di macchine ottimizzate per l'acceleratore supportate A3 Mega, A3 High, A3 Edge, A2 e G2 A4, A3, A2 e G2 A4, A3, A2 e G2

Il supporto varia in base al tipo di prenotazione:

Sconti

Puoi ricevere sconti per impegno di utilizzo (CUD) per alcune risorse acquistando impegni basati sulle risorse. Tuttavia, le GPU e i dischi SSD locali che utilizzi con l'opzione di provisioning on demand non sono idonei per gli sconti per impegno di utilizzo. Se vuoi ricevere CUD anche per GPU e dischi SSD locali, ti consigliamo di utilizzare l'opzione di provisioning delle prenotazioni.

Le VM spot ricevono automaticamente sconti tramite prezzi di VM spot.

Le VM di cui è stato eseguito il provisioning utilizzando il modello di provisioning con avvio flessibile beneficiano automaticamente degli sconti tramite i prezzi di Dynamic Workload Scheduler.

Puoi ricevere CUD per le risorse del tipo di macchina ottimizzato per l'acceleratore acquistando impegni basati sulle risorse. Tieni presente che gli impegni per GPU e dischi SSD locali richiedono prenotazioni allegate per queste risorse.

La serie di macchine A4X

La serie di macchine A4X funziona su una piattaforma exascale basata sull'architettura rack-scale NVIDIA GB200 NVL72 e dispone di fino a 140 vCPU e 884 GB di memoria. Questa serie di macchine è ottimizzata per i carichi di lavoro HPC e di addestramento di modelli di ML con vincoli di rete ad alta intensità di calcolo e memoria. La serie di macchine A4X è disponibile in un singolo tipo di macchina.

Le istanze VM create utilizzando il tipo di macchina A4X offrono le seguenti funzionalità:

  • Accelerazione GPU con superchip NVIDIA GB200: alle istanze A4X sono collegati automaticamente superchip NVIDIA GB200. Questi superchip hanno GPU NVIDIA B200 e offrono 180 GB di memoria per GPU. A4X ha due socket con CPU NVIDIA Grace™ con core Arm® Neoverse™ V2. Queste CPU sono collegate a quattro GPU B200 con comunicazione chip-to-chip rapida (NVLink-C2C).

  • Piattaforma CPU NVIDIA Grace: le istanze A4X utilizzano la piattaforma CPU NVIDIA Grace. Per ulteriori dettagli sulla piattaforma, consulta Piattaforme CPU.

  • Scalabilità NVLink leader del settore: NVLink multi-nodo che può essere scalato fino a 72 GPU in un singolo dominio. Le GPU NVIDIA B200 offrono una larghezza di banda NVLink GPU di 1800 GB/s in modo bidirezionale per GPU. Con una topologia NVLink all-to-all tra 4 GPU in un sistema, la larghezza di banda NVLink aggregata può arrivare a 130 TB/s.

  • Networking avanzato con RoCE: per le istanze A4X, RDMA su Converged Ethernet (RoCE) aumenta le prestazioni della rete combinando le schede di interfaccia di rete (NIC) NVIDIA ConnectX-7 (CX-7) con la rete a quattro vie allineata ai binari di Google in tutto il data center. Sfruttando RDMA su Converged Ethernet (RoCE), le istanze A4X raggiungono una velocità in uscita molto più elevata tra le istanze di un cluster rispetto alle istanze A4.

    Le NIC CX-7, isolate fisicamente in una topologia di rete a quattro vie allineata ai binari, consentono alle istanze A4X di eseguire lo scale out in gruppi di 72 GPU fino a migliaia di GPU in un singolo cluster non bloccante.

  • Velocità di rete aumentate: offre velocità di rete fino a 4 volte superiori rispetto alle istanze create utilizzando i tipi di macchine A3.

  • Ottimizzazioni della virtualizzazione per i trasferimenti e il recupero dei dati: la topologia PCIe (Peripheral Component Interconnect Express) delle istanze A4X fornisce informazioni sulla località più precise che i carichi di lavoro possono utilizzare per ottimizzare i trasferimenti di dati.

    Le GPU espongono anche il ripristino a livello di funzione (FLR) per il recupero graduale dagli errori e il supporto delle operazioni atomiche per i miglioramenti della concorrenza in determinati scenari.

  • Supporto di SSD locali e Hyperdisk: 12.000 GiB di SSD locale vengono aggiunti automaticamente alle istanze A4X. L'unità SSD locale può essere utilizzata per dischi di scratch veloci o per inviare dati alle GPU evitando al contempo i colli di bottiglia I/O.

    Per le applicazioni che richiedono prestazioni di archiviazione più elevate, puoi collegare fino a 512 TiB di Hyperdisk alle istanze A4X.

  • Supporto per l'allocazione densa e la pianificazione in base alla topologia: quando esegui il provisioning delle istanze A4X tramite Cluster Director, puoi richiedere blocchi di capacità allocata in modo denso. Le macchine host sono allocate fisicamente vicine tra loro, sottoposte a provisioning come blocchi di risorse e interconnesse con un'infrastruttura di rete ML dinamica per ridurre al minimo i hop di rete e ottimizzare per la latenza più bassa. Inoltre, Cluster Director fornisce informazioni sulla topologia a livello di nodo e cluster che possono essere utilizzate per il posizionamento dei job.

Tipo di macchina A4X

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3e)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Numero di NIC fisiche Larghezza di banda massima della rete (Gbps)
a4x-highgpu-4g 4 720 140 884 12.000 6 2000

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria della VM ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di risorse grafiche.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di A4X

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A4X.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A4X.
  • Puoi utilizzare un tipo di macchina A4X solo in alcune regioni e zone.
  • Non puoi utilizzare Dischi permanenti (regionali o a livello di zona) su una VM che utilizza un tipo di macchina A4X.
  • Il tipo di macchina A4X è disponibile solo sulla piattaforma NVIDIA Grace.
  • Non puoi modificare il tipo di macchina di una VM esistente in un tipo di macchina A4X. Puoi creare solo nuove VM A4X. Dopo aver creato una VM utilizzando un tipo di macchina A4X, non puoi modificare il tipo di macchina.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4X.
  • Le VM A4X non supportano quanto segue:

Tipi di dischi supportati per la serie A4X

Le VM A4X possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Hyperdisk bilanciato (hyperdisk-balanced): è l'unico tipo di disco supportato per il disco di avvio
  • Hyperdisk Extreme (hyperdisk-extreme)
  • SSD locale: viene aggiunta automaticamente alle VM create utilizzando uno dei tipi di macchine A4X
Numero massimo di dischi per VM*
Tipi di macchina Tutti i dischi Hyperdisk bilanciato Throughput Hyperdisk Hyperdisk ML Hyperdisk Extreme SSD locale collegata
a4x-highgpu-4g 128 128 N/D N/D 8 32

*L'utilizzo di Hyperdisk viene addebitato separatamente rispetto ai prezzi dei tipi di macchine. Per i prezzi dei dischi, consulta Prezzi di HyperDisk.
Questo limite si applica a Hyperdisk, ma non include i dischi SSD locali.

Limiti di disco e capacità

Puoi utilizzare una combinazione di diversi tipi di Hyperdisk con una VM, ma la capacità totale massima del disco (in TiB) per tutti i tipi di disco non può superare:

  • Per i tipi di macchine con meno di 32 vCPU: 257 TiB per tutti gli Hyperdisk

  • Per i tipi di macchine con 32 o più vCPU: 512 TiB per tutti gli Hyperdisk

Per informazioni dettagliate sui limiti di capacità, consulta Limiti di dimensioni e allegati di Hyperdisk.

La serie di macchine A4

La serie di macchine A4 offre tipi di macchine con fino a 224 vCPU e 3968 GB di memoria. Le istanze A4 offrono fino a 3 volte le prestazioni dei tipi di istanze GPU precedenti per la maggior parte dei carichi di lavoro accelerati da GPU. A4 è consigliato per i carichi di lavoro di addestramento ML, in particolare su larga scala, ad esempio centinaia o migliaia di GPU. La serie di macchine A4 è disponibile in un unico tipo di macchina.

Le istanze VM create utilizzando il tipo di macchina A4 forniscono le seguenti funzionalità:

  • Accelerazione GPU con GPU NVIDIA B200: le GPU NVIDIA B200 vengono collegate automaticamente alle istanze A4, che offrono 180 GB di memoria GPU per GPU.

  • Processore Intel Xeon scalabile di 5ª generazione (Emerald Rapids): offre fino a 4,0 GHz di frequenza turbo massima in single-core sostenuta. Per ulteriori informazioni su questo processore, consulta Piattaforma CPU.

  • Scalabilità NVLink leader del settore: le GPU NVIDIA B200 forniscono una larghezza di banda NVLink GPU di 1800 GB/s in modo bidirezionale per GPU.

    Con una topologia NVLink all-to-all tra 8 GPU in un sistema, la larghezza di banda NVLink aggregata può arrivare a 14,4 TB/s.

  • Networking migliorato con RoCE: RDMA su Converged Ethernet (RoCE) aumenta le prestazioni della rete combinando le schede di interfaccia di rete (NIC) NVIDIA ConnectX-7 con la rete a quattro vie in linea con i binari di Google in tutto il data center. Sfruttando RDMA su Converged Ethernet (RoCE), le istanze A4 raggiungono un throughput molto più elevato tra le istanze di un cluster rispetto alla maggior parte delle istanze A3, ad eccezione di quelle in esecuzione sul tipo di macchina A3 Ultra.

  • Velocità di rete aumentate: offre velocità di rete fino a quattro volte superiori rispetto alle istanze A2 della generazione precedente.

    Per ulteriori informazioni sul networking, consulta Larghezza di banda di rete e GPU.

  • Ottimizzazioni della virtualizzazione per i trasferimenti e il recupero dei dati: la topologia PCIe (Peripheral Component Interconnect Express) delle istanze A4 fornisce informazioni sulla località più precise che i carichi di lavoro possono utilizzare per ottimizzare i trasferimenti di dati.

    Le GPU espongono anche il ripristino a livello di funzione (FLR) per il recupero graduale da errori e il supporto delle operazioni atomiche per i miglioramenti della concorrenza in determinati scenari.

  • Supporto di SSD locali e Hyperdisk: 12.000 GiB di SSD locale vengono aggiunti automaticamente alle istanze A4. L'SSD locale può essere utilizzata per dischi scratch rapidi o per inviare dati alle GPU evitando al contempo i colli di bottiglia I/O.

    Per le applicazioni che richiedono prestazioni di archiviazione più elevate, puoi anche collegare fino a 512 TiB di Hyperdisk alle istanze A4.

  • Supporto per l'allocazione densa e la pianificazione in base alla topologia: quando esegui il provisioning di istanze A4 che utilizzano le funzionalità e i servizi disponibili in Cluster Director, puoi richiedere blocchi di capacità allocata in modo denso. Le macchine host sono allocate fisicamente una vicino all'altra, vengono provisionate come blocchi di risorse e sono interconnesse con un'infrastruttura di rete ML dinamica per ridurre al minimo gli hop di rete e ottimizzare per la latenza più bassa. Inoltre, puoi ottenere informazioni sulla topologia a livello di nodo e cluster che possono essere utilizzate per il posizionamento dei job.

Tipo di macchina A4

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3e)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Numero di NIC fisiche Larghezza di banda massima della rete (Gbps)
a4-highgpu-8g 8 1440 224 3968 12.000 10 3600

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per lo stoccaggio temporaneo dei dati. È separata dalla memoria della VM ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di risorse grafiche.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni A4

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A4.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A4.
  • Puoi utilizzare un tipo di macchina A4 solo in alcune regioni e zone.
  • Non puoi utilizzare Dischi permanenti (regionali o zonali) su una VM che utilizza un tipo di macchina A4.
  • Il tipo di macchina A4 è disponibile solo sulla piattaforma CPU Emerald Rapids.
  • Non puoi modificare il tipo di macchina di una VM esistente in un tipo di macchina A4. Puoi creare solo nuove VM A4. Dopo aver creato una VM utilizzando un tipo di macchina A4, non puoi modificare il tipo di macchina.
  • I tipi di macchine A4 non supportano la proprietà esclusiva.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4.

Tipi di dischi supportati per la serie A4

Le VM A4 possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Hyperdisk bilanciato (hyperdisk-balanced): è l'unico tipo di disco supportato per il disco di avvio
  • Hyperdisk Extreme (hyperdisk-extreme)
  • SSD locale: viene aggiunta automaticamente alle VM create utilizzando uno qualsiasi dei tipi di macchine A4
Numero massimo di dischi per VM*
Tipi di macchina Tutti i dischi Hyperdisk bilanciato Throughput Hyperdisk Hyperdisk ML Hyperdisk Extreme SSD locale collegata
a4-highgpu-8g 128 128 N/D N/D 8 32

*L'utilizzo di Hyperdisk viene addebitato separatamente rispetto ai prezzi dei tipi di macchine. Per i prezzi dei dischi, consulta Prezzi di HyperDisk.
Questo limite si applica a Hyperdisk, ma non include i dischi SSD locali.

Limiti di disco e capacità

Se supportato dal tipo di macchina, puoi utilizzare una combinazione di volumi Hyperdisk e Persistent Disk su una VM, ma si applicano le seguenti limitazioni:

  • Il numero combinato di volumi Hyperdisk e di Persistent Disk non può superare i 128 per VM.
  • La capacità totale massima del disco (in TiB) per tutti i tipi di disco non può essere superiore a:

    • Per i tipi di macchine con meno di 32 vCPU:

      • 257 TiB per tutti gli Hyperdisk o tutti i Persistent Disk
      • 257 TiB per una combinazione di Hyperdisk e Persistent Disk
    • Per i tipi di macchine con 32 o più vCPU:

      • 512 TiB per tutti gli Hyperdisk
      • 512 TiB per una combinazione di Hyperdisk e Persistent Disk
      • 257 TiB per tutti i Persistent Disk

Per informazioni dettagliate sui limiti di capacità, consulta Dimensioni e limiti di allegati di Hyperdisk e Capacità massima di dischi permanenti.

La serie di macchine A3

La serie di macchine A3 ha fino a 224 vCPU e 2944 GB di memoria. Questa serie di macchine è ottimizzata per l'addestramento ML con vincoli di rete, ad alta intensità di calcolo e memoria, nonché per i carichi di lavoro HPC. La serie di macchine A3 è disponibile nei tipi di macchine A3 Ultra, A3 Mega, A3 High e A3 Edge.

Le istanze VM create utilizzando i tipi di macchine A3 offrono le seguenti funzionalità:

Funzionalità A3 Ultra A3 Mega, High, Edge
Accelerazione GPU

GPU NVIDIA H200 SXM collegate, che offrono 141 GB di memoria GPU per GPU e forniscono memoria più grande e più rapida per supportare modelli linguistici di grandi dimensioni e carichi di lavoro HPC.

GPU NVIDIA H100 SXM collegate, che offrono 80 GB di memoria GPU per GPU e sono ideali per HPC, database e modelli linguistici basati su transformer di grandi dimensioni.

Processori Intel Xeon scalabili

Processore Intel Xeon scalabile di 5a generazione (Emerald Rapids) e offre una frequenza turbo massima singola core supportata fino a 4,0 GHz. Per ulteriori informazioni su questo processore, consulta Piattaforma CPU.

Processore Intel Xeon scalabile di 4a generazione (Sapphire Rapids) e offre una frequenza turbo massima singola core supportata fino a 3,3 GHz. Per ulteriori informazioni su questo processore, consulta Piattaforma CPU.

Scalabilità NVLink leader del settore

Le GPU NVIDIA H200 offrono una larghezza di banda NVLink GPU di picco di 900 GB/s in modo unidirezionale.

Con una topologia NVLink all-to-all tra 8 GPU in un sistema, la larghezza di banda NVLink aggregata può arrivare a 7,2 TB/s.

Le GPU NVIDIA H100 offrono un picco di larghezza di banda NVLink GPU di 450 GB/s in modo unidirezionale.

Con una topologia NVLink all-to-all tra 8 GPU in un sistema, la larghezza di banda NVLink aggregata può arrivare a 7,2 TB/s.

Configurazione di rete avanzata Per questo tipo di macchina, RDMA su Converged Ethernet (RoCE) aumenta le prestazioni della rete combinando le schede di interfaccia di rete (NIC) NVIDIA ConnectX-7 con la nostra rete a quattro vie in linea con i binari a livello di data center. Sfruttando RDMA su Converged Ethernet (RoCE), il tipo di macchina a3-ultragpu-8g raggiunge una velocità effettiva molto più elevata tra le istanze di un cluster rispetto ad altri tipi di macchine A3.
  • Per i tipi di macchine A3 Mega, GPUDirect-TCPXO migliora ulteriormente GPUDirect-TCPX eseguendo il offload del protocollo TCP. Sfruttando GPUDirect-TCPXO, il tipo di macchina a3-megagpu-8g raddoppia la larghezza di banda della rete rispetto ai tipi di macchina A3 High e A3 Edge.
  • Per i tipi di macchine A3 Edge e A3 High, GPUDirect-TCPX aumenta le prestazioni della rete consentendo il trasferimento dei payload dei pacchetti di dati direttamente dalla memoria della GPU all'interfaccia di rete. Sfruttando GPUDirect-TCPX, questi tipo di macchina raggiungono un throughput molto più elevato tra le istanze di un cluster rispetto ai tipi di macchine A2 o G2 ottimizzati per l'acceleratore.
Velocità di rete migliorate

Offre velocità di rete fino a 4 volte superiori rispetto alla serie di macchine A2 di generazione precedente.

Per ulteriori informazioni sul networking, consulta Larghezza di banda di rete e GPU.

Offre velocità di rete fino a 2,5 volte superiori rispetto alla serie di macchine A2 della generazione precedente.

Per ulteriori informazioni sul networking, consulta Larghezza di banda di rete e GPU.

Ottimizzazioni della virtualizzazione

La topologia PCIe (Peripheral Component Interconnect Express) delle istanze A3 fornisce informazioni sulla località più precise che i carichi di lavoro possono utilizzare per ottimizzare i trasferimenti di dati.

Le GPU espongono anche il ripristino a livello di funzione (FLR) per il recupero graduale dagli errori e il supporto delle operazioni atomiche per i miglioramenti della concorrenza in determinati scenari.

Supporto di SSD locali, Persistent Disk e Hyperdisk

L'unità SSD locale può essere utilizzata per dischi di memorizzazione temporanea veloci o per inviare dati alle GPU evitando al contempo i colli di bottiglia I/O. L'unità SSD locale è collegata come segue:

  • 12.000 GiB di SSD locale vengono aggiunti automaticamente alle istanze A3 Ultra.
  • 6000 GiB di SSD locale vengono aggiunti automaticamente alle istanze A3 Mega, High ed Edge.

Puoi anche collegare fino a 512 TiB di Persistent Disk e Hyperdisk ai tipi di macchine di queste serie per le applicazioni che richiedono prestazioni di archiviazione più elevate. Per alcuni tipi di macchine, sono supportati anche fino a 257 TiB di Persistent Disk.

Supporto delle policy di posizionamento compatto

Ti offre un maggiore controllo sul posizionamento fisico delle tue istanze all'interno dei data center.

Ciò consente una latenza inferiore e una larghezza di banda maggiore per le istanze situate all'interno di una singola zona di disponibilità.

Per ulteriori informazioni, consulta Informazioni sui criteri di posizionamento compatto.

Tipo di macchina A3 Ultra

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3e)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Numero di NIC fisiche Larghezza di banda massima della rete (Gbps)
a3-ultragpu-8g 8 1128 224 2952 12.000 10 3600

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria della VM ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di risorse grafiche.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di A3 Ultra

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A3 Ultra.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A3 Ultra.
  • Puoi utilizzare un tipo di macchina A3 Ultra solo in alcune regioni e zone.
  • Non puoi utilizzare Disco permanente (regionale o zonale) su una VM che utilizza un tipo di macchina A3 Ultra.
  • Il tipo di macchina A3 Ultra è disponibile solo sulla piattaforma CPU Emerald Rapids.
  • Non puoi modificare il tipo di macchina di una VM esistente in un tipo di macchina A3 Ultra. Puoi creare solo nuove VM A3-ultra. Dopo aver creato una VM utilizzando un tipo di macchina A3 Ultra, non puoi modificare il tipo di macchina.
  • I tipi di macchine A3 Ultra non supportano la proprietà esclusiva.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Ultra.

Tipo di macchina A3 Mega

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Numero di NIC fisiche Larghezza di banda massima della rete (Gbps)
a3-megagpu-8g 8 640 208 1.872 6000 9 1800

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria della VM ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di risorse grafiche.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di A3 Mega

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A3 Mega.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A3 Mega.
  • Puoi utilizzare un tipo di macchina A3 Mega solo in determinate regioni e zone.
  • Non puoi utilizzare i dischi permanenti regionali su una VM che utilizza un tipo di macchina A3 Mega.
  • Il tipo di macchina A3 Mega è disponibile solo sulla piattaforma CPU Sapphire Rapids.
  • Non puoi modificare il tipo di macchina di una VM esistente in un tipo di macchina A3 Mega. Puoi creare solo nuove VM A3-mega. Dopo aver creato una VM utilizzando un tipo di macchina A3 Mega, non puoi modificare il tipo di macchina.
  • I tipi di macchine A3 Mega non supportano la proprietà esclusiva.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Mega.

Tipo di macchina A3 High

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Numero di NIC fisiche Larghezza di banda massima della rete (Gbps)
a3-highgpu-1g 1 80 26 234 750 1 25
a3-highgpu-2g 2 160 52 468 1500 1 50
a3-highgpu-4g 4 320 104 936 3000 1 100
a3-highgpu-8g 8 640 208 1.872 6000 5 1000

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria della VM ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di risorse grafiche.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di A3 High

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A3 High.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A3 High.
  • Puoi utilizzare un tipo di macchina A3 High solo in determinate regioni e zone.
  • Non puoi utilizzare i dischi permanenti regionali su una VM che utilizza un tipo di macchina A3 High.
  • Il tipo di macchina A3 High è disponibile solo sulla piattaforma CPU Sapphire Rapids.
  • Non puoi modificare il tipo di macchina di una VM esistente in un tipo di macchina A3 High. Puoi creare solo nuove VM A3-high. Dopo aver creato una VM utilizzando un tipo di macchina A3 High, non puoi modificare il tipo di macchina.
  • I tipi di macchine A3 High non supportano single-tenancy.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 High.
  • Per i tipi di macchine a3-highgpu-1g, a3-highgpu-2g ea3-highgpu-4g, si applicano le seguenti limitazioni:
    • Per questi tipi di macchine, devi creare VM utilizzando VM spot o una funzionalità che utilizza la pianificazione dei workload dinamici (DWS), come le richieste di ridimensionamento in un gruppo di istanze gestite. Per istruzioni dettagliate su una di queste opzioni, consulta quanto segue:
    • Non puoi utilizzare Hyperdisk bilanciato con questi tipi di macchine.
    • Non puoi creare prenotazioni.
    Se provi a creare una VM utilizzando il provisioning standard o a creare una prenotazione per questi tipi di macchine, riceverai un messaggio di errore.

Tipo di macchina A3 Edge

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Numero di NIC fisiche Larghezza di banda massima della rete (Gbps)
a3-edgegpu-8g 8 640 208 1.872 6000 5
  • 800: per asia-south1 e northamerica-northeast2
  • 400: per tutte le altre regioni A3 Edge

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria della VM ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di risorse grafiche.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di A3 Edge

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A3 Edge.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A3 Edge.
  • Puoi utilizzare un tipo di macchina A3 Edge solo in alcune regioni e zone.
  • Non puoi utilizzare i dischi permanenti regionali su una VM che utilizza un tipo di macchina A3 Edge.
  • Il tipo di macchina A3 Edge è disponibile solo sulla piattaforma CPU Sapphire Rapids.
  • Non puoi modificare il tipo di macchina di una VM esistente in un tipo di macchina A3 Edge. Puoi creare solo nuove VM A3-edge. Dopo aver creato una VM utilizzando un tipo di macchina A3 Edge, non puoi modificare il tipo di macchina.
  • I tipi di macchine A3 Edge non supportano la proprietà esclusiva.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Edge.

Tipi di dischi supportati per la serie A3

A3 Ultra

Le VM A3 Ultra possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Hyperdisk bilanciato (hyperdisk-balanced): è l'unico tipo di disco supportato per il disco di avvio
  • Hyperdisk bilanciato con disponibilità elevata (hyperdisk-balanced-high-availability)
  • Hyperdisk Extreme (hyperdisk-extreme)
  • SSD locale: viene aggiunto automaticamente alle VM create utilizzando uno qualsiasi dei tipi di macchine A3
Numero massimo di dischi per VM*
Tipi di
macchine
Tutti i dischi Hyperdisk bilanciato Hyperdisk bilanciato con disponibilità elevata Throughput Hyperdisk Hyperdisk ML Hyperdisk Extreme Dischi
SSD locali
collegati
a3-ultragpu-8g 128 128 128 N/D N/D 8 32

*L'utilizzo di Hyperdisk viene addebitato separatamente rispetto ai prezzi dei tipi di macchine. Per i prezzi dei dischi, consulta Prezzi di HyperDisk.
Questo limite si applica a Hyperdisk, ma non include i dischi SSD locali.

A3 Mega

Le VM A3 Mega possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Disco permanente bilanciato (pd-balanced)
  • Persistent Disk SSD (prestazionale) (pd-ssd)
  • Hyperdisk bilanciato (hyperdisk-balanced)
  • Hyperdisk bilanciato con disponibilità elevata (hyperdisk-balanced-high-availability)
  • Hyperdisk ML (hyperdisk-ml)
  • Hyperdisk Extreme (hyperdisk-extreme)
  • Throughput Hyperdisk (hyperdisk-throughput)
  • SSD locale: viene aggiunta automaticamente alle VM create utilizzando uno dei tipi di macchine A3
Numero massimo di dischi per VM*
Tipi di
macchine
Tutti i dischi Hyperdisk bilanciato Hyperdisk bilanciato con disponibilità elevata Throughput Hyperdisk Hyperdisk ML Hyperdisk Extreme Dischi
SSD locali
collegati
a3-megagpu-8g 128 32 32 64 64 8 16

* L'utilizzo di Hyperdisk e Persistent Disk viene addebitato separatamente rispetto ai prezzi dei tipi di macchine. Per i prezzi dei dischi, consulta Prezzi di Persistent Disk e HyperDisk.
Questo limite si applica a Persistent Disk e Hyperdisk, ma non include i dischi SSD locali.

A3 High

Le VM A3 High possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Disco permanente bilanciato (pd-balanced)
  • Persistent Disk SSD (prestazionale) (pd-ssd)
  • Hyperdisk bilanciato (hyperdisk-balanced): supportato solo per a3-highgpu-8g
  • Hyperdisk bilanciato con disponibilità elevata (hyperdisk-balanced-high-availability)
  • Hyperdisk ML (hyperdisk-ml)
  • Hyperdisk Extreme (hyperdisk-extreme)
  • Throughput Hyperdisk (hyperdisk-throughput)
  • SSD locale: viene aggiunta automaticamente alle VM create utilizzando uno dei tipi di macchine A3
Numero massimo di dischi per VM*
Tipi di
macchine
Tutti i dischi Hyperdisk bilanciato Hyperdisk bilanciato con disponibilità elevata Throughput Hyperdisk Hyperdisk ML Hyperdisk Extreme Dischi
SSD locali
collegati
a3-highgpu-1g 128 N/D 32 64 64 N/D 2
a3-highgpu-2g 128 N/D 32 64 64 N/D 4
a3-highgpu-4g 128 N/D 32 64 64 8 8
a3-highgpu-8g 128 32 32 64 64 8 16

* L'utilizzo di Hyperdisk e Persistent Disk viene addebitato separatamente rispetto ai prezzi dei tipi di macchine. Per i prezzi dei dischi, consulta Prezzi di Persistent Disk e HyperDisk.
Questo limite si applica a Persistent Disk e Hyperdisk, ma non include i dischi SSD locali.

A3 Edge

Le VM A3 Edge possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Disco permanente bilanciato (pd-balanced)
  • Persistent Disk SSD (prestazionale) (pd-ssd)
  • Hyperdisk bilanciato (hyperdisk-balanced)
  • Hyperdisk bilanciato con disponibilità elevata (hyperdisk-balanced-high-availability)
  • Hyperdisk ML (hyperdisk-ml)
  • Hyperdisk Extreme (hyperdisk-extreme)
  • Throughput Hyperdisk (hyperdisk-throughput)
  • SSD locale: viene aggiunta automaticamente alle VM create utilizzando uno dei tipi di macchine A3
Numero massimo di dischi per VM*
Tipi di macchina Tutti i dischi Hyperdisk bilanciato Hyperdisk bilanciato con disponibilità elevata Throughput Hyperdisk Hyperdisk ML Hyperdisk Extreme SSD locale collegata
a3-edgegpu-8g 128 32 32 64 64 8 16

* L'utilizzo di Hyperdisk e Persistent Disk viene addebitato separatamente rispetto ai prezzi dei tipi di macchine. Per i prezzi dei dischi, consulta Prezzi di Persistent Disk e HyperDisk.
Questo limite si applica a Persistent Disk e Hyperdisk, ma non include i dischi SSD locali.

Limiti di disco e capacità

Se supportato dal tipo di macchina, puoi utilizzare una combinazione di volumi Hyperdisk e Persistent Disk su una VM, ma si applicano le seguenti limitazioni:

  • Il numero combinato di volumi Hyperdisk e di Persistent Disk non può superare i 128 per VM.
  • La capacità totale massima del disco (in TiB) per tutti i tipi di disco non può essere superiore a:

    • Per i tipi di macchine con meno di 32 vCPU:

      • 257 TiB per tutti gli Hyperdisk o tutti i Persistent Disk
      • 257 TiB per una combinazione di Hyperdisk e Persistent Disk
    • Per i tipi di macchine con 32 o più vCPU:

      • 512 TiB per tutti gli Hyperdisk
      • 512 TiB per una combinazione di Hyperdisk e Persistent Disk
      • 257 TiB per tutti i Persistent Disk

Per informazioni dettagliate sui limiti di capacità, consulta Dimensioni e limiti di allegati di Hyperdisk e Capacità massima di dischi permanenti.

La serie di macchine A2

La serie di macchine A2 è disponibile nei tipi di macchine A2 Standard e A2 Ultra. Questi tipi di macchine hanno da 12 a 96 vCPU e fino a 1360 GB di memoria.

Le istanze VM create utilizzando i tipi di macchine A2 offrono le seguenti funzionalità:

  • Accelerazione GPU: ogni istanza A2 ha GPU NVIDIA A100. Sono disponibili sia nelle opzioni A100 da 40 GB che A100 da 80 GB.

  • Scalabilità NVLink leader del settore che offre una larghezza di banda NVLink GPU-to-GPU di picco di 600 GB/s. Ad esempio, i sistemi con 16 GPU hanno una larghezza di banda NVLink aggregata fino a 9,6 TB/s. Queste 16 GPU possono essere utilizzate come un singolo acceleratore ad alte prestazioni con spazio di memoria unificato per fornire fino a 10 petaFLOPS di potenza di calcolo e fino a 20 petaFLOPS di potenza di calcolo di inferenza che possono essere utilizzati per i carichi di lavoro di intelligenza artificiale, deep learning e machine learning.

  • Velocità di calcolo migliorate: le GPU NVIDIA A100 collegate offrono fino a 10 volte in più in termini di velocità di calcolo rispetto alle GPU NVIDIA V100 di generazione precedente.

    Con la serie di macchine A2, puoi ottenere una larghezza di banda di rete fino a 100 Gbps.

  • Supporto di SSD locale, Persistent Disk e Hyperdisk: per dischi temporanei rapidi o per l'alimentazione di dati alle GPU evitando al contempo i colli di bottiglia I/O, i tipi di macchine A2 supportano l'SSD locale come segue:

    • Per i tipi di macchine A2 standard, puoi aggiungere fino a 3000 GiB di SSD locale quando crei un'istanza.
    • Per i tipi di macchine A2 Ultra, l'SSD locale viene collegata automaticamente quando crei un'istanza.

    Per le applicazioni che richiedono prestazioni di archiviazione più elevate, puoi anche collegare fino a 257 TiB di volumi Persistent Disk e 512 TiB di volumi Hyperdisk alle istanze A2.

  • Supporto dei criteri di posizionamento compatto: offre un maggiore controllo sul posizionamento fisico delle istanze all'interno dei data center. In questo modo, viene ridotta la latenza e aumentata la larghezza di banda per le istanze che si trovano all'interno di una singola zona di disponibilità. Per ulteriori informazioni, consulta Ridurre la latenza utilizzando i criteri di posizionamento compatto.

Per la serie di macchine A2 sono disponibili i seguenti tipi di macchine.

Tipi di macchine A2 Ultra

Questi tipi di macchine hanno un numero fisso di GPU A100 da 80 GB. L'unità SSD locale viene collegata automaticamente alle istanze create utilizzando i tipi di macchina A2 Ultra.

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Larghezza di banda massima della rete (Gbps)
a2-ultragpu-1g 1 80 12 170 375 24
a2-ultragpu-2g 2 160 24 340 750 32
a2-ultragpu-4g 4 320 48 680 1500 50
a2-ultragpu-8g 8 640 96 1360 3000 100

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria dell'istanza ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di grafica.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di A2 Ultra

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A2 Ultra.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A2 Ultra.
  • Puoi utilizzare un tipo di macchina A2 Ultra solo in alcune regioni e zone.
  • Il tipo di macchina A2 Ultra è disponibile solo sulla piattaforma Cascade Lake.
  • Se la VM utilizza un tipo di macchina A2 Ultra, non puoi modificarlo. Se devi utilizzare un altro tipo di macchina A2 Ultra o qualsiasi altro tipo di macchina, devi creare una nuova VM.
  • Non puoi modificare un altro tipo di macchina in un tipo A2 Ultra. Se hai bisogno di una VM che utilizzi un tipo di macchina A2 Ultra, devi creare una nuova VM.
  • Non puoi eseguire un formato rapido delle unità SSD locali collegate sulle VM Windows che utilizzano tipi di macchine A2 Ultra. Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità diskpart e specificando format fs=ntfs label=tmpfs.

Tipi di macchine standard A2

Questi tipi di macchine hanno un numero fisso di GPU A100 da 40 GB.

Tipo di macchina Conteggio GPU Memoria GPU*
(GB HBM3)
Numero di vCPU Memoria VM (GB) SSD locale collegata (GiB) Larghezza di banda massima della rete (Gbps)
a2-highgpu-1g 1 40 12 85 24
a2-highgpu-2g 2 80 24 170 32
a2-highgpu-4g 4 160 48 340 50
a2-highgpu-8g 8 320 96 680 100
a2-megagpu-16g 16 640 96 1360 100

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria dell'istanza ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di grafica.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di A2 Standard

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina A2 standard.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina A2 standard.
  • Puoi utilizzare un tipo di macchina A2 standard solo in alcune regioni e zone.
  • Il tipo di macchina A2 Standard è disponibile solo sulla piattaforma Cascade Lake.
  • Se la tua VM utilizza un tipo di macchina A2 standard, puoi passare solo da un tipo di macchina A2 standard a un altro tipo di macchina A2 standard. Non puoi passare a un altro tipo di macchina. Per saperne di più, consulta Modificare le VM ottimizzate per l'acceleratore.
  • Non puoi utilizzare il sistema operativo Windows con i tipi di macchine A2 standard <codea2-megagpu-16g< code="" dir="ltr" translate="no">. Quando utilizzi sistemi operativi Windows, scegli un tipo di macchina A2 Standard diverso.</codea2-megagpu-16g<>
  • Non puoi eseguire un formato rapido delle SSD locali collegate sulle VM Windows che utilizzano tipi di macchine A2 standard. Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità diskpart e specificando format fs=ntfs label=tmpfs.
  • I tipi di macchine standard A2 non supportano la proprietà esclusiva.

Tipi di dischi supportati per la serie A2

Le istanze A2 possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Hyperdisk ML (hyperdisk-ml)
  • Disco permanente bilanciato (pd-balanced)
  • Persistent Disk SSD (prestazionale) (pd-ssd)
  • Disco rigido permanente standard (pd-standard)
  • SSD locale: viene collegata automaticamente alle istanze create utilizzando i tipi di macchine A2 Ultra.

Se supportato dal tipo di macchina, puoi utilizzare una combinazione di volumi Hyperdisk e Persistent Disk su una VM, ma si applicano le seguenti limitazioni:

  • Il numero combinato di volumi Hyperdisk e di Persistent Disk non può superare i 128 per VM.
  • La capacità totale massima del disco (in TiB) per tutti i tipi di disco non può essere superiore a:

    • Per i tipi di macchine con meno di 32 vCPU:

      • 257 TiB per tutti gli Hyperdisk o tutti i Persistent Disk
      • 257 TiB per una combinazione di Hyperdisk e Persistent Disk
    • Per i tipi di macchine con 32 o più vCPU:

      • 512 TiB per tutti gli Hyperdisk
      • 512 TiB per una combinazione di Hyperdisk e Persistent Disk
      • 257 TiB per tutti i Persistent Disk

Per informazioni dettagliate sui limiti di capacità, consulta Dimensioni e limiti di allegati di Hyperdisk e Capacità massima di dischi permanenti.

La serie di macchine G2

La serie di macchine G2 è disponibile in tipi di macchine standard con da 4 a 96 vCPU e fino a 432 GB di memoria. Questa serie di macchine è ottimizzata per i workload di inferenza e grafica. La serie di macchine G2 è disponibile in un singolo tipo di macchina standard con più configurazioni.

Le istanze VM create utilizzando i tipi di macchine G2 offrono le seguenti funzionalità:

  • Accelerazione GPU: ogni tipo di macchina G2 ha GPU NVIDIA L4.

  • Miglioramento delle velocità di inferenza: il tipo di macchina G2 supporta il tipo di dato FP8 (virgola mobile a 8 bit) che accelera le velocità di inferenza ML e riduce i requisiti di memoria.

  • Prestazioni grafiche di nuova generazione: le GPU NVIDIA L4 offrono un miglioramento fino a 3 volte delle prestazioni grafiche utilizzando core RT di terza generazione e la tecnologia NVIDIA DLSS 3 (Deep Learning Super Sampling).

  • Larghezza di banda di rete ad alte prestazioni: con i tipi di macchine G2, puoi ottenere fino a 100 Gbps di larghezza di banda di rete.

  • Supporto di SSD locale, Persistent Disk e Hyperdisk: puoi aggiungere fino a 3000 GiB di SSD locale alle istanze G2. Questo può essere utilizzato per dischi scratch veloci o per inviare dati alle GPU evitando al contempo i colli di bottiglia I/O.

    Puoi anche collegare volumi Hyperdisk e di Persistent Disk alle istanze G2 per le applicazioni che richiedono più spazio di archiviazione permanente. La capacità di archiviazione massima dipende dal numero di vCPU della VM. Per maggiori dettagli, consulta Tipi di dischi supportati.

  • Supporto dei criteri di posizionamento compatto: offre un maggiore controllo sul posizionamento fisico delle istanze all'interno dei data center. In questo modo, viene ridotta la latenza e aumentata la larghezza di banda per le istanze che si trovano all'interno di una singola zona di disponibilità. Per ulteriori informazioni, consulta Ridurre la latenza utilizzando i criteri di posizionamento compatto.

Tipi di macchine G2

A ogni tipo di macchina G2 è collegato un numero fisso di GPU NVIDIA L4 e vCPU. Ogni tipo di macchina G2 ha anche una memoria predefinita e un'intervallo di memoria personalizzato. L'intervallo di memoria personalizzato definisce la quantità di memoria che puoi allocare alla VM per ogni tipo di macchina. Puoi specificare la memoria personalizzata durante la creazione della VM.

Tipo di macchina Conteggio GPU Memoria GPU* (GB GDDR6) Numero di vCPU Memoria VM predefinita (GB) Intervallo di memoria VM personalizzato (GB) SSD locale massima supportata (GiB) Larghezza di banda massima della rete (Gbps)
g2-standard-4 1 24 4 16 Da 16 a 32 375 10
g2-standard-8 1 24 8 32 32-54 375 16
g2-standard-12 1 24 12 48 48-54 anni 375 16
g2-standard-16 1 24 16 64 Da 54 a 64 375 32
g2-standard-24 2 48 24 96 Da 96 a 108 750 32
g2-standard-32 1 24 32 128 Da 96 a 128 375 32
g2-standard-48 4 96 48 192 Da 192 a 216 1500 50
g2-standard-96 8 192 96 384 Da 384 a 432 3000 100

*La memoria GPU è la memoria di un dispositivo GPU che può essere utilizzata per la memorizzazione temporanea dei dati. È separata dalla memoria della VM ed è progettata specificamente per gestire le richieste di larghezza di banda più elevate dei carichi di lavoro con uso intensivo di risorse grafiche.
Una vCPU viene implementata come un singolo hyperthread hardware su una delle piattaforme CPU disponibili.
La larghezza di banda in uscita massima non può superare il numero specificato. La larghezza di banda in uscita effettiva dipende dall'indirizzo IP di destinazione e da altri fattori. Vedi Larghezza di banda della rete.

Limitazioni di G2

  • Puoi richiedere la capacità solo utilizzando le opzioni di provisioning supportate per un tipo di macchina G2.
  • Non ricevi sconti per utilizzo e sconti per impegno di utilizzo per le VM che utilizzano un tipo di macchina G2.
  • Puoi utilizzare un tipo di macchina G2 solo in determinate regioni e zone.
  • Il tipo di macchina G2 è disponibile solo sulla piattaforma Cascade Lake.
  • Il disco permanente standard (pd-standard) non è supportato nelle VM che utilizzano i tipi di macchine standard G2. Per i tipi di dischi supportati, consulta Tipi di dischi supportati per G2.
  • Non puoi creare GPU con più istanze sui tipi di macchine G2.
  • Se devi modificare il tipo di macchina di una VM G2, consulta Modificare le VM ottimizzate per l'acceleratore.
  • Non puoi utilizzare le immagini VM per il deep learning come dischi di avvio per le tue VM che utilizzano tipi di macchine G2.
  • L'attuale driver predefinito per Container-Optimized OS non supporta le GPU L4 in esecuzione su tipi di macchine G2. Anche Container-Optimized OS supporta solo un insieme selezionato di driver. Se vuoi utilizzare Container-Optimized OS sui tipi di macchine G2, consulta le seguenti note:
    • Utilizza una versione di Container-Optimized OS che supporti la versione minima consigliata del driver NVIDIA 525.60.13 o successive. Per ulteriori informazioni, consulta le note di rilascio di Container-Optimized OS.
    • Quando installi il driver, specifica la versione più recente disponibile che funziona per le GPU L4. Ad esempio, sudo cos-extensions install gpu -- -version=525.60.13.
  • Devi utilizzare Google Cloud CLI o REST per creare VM G2 per i seguenti scenari:
    • Vuoi specificare valori di memoria personalizzati.
    • Vuoi personalizzare il numero di core della CPU visibili.

Tipi di dischi supportati per la serie G2

Le istanze G2 possono utilizzare i seguenti tipi di archiviazione a blocchi:

  • Disco permanente bilanciato (pd-balanced)
  • Persistent Disk SSD (prestazionale) (pd-ssd)
  • Hyperdisk ML (hyperdisk-ml)
  • Throughput Hyperdisk (hyperdisk-throughput)
  • SSD locale

Se supportato dal tipo di macchina, puoi utilizzare una combinazione di volumi Hyperdisk e Persistent Disk su una VM, ma si applicano le seguenti limitazioni:

  • Il numero combinato di volumi Hyperdisk e di Persistent Disk non può superare i 128 per VM.
  • La capacità totale massima del disco (in TiB) per tutti i tipi di disco non può essere superiore a:

    • Per i tipi di macchine con meno di 32 vCPU:

      • 257 TiB per tutti gli Hyperdisk o tutti i Persistent Disk
      • 257 TiB per una combinazione di Hyperdisk e Persistent Disk
    • Per i tipi di macchine con 32 o più vCPU:

      • 512 TiB per tutti gli Hyperdisk
      • 512 TiB per una combinazione di Hyperdisk e Persistent Disk
      • 257 TiB per tutti i Persistent Disk

Per informazioni dettagliate sui limiti di capacità, consulta Dimensioni e limiti di allegati di Hyperdisk e Capacità massima di dischi permanenti.

Passaggi successivi