Informazioni sulle GPU

Puoi collegare GPU (Graphics Processing Unit) all'istanza di una macchina virtuale (VM) per accelerare carichi di lavoro specifici su Compute Engine.

Questo documento descrive le funzionalità e le limitazioni delle GPU in esecuzione su Compute Engine.

GPU e serie di macchine

Le GPU sono supportate per le serie di macchine N1 per uso generico e ottimizzate per l'acceleratore (A3, A2 e G2). Per le VM che utilizzano i tipi di macchine N1, devi collegare la GPU alla VM durante o dopo la creazione della VM. Per le VM che utilizzano tipi di macchine A3, A2 o G2, le GPU vengono collegate automaticamente quando crei la VM. Le GPU non possono essere utilizzate con altre serie di macchine.

Serie di macchine ottimizzate per l'acceleratore

A ogni tipo di macchina ottimizzata per l'acceleratore è collegato un modello specifico di GPU NVIDIA.

  • Per i tipi di macchine ottimizzate per l'acceleratore A3, sono collegate le GPU NVIDIA H100 da 80 GB.
  • Per i tipi di macchine ottimizzate per l'acceleratore A2, sono collegate le GPU NVIDIA A100. Questi sono disponibili nelle opzioni A100 da 40 GB e A100 da 80 GB.
  • Per i tipi di macchine ottimizzate per l'acceleratore G2, sono collegate le GPU NVIDIA L4.

Per saperne di più, consulta Serie di macchine ottimizzate per l'acceleratore.

Serie di macchine per uso generico N1

Per tutti gli altri tipi di GPU, puoi utilizzare la maggior parte dei tipi di macchine N1, ad eccezione di quella con core condiviso N1.

Per questa serie di macchine, puoi utilizzare tipi di macchine predefinite o personalizzate.

GPU su istanze prerilasciabili

Puoi aggiungere GPU alle tue istanze VM prerilasciabile a prezzi spot inferiori per le GPU. Le GPU associate a istanze prerilasciabili funzionano come le normali GPU, ma rimangono attive solo per la durata dell'istanza. Le istanze prerilasciabili con GPU seguono lo stesso processo di prerilascio di tutte le istanze prerilasciabili.

Valuta la possibilità di richiedere una quota Preemptible GPU dedicata da utilizzare per le GPU su istanze prerilasciabili. Per ulteriori informazioni, consulta Quote per le VM prerilasciabile prerilasciabili.

Durante gli eventi di manutenzione, le istanze prerilasciabili con GPU vengono prerilasciate per impostazione predefinita e non possono essere riavviate automaticamente. Se vuoi ricreare le istanze dopo che sono state prerilasciate, utilizza un gruppo di istanze gestite. I gruppi di istanze gestite ricreano le tue istanze se sono disponibili le risorse vCPU, memoria e GPU.

Se vuoi ricevere un avviso prima del prerilascio dell'istanza o se vuoi configurare l'istanza in modo che si riavvii automaticamente dopo un evento di manutenzione, utilizza un'istanza standard con una GPU. Per le istanze standard con GPU, Google fornisce un preavviso di un'ora prima del prerilascio.

Compute Engine non addebita alcun costo per le GPU se le relative istanze vengono prerilasciate nel primo minuto dopo l'avvio dell'esecuzione.

Per la procedura di riavvio automatico di un'istanza standard, consulta Aggiornamento delle opzioni per un'istanza.

Per informazioni su come creare istanze prerilasciabili con GPU collegate, consulta Creare una VM con GPU collegate.

GPU e Confidential VM

Non puoi collegare GPU a istanze Confidential VM. Per ulteriori informazioni su Confidential VM, consulta Concetti di Confidential Computing.

GPU e manutenzione dell'host

Le VM con GPU collegate non possono eseguire la migrazione live e devono arrestarsi per gli eventi di manutenzione dell'host. In genere questi eventi di manutenzione si verificano una volta ogni due settimane. Gli eventi di manutenzione possono verificarsi anche più frequentemente, se necessario. Per informazioni sulla gestione degli eventi di manutenzione, consulta Gestione degli eventi di manutenzione degli host GPU.

GPU e archiviazione a blocchi

Puoi aggiungere SSD locali alle VM con GPU collegate. Per un elenco del supporto degli SSD locali per tipi di GPU e regioni, consulta Disponibilità di SSD locali per regioni e zone GPU.

Prezzi delle GPU

La maggior parte delle VM con una GPU collegata riceve sconti per utilizzo sostenuto simili alle vCPU. Quando selezioni una GPU per una workstation virtuale, una licenza NVIDIA RTX Virtual Workstation viene aggiunta alla VM.

Per i prezzi orari e mensili delle GPU, consulta la pagina dei prezzi delle GPU.

Prenotazione di GPU con sconti per impegno di utilizzo

Per prenotare le risorse GPU in una zona specifica, consulta Prenotazioni delle risorse di zona di Compute Engine.

Per ricevere sconti per impegno di utilizzo per le GPU in una zona specifica, devi acquistare impegni basati sulle risorse per le GPU e collegare anche prenotazioni che specificano GPU corrispondenti ai tuoi impegni. Per maggiori informazioni, consulta Collegare le prenotazioni agli impegni basati sulle risorse.

Limitazioni e limitazioni delle GPU

Per le VM con GPU collegate si applicano le seguenti restrizioni e limitazioni:

  • Se vuoi utilizzare GPU NVIDIA K80 con le tue VM, le VM non possono utilizzare Intel Skylake o le piattaforme CPU successive.

  • Al momento le GPU sono supportate solo con tipi di macchine N1 per uso generico ottimizzate per l'acceleratore (A3, A2 e G2).

  • Per proteggere i sistemi e gli utenti di Compute Engine, i nuovi progetti hanno una quota GPU globale, che limita il numero totale di GPU che puoi creare in qualsiasi zona supportata. Quando richiedi una quota GPU, devi richiedere una quota per i modelli di GPU che vuoi creare in ogni regione, nonché un'ulteriore quota globale per il numero totale di GPU di tutti i tipi in tutte le zone.

  • Le VM con una o più GPU hanno un numero massimo di vCPU per ogni GPU aggiunta all'istanza. Ad esempio, ogni GPU NVIDIA K80 ti consente di avere fino a otto vCPU e fino a 52 GB di memoria nel tipo di macchina dell'istanza. Per visualizzare gli intervalli di vCPU e memoria disponibili per le diverse configurazioni GPU, consulta l'elenco delle GPU.

  • Per funzionare correttamente, le GPU richiedono driver di dispositivo. Le GPU NVIDIA in esecuzione su Compute Engine devono utilizzare una versione minima del driver. Per ulteriori informazioni sulle versioni del driver, consulta Versioni del driver NVIDIA richieste.

  • Le VM con uno specifico modello GPU collegato sono coperte dallo SLA di Compute Engine solo se il modello GPU associato è generalmente disponibile ed è supportato in più di una zona nella stessa regione. Lo SLA di Compute Engine non copre i modelli GPU nelle seguenti zone:

    • NVIDIA H100 da 80 GB:
      • us-east5-a
    • NVIDIA L4:
      • europe-west3-b
      • europe-west6-b
    • NVIDIA A100 da 80 GB:
      • asia-southeast1-c
      • us-east4-c
      • us-east5-b
    • NVIDIA A100 da 40 GB:
      • us-east1-b
      • us-west1-b
      • us-west3-b
      • us-west4-b
    • NVIDIA T4:
      • europe-west3-b
      • southamerica-east1-c
      • us-west3-b
    • NVIDIA V100:
      • asia-east1-c
      • us-east1-c
    • NVIDIA P100:
      • australia-southeast1-c
      • europe-west4-a
    • NVIDIA K80:
      • us-west1-b
  • Compute Engine supporta l'esecuzione di 1 utente simultaneo per GPU.

Che cosa succede dopo?