Panoramica della creazione di un'istanza con GPU collegate

Questo documento fornisce una panoramica dei passaggi necessari per creare un'istanza Compute Engine con unità di elaborazione grafica (GPU) collegate. Puoi utilizzare le GPU per accelerare carichi di lavoro specifici, come machine learning ed elaborazione di dati.

Puoi anche utilizzare alcuni tipi di macchine GPU su AI Hypercomputer. AI Hypercomputer è un sistema di supercomputing ottimizzato per supportare i workload di intelligenza artificiale (AI) e machine learning (ML). Questa opzione è consigliata per creare un'infrastruttura densamente allocata e ottimizzata per le prestazioni che dispone di integrazioni per Google Kubernetes Engine (GKE) e gli scheduler Slurm.

Per saperne di più sulle GPU su Compute Engine, consulta Informazioni sulle GPU.

Seleziona il modello di GPU

Per un elenco dei modelli di GPU disponibili, consulta Piattaforme GPU. Prendi nota anche del tipo di macchina supportato per il modello di GPU selezionato.

Per ogni modello, potrebbe essere utile esaminare anche quanto segue:

Limitazioni

Oltre alle limitazioni per tutte le istanze con GPU, ogni serie di macchine con GPU collegate presenta le seguenti limitazioni:

Istanze A4X

Istanze A4

  • Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A4.
  • Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A4.
  • Puoi utilizzare un tipo di macchina A4 solo in alcune regioni e zone.
  • Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A4.
  • Il tipo di macchina A4 è disponibile solo sulla piattaforma CPU Emerald Rapids.
  • Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A4. Puoi creare solo nuove istanze A4. Dopo aver creato un'istanza utilizzando un tipo di macchina A4, non puoi modificare il tipo di macchina.
  • I tipi di macchine A4 non supportano la modalità single-tenancy.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4.

Istanze A3 Ultra

  • Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 Ultra.
  • Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Ultra.
  • Puoi utilizzare un tipo di macchina A3 Ultra solo in alcune regioni e zone.
  • Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A3 Ultra.
  • Il tipo di macchina A3 Ultra è disponibile solo sulla piattaforma CPU Emerald Rapids.
  • Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 Ultra. Puoi creare solo nuove istanze A3-ultra. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 Ultra, non puoi modificare il tipo di macchina.
  • I tipi di macchine A3 Ultra non supportano la modalità single-tenancy.
  • Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Ultra.

Istanze A3 Mega

Istanze A3 High

Istanze A3 Edge

Istanze A2 Standard

  • Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A2 Standard.
  • Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A2 Standard.
  • Puoi utilizzare un tipo di macchina A2 Standard solo in alcune regioni e zone.
  • Il tipo di macchina A2 Standard è disponibile solo sulla piattaforma Cascade Lake.
  • Se la tua istanza utilizza un tipo di macchina A2 Standard, puoi passare solo da un tipo di macchina A2 Standard a un altro tipo di macchina A2 Standard. Non puoi passare a un altro tipo di macchina. Per ulteriori informazioni, consulta Modifica le istanze ottimizzate per l'acceleratore.
  • Non puoi utilizzare il sistema operativo Windows con i tipi di macchine A2 Standard a2-megagpu-16g. Quando utilizzi sistemi operativi Windows, scegli un tipo di macchina A2 Standard diverso.
  • Non puoi formattare rapidamente le unità SSD locali collegate sulle istanze Windows che utilizzano i tipi di macchine A2 Standard. Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità diskpart e specificando format fs=ntfs label=tmpfs.
  • I tipi di macchine A2 Standard non supportano la modalità single-tenancy.

Istanze A2 Ultra

  • Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A2 Ultra.
  • Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A2 Ultra.
  • Puoi utilizzare un tipo di macchina A2 Ultra solo in alcune regioni e zone.
  • Il tipo di macchina A2 Ultra è disponibile solo sulla piattaforma Cascade Lake.
  • Se la tua istanza utilizza un tipo di macchina A2 Ultra, non puoi modificarlo. Se devi utilizzare un altro tipo di macchina A2 Ultra o qualsiasi altro tipo di macchina, devi creare una nuova istanza.
  • Non puoi modificare un altro tipo di macchina in un tipo A2 Ultra. Se hai bisogno di un'istanza che utilizzi un tipo di macchina A2 Ultra, devi crearne una nuova.
  • Non puoi formattare rapidamente le unità SSD locali collegate sulle istanze Windows che utilizzano i tipi di macchine A2 Ultra. Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità diskpart e specificando format fs=ntfs label=tmpfs.

Istanze G4

  • Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina G4.
  • Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina G4.
  • Puoi utilizzare un tipo di macchina G4 solo in alcune regioni e zone.
  • Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina G4.
  • Il tipo di macchina G4 è disponibile solo sulla piattaforma AMD EPYC Turin di quinta generazione.
  • Puoi creare solo istanze on demand. Le prenotazioni, le VM con avvio flessibile o le VM spot non sono supportate. Per iniziare a utilizzare le istanze G4, contatta il tuo team dell'account Google.
  • Puoi creare istanze G4 solo in us-central1-b.
  • Puoi utilizzare solo i tipi di disco Hyperdisk Balanced e Hyperdisk Extreme su un'istanza che utilizza un tipo di macchina G4.
  • Non puoi applicare sconti per impegno di utilizzo alle istanze che utilizzano un tipo di macchina G4.
  • Non puoi creare istanze Confidential VM che utilizzano un tipo di macchina G4.
  • Non puoi creare istanze G4 su nodi single-tenant.
  • Non puoi creare istanze G4 che utilizzano la workstation virtuale (vWS) NVIDIA RTX.

Istanze G2

  • Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina G2.
  • Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina G2.
  • Puoi utilizzare un tipo di macchina G2 solo in alcune regioni e zone.
  • Il tipo di macchina G2 è disponibile solo sulla piattaforma Cascade Lake.
  • Il disco permanente standard (pd-standard) non è supportato nelle istanze che utilizzano il tipo di macchina G2. Per i tipi di dischi supportati, consulta Tipi di dischi supportati per G2.
  • Non puoi creare GPU multi-istanza su un'istanza che utilizza un tipo di macchina G2.
  • Se devi modificare il tipo di macchina di un'istanza G2, consulta Modifica le istanze ottimizzate per l'acceleratore.
  • Non puoi utilizzare Deep Learning VM Images come dischi di avvio per le istanze che utilizzano il tipo di macchina G2.
  • L'attuale driver predefinito per Container-Optimized OS non supporta le GPU L4 in esecuzione su tipi di macchine G2. Inoltre, Container-Optimized OS supporta solo un insieme selezionato di driver. Se vuoi utilizzare Container-Optimized OS sui tipi di macchine G2, consulta le seguenti note:
    • Utilizza una versione di Container-Optimized OS che supporti la versione minima consigliata del driver NVIDIA 525.60.13 o successive. Per ulteriori informazioni, consulta le note di rilascio di Container-Optimized OS.
    • Quando installi il driver, specifica la versione più recente disponibile adatta alle GPU L4. Ad esempio, sudo cos-extensions install gpu -- -version=525.60.13.
  • Devi utilizzare Google Cloud CLI o REST per creare istanze G2 per i seguenti scenari:
    • Specifica i valori di memoria personalizzati.
    • Personalizza il numero di core della CPU visibili.

Istanze N1+GPU

Per saperne di più sulle limitazioni delle istanze N1 con GPU, consulta le funzionalità per la serie di macchine N1 e le GPU per la serie di macchine N1.

Scegli un sistema operativo

Se utilizzi GPU per il machine learning, utilizza uno dei seguenti sistemi operativi:

  • Immagini ottimizzate per i workload di AI. Puoi utilizzare le immagini Ubuntu e Rocky, disponibili in versioni ottimizzate per l'acceleratore con i driver NVIDIA e il toolkit CUDA preinstallati. Consulta la sezione Immagini sistema operativo nella documentazione di AI Hypercomputer.

  • Deep Learning VM Image. Ogni VM di deep learning dispone di uno strumento di installazione del driver GPU e include pacchetti come TensorFlow e PyTorch. Puoi anche utilizzare una VM di deep learning per workload GPU generici. Per saperne di più sulle immagini e sui pacchetti disponibili installati su queste immagini, consulta Scegliere un'immagine nella documentazione di Deep Learning VM.

In alternativa, puoi utilizzare un'immagine pubblica o personalizzata. Per la maggior parte delle immagini pubbliche o immagini personalizzate, devi installare i driver NVIDIA e il toolkit CUDA. Per identificare i driver appropriati per il tuo modello di GPU, consulta la sezione sull'installazione dei driver GPU.

Controlla la quota di GPU

Per proteggere gli utenti e i sistemi Compute Engine, i nuovi progetti hanno una quota di GPU globale che limita il numero totale di GPU che puoi creare in qualsiasi zona supportata. Per esaminare la quota di GPU, consulta Quota di GPU.

Se hai bisogno di una quota di GPU aggiuntiva, richiedi un aumento della quota. Quando richiedi una quota di GPU, devi richiederne una per i tipi di GPU che vuoi creare in ciascuna regione e una globale aggiuntiva per il numero totale di GPU di tutti i tipi in tutte le zone.

Se il tuo progetto ha una cronologia della fatturazione stabilita, riceverà la quota automaticamente dopo l'invio della richiesta.

Istanze GPU e quote di allocazione preemptible

Le istanze che utilizzano il modello di provisioning standard in genere non possono utilizzare le quote di allocazione prerilasciabili. Le quote prerilasciabili sono per carichi di lavoro temporanei e sono generalmente più disponibili. Se il tuo progetto non dispone di una quota prerilasciabile e non l'hai mai richiesta, tutte le istanze del tuo progetto utilizzano le quote di allocazione standard.

Se richiedi una quota di allocazione preemptive, le istanze che utilizzano il modello di provisioning standard devono soddisfare tutti i seguenti criteri per utilizzare la quota di allocazione preemptive:

Quando utilizzi l'allocazione prerilasciabile per i carichi di lavoro GPU con limiti di tempo, puoi beneficiare sia del tempo di esecuzione ininterrotto sia dell'elevata ottenibilità della quota di allocazione prerilasciabile. Per ulteriori informazioni, consulta Quote prerilasciabili.

Crea un'istanza con GPU collegate

Per creare un'istanza con GPU collegate, completa i seguenti passaggi:

  1. Crea l'istanza. Il metodo utilizzato per creare un'istanza dipende dal modello di GPU selezionato.

  2. Affinché l'istanza utilizzi la GPU, devi installare il driver della GPU sull'istanza. Se hai attivato una workstation virtuale NVIDIA RTX (precedentemente nota come NVIDIA GRID), installa un driver per la workstation virtuale.

Passaggi successivi