Questa pagina è stata tradotta dall'API Cloud Translation.

Panoramica della creazione di un'istanza con GPU collegate

Linux Windows

Questo documento fornisce una panoramica dei passaggi necessari per creare un'istanza Compute Engine con unità di elaborazione grafica (GPU) collegate. Puoi utilizzare le GPU per accelerare carichi di lavoro specifici, come machine learning ed elaborazione di dati.

Puoi anche utilizzare alcuni tipi di macchine GPU su AI Hypercomputer. AI Hypercomputer è un sistema di supercomputing ottimizzato per supportare i workload di intelligenza artificiale (AI) e machine learning (ML). Questa opzione è consigliata per creare un'infrastruttura densamente allocata e ottimizzata per le prestazioni che dispone di integrazioni per Google Kubernetes Engine (GKE) e gli scheduler Slurm.

Per saperne di più sulle GPU su Compute Engine, consulta Informazioni sulle GPU.

Seleziona il modello di GPU

Per un elenco dei modelli di GPU disponibili, consulta Piattaforme GPU. Prendi nota anche del tipo di macchina supportato per il modello di GPU selezionato.

Per ogni modello, potrebbe essere utile esaminare anche quanto segue:

Regioni e zone supportate.
Prezzi delle GPU per conoscere il costo dell'utilizzo di ciascun modello di GPU sulle istanze. Per le istanze che utilizzano macchine ottimizzate per l'acceleratore, consulta anche i prezzi delle istanze VM.

Limitazioni

Oltre alle limitazioni per tutte le istanze con GPU, ogni serie di macchine con GPU collegate presenta le seguenti limitazioni:

Istanze A4X

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A4X.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A4X.
Puoi utilizzare un tipo di macchina A4X solo in alcune regioni e zone.
Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A4X.
Il tipo di macchina A4X è disponibile solo sulla piattaforma NVIDIA Grace.
Attenzione: l'accordo sul livello del servizio (SLA) Compute Engine non si applica alla serie di macchine A4X.
Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A4X. Puoi creare solo nuove istanze A4X. Dopo aver creato un'istanza utilizzando un tipo di macchina A4X, non puoi modificare il tipo di macchina.
Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4X.
Le istanze A4X non supportano:

Istanze A4

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A4.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A4.
Puoi utilizzare un tipo di macchina A4 solo in alcune regioni e zone.
Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A4.
Il tipo di macchina A4 è disponibile solo sulla piattaforma CPU Emerald Rapids.
Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A4. Puoi creare solo nuove istanze A4. Dopo aver creato un'istanza utilizzando un tipo di macchina A4, non puoi modificare il tipo di macchina.
I tipi di macchine A4 non supportano la modalità single-tenancy.
Non puoi eseguire sistemi operativi Windows su un tipo di macchina A4.

Istanze A3 Ultra

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 Ultra.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Ultra.
Puoi utilizzare un tipo di macchina A3 Ultra solo in alcune regioni e zone.
Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina A3 Ultra.
Il tipo di macchina A3 Ultra è disponibile solo sulla piattaforma CPU Emerald Rapids.
Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 Ultra. Puoi creare solo nuove istanze A3-ultra. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 Ultra, non puoi modificare il tipo di macchina.
I tipi di macchine A3 Ultra non supportano la modalità single-tenancy.
Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Ultra.

Istanze A3 Mega

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 Mega.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Mega.
Puoi utilizzare un tipo di macchina A3 Mega solo in alcune regioni e zone.
Non puoi utilizzare i Persistent Disk a livello di regione su un'istanza che utilizza un tipo di macchina A3 Mega.
Il tipo di macchina A3 Mega è disponibile solo sulla piattaforma CPU Sapphire Rapids.
Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 Mega. Puoi creare solo nuove istanze A3-mega. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 Mega, non puoi modificare il tipo di macchina.
I tipi di macchine A3 Mega non supportano la modalità single-tenancy.
Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Mega.

Istanze A3 High

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 High.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 High.
Puoi utilizzare un tipo di macchina A3 High solo in alcune regioni e zone.
Non puoi utilizzare i Persistent Disk a livello di regione su un'istanza che utilizza un tipo di macchina A3 High.
Il tipo di macchina A3 High è disponibile solo sulla piattaforma CPU Sapphire Rapids.
Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 High. Puoi creare solo nuove istanze A3. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 High, non puoi modificare il tipo di macchina.
I tipi di macchine A3 High non supportano la modalità single-tenancy.
Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 High.
Per i tipi di macchine a3-highgpu-1g, a3-highgpu-2g ea3-highgpu-4g, devi creare istanze utilizzando VM spot o VM flessibili. Per istruzioni dettagliate su queste opzioni, consulta quanto segue:
- Per creare VM spot, imposta il modello di provisioning su SPOT quando crei una VM ottimizzata per l'acceleratore.
- Per creare VM con avvio flessibile, puoi utilizzare uno dei seguenti metodi:
  - Crea una VM autonoma e imposta il modello di provisioning su FLEX_START quando crei una VM ottimizzata per l'acceleratore.
  - Crea una richiesta di ridimensionamento in un gruppo di istanze gestite (MIG). Per istruzioni, vedi Crea un MIG con VM GPU.
Puoi utilizzare una Confidential VM con un tipo di macchina a3-highgpu-1g in regioni e zone limitate e si applicano tutte le limitazioni per Confidential VM in esecuzione sul tipo di macchina A3 High.

Istanze A3 Edge

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A3 Edge.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A3 Edge.
Puoi utilizzare un tipo di macchina A3 Edge solo in alcune regioni e zone.
Non puoi utilizzare i Persistent Disk a livello di regione su un'istanza che utilizza un tipo di macchina A3 Edge.
Il tipo di macchina A3 Edge è disponibile solo sulla piattaforma CPU Sapphire Rapids.
Non puoi modificare il tipo di macchina di un'istanza esistente in un tipo di macchina A3 Edge. Puoi creare solo nuove istanze A3-edge. Dopo aver creato un'istanza utilizzando un tipo di macchina A3 Edge, non puoi modificare il tipo di macchina.
I tipi di macchine A3 Edge non supportano la modalità single-tenancy.
Non puoi eseguire sistemi operativi Windows su un tipo di macchina A3 Edge.

Istanze A2 Standard

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A2 Standard.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A2 Standard.
Puoi utilizzare un tipo di macchina A2 Standard solo in alcune regioni e zone.
Il tipo di macchina A2 Standard è disponibile solo sulla piattaforma Cascade Lake.
Se la tua istanza utilizza un tipo di macchina A2 Standard, puoi passare solo da un tipo di macchina A2 Standard a un altro tipo di macchina A2 Standard. Non puoi passare a un altro tipo di macchina. Per ulteriori informazioni, consulta Modifica le istanze ottimizzate per l'acceleratore.
Non puoi utilizzare il sistema operativo Windows con il tipo di macchina a2-megagpu-16g. Quando utilizzi un sistema operativo Windows, scegli un tipo di macchina A2 Standard diverso.
Non puoi formattare rapidamente le unità SSD locali collegate sulle istanze Windows che utilizzano i tipi di macchine A2 Standard. Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità diskpart e specificando format fs=ntfs label=tmpfs.
I tipi di macchine A2 Standard non supportano la modalità single-tenancy.

Istanze A2 Ultra

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina A2 Ultra.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina A2 Ultra.
Puoi utilizzare un tipo di macchina A2 Ultra solo in alcune regioni e zone.
Il tipo di macchina A2 Ultra è disponibile solo sulla piattaforma Cascade Lake.
Se la tua istanza utilizza un tipo di macchina A2 Ultra, non puoi modificarlo. Se devi utilizzare un altro tipo di macchina A2 Ultra o qualsiasi altro tipo di macchina, devi creare una nuova istanza.
Non puoi modificare un altro tipo di macchina in un tipo A2 Ultra. Se hai bisogno di un'istanza che utilizzi un tipo di macchina A2 Ultra, devi crearne una nuova.
Non puoi formattare rapidamente le unità SSD locali collegate sulle istanze Windows che utilizzano i tipi di macchine A2 Ultra. Per formattare questi SSD locali, devi eseguire una formattazione completa utilizzando l'utilità diskpart e specificando format fs=ntfs label=tmpfs.

Istanze G4

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina G4.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina G4.
Puoi utilizzare un tipo di macchina G4 solo in alcune regioni e zone.
Non puoi utilizzare Persistent Disk (a livello di regione o di zona) su un'istanza che utilizza un tipo di macchina G4.
Il tipo di macchina G4 è disponibile solo sulla piattaforma AMD EPYC Turin di quinta generazione.
Non puoi creare istanze Confidential VM che utilizzano un tipo di macchina G4.
Non puoi creare istanze G4 su nodi single-tenant.
Non puoi utilizzare sistemi operativi Windows sulle istanze g4-standard-384.

Istanze G2

Puoi richiedere la capacità solo utilizzando le opzioni di consumo supportate per un tipo di macchina G2.
Non sono previsti sconti per utilizzo sostenuto e per impegno di utilizzo flessibile per le istanze che utilizzano un tipo di macchina G2.
Puoi utilizzare un tipo di macchina G2 solo in alcune regioni e zone.
Il tipo di macchina G2 è disponibile solo sulla piattaforma Cascade Lake.
Il disco permanente standard (pd-standard) non è supportato nelle istanze che utilizzano il tipo di macchina G2. Per i tipi di dischi supportati, consulta Tipi di dischi supportati per G2.
Non puoi creare GPU multi-istanza su un'istanza che utilizza un tipo di macchina G2.
Se devi modificare il tipo di macchina di un'istanza G2, consulta Modifica le istanze ottimizzate per l'acceleratore.
Non puoi utilizzare Deep Learning VM Images come dischi di avvio per le istanze che utilizzano il tipo di macchina G2.
L'attuale driver predefinito per Container-Optimized OS non supporta le GPU L4 in esecuzione su tipi di macchine G2. Inoltre, Container-Optimized OS supporta solo un insieme selezionato di driver. Se vuoi utilizzare Container-Optimized OS sui tipi di macchine G2, consulta le seguenti note:
- Utilizza una versione di Container-Optimized OS che supporti la versione minima consigliata del driver NVIDIA 525.60.13 o successive. Per ulteriori informazioni, consulta le note di rilascio di Container-Optimized OS.
- Quando installi il driver, specifica la versione più recente disponibile adatta alle GPU L4. Ad esempio, sudo cos-extensions install gpu -- -version=525.60.13.
Devi utilizzare Google Cloud CLI o REST per creare istanze G2 per i seguenti scenari:
- Specifica i valori di memoria personalizzati.
- Personalizza il numero di core della CPU visibili.

Istanze N1+GPU

Per saperne di più sulle limitazioni delle istanze N1 con GPU, consulta le funzionalità per la serie di macchine N1 e le GPU per la serie di macchine N1.

Scegli un sistema operativo

Se utilizzi GPU per il machine learning, utilizza uno dei seguenti sistemi operativi:

Immagini ottimizzate per i workload di AI. Puoi utilizzare le immagini Ubuntu e Rocky, disponibili in versioni ottimizzate per l'acceleratore con i driver NVIDIA e il toolkit CUDA preinstallati. Consulta la sezione Immagini sistema operativo nella documentazione di AI Hypercomputer.
Deep Learning VM Image. Ogni VM di deep learning dispone di uno strumento di installazione del driver GPU e include pacchetti come TensorFlow e PyTorch. Puoi anche utilizzare una VM di deep learning per workload GPU generici. Per saperne di più sulle immagini e sui pacchetti disponibili installati su queste immagini, consulta Scegliere un'immagine nella documentazione di Deep Learning VM.

Attenzione: non puoi utilizzare le Deep Learning VM Images sui dischi di avvio per le VM che utilizzano tipi di macchina G2. I tipi di macchina G2 sono serie di macchine ottimizzate per l'acceleratore con GPU NVIDIA L4 collegate.

In alternativa, puoi utilizzare un'immagine pubblica o personalizzata. Per la maggior parte delle immagini pubbliche o immagini personalizzate, devi installare i driver NVIDIA e il toolkit CUDA. Per identificare i driver appropriati per il tuo modello di GPU, consulta la sezione sull'installazione dei driver GPU.

Controlla la quota di GPU

Per proteggere gli utenti e i sistemi Compute Engine, i nuovi progetti hanno una quota di GPU globale che limita il numero totale di GPU che puoi creare in qualsiasi zona supportata. Per esaminare la quota di GPU, consulta Quota di GPU.

Se hai bisogno di una quota di GPU aggiuntiva, richiedi un aumento della quota. Quando richiedi una quota di GPU, devi richiederne una per i tipi di GPU che vuoi creare in ciascuna regione e una globale aggiuntiva per il numero totale di GPU di tutti i tipi in tutte le zone.

Se il tuo progetto ha una cronologia della fatturazione stabilita, riceverà la quota automaticamente dopo l'invio della richiesta.

Istanze GPU e quote di allocazione preemptible

Le istanze che utilizzano il modello di provisioning standard in genere non possono utilizzare le quote di allocazione prerilasciabili. Le quote prerilasciabili sono per carichi di lavoro temporanei e sono generalmente più disponibili. Se il tuo progetto non dispone di una quota prerilasciabile e non l'hai mai richiesta, tutte le istanze del tuo progetto utilizzano le quote di allocazione standard.

Se richiedi una quota di allocazione preemptive, le istanze che utilizzano il modello di provisioning standard devono soddisfare tutti i seguenti criteri per utilizzare la quota di allocazione preemptive:

Le istanze hanno GPU collegate.
Le istanze sono configurate per essere eliminate automaticamente dopo un tempo di esecuzione predefinito tramite il campo maxRunDuration o terminationTime. Per ulteriori informazioni, consulta quanto segue:
- Limita il tempo di esecuzione di un'istanza
- Limita il tempo di esecuzione delle istanze in un MIG
L'istanza non è autorizzata a utilizzare le prenotazioni. Per saperne di più, vedi Previeni il consumo delle prenotazioni da parte delle istanze di computing.

Quando utilizzi l'allocazione prerilasciabile per i carichi di lavoro GPU con limiti di tempo, puoi beneficiare sia del tempo di esecuzione ininterrotto sia dell'elevata ottenibilità della quota di allocazione prerilasciabile. Per ulteriori informazioni, consulta Quote prerilasciabili.

Crea un'istanza con GPU collegate

Per creare un'istanza con GPU collegate, completa i seguenti passaggi:

Crea l'istanza. Il metodo utilizzato per creare un'istanza dipende dal carico di lavoro che vuoi eseguire.

Tipi di macchine GPU
Workload AI e ML	Grafica e visualizzazione	Altri carichi di lavoro GPU
I tipi di macchina della serie A ottimizzati per l'acceleratore sono progettati per carichi di lavoro di computing ad alte prestazioni (HPC), intelligenza artificiale (AI) e machine learning (ML). Per questi tipi di macchine, il modello di GPU viene collegato automaticamente all'istanza.	I tipi di macchina della serie G ottimizzati per l'acceleratore sono progettati per carichi di lavoro come quelli di simulazione NVIDIA Omniverse, applicazioni ad alta intensità grafica, transcodifica video e desktop virtuali. Questi tipi di macchine supportano le workstation virtuali (vWS) NVIDIA RTX. Per questi tipi di macchine, il modello di GPU viene collegato automaticamente all'istanza.	Per i tipi di macchine per uso generico N1, ad eccezione di N1 con core condivisi (`f1-micro` e `g1-small`), puoi collegare un insieme selezionato di modelli di GPU. Alcuni di questi modelli di GPU supportano anche le workstation virtuali (vWS) NVIDIA RTX.
Per i workload AI, ML e HPC, scegli una delle seguenti opzioni: Per creare istanze A4X (GB200), A4 (B200) o A3 Ultra (H200), consulta la Panoramica delle opzioni di deployment nella documentazione di AI Hypercomputer. Per creare istanze A3 High (H100), Mega (H100), Edge (H100) o A2 (A100), consulta Crea un'istanza A3 o A2.	Per creare un'istanza G2 (L4) o G4 (RTX PRO 6000), consulta Crea un'istanza G2 o G4.	Per creare un'istanza N1 con GPU NVIDIA T4, P4, P100 o V100 collegate, consulta Crea un'istanza N1 con GPU collegate.

Tipi di macchine GPU

Workload AI e ML Grafica e visualizzazione Altri carichi di lavoro GPU

I tipi di macchina della serie A ottimizzati per l'acceleratore sono progettati per carichi di lavoro di computing ad alte prestazioni (HPC), intelligenza artificiale (AI) e machine learning (ML).

Per questi tipi di macchine, il modello di GPU viene collegato automaticamente all'istanza.

I tipi di macchina della serie G ottimizzati per l'acceleratore sono progettati per carichi di lavoro come quelli di simulazione NVIDIA Omniverse, applicazioni ad alta intensità grafica, transcodifica video e desktop virtuali. Questi tipi di macchine supportano le workstation virtuali (vWS) NVIDIA RTX.

Per questi tipi di macchine, il modello di GPU viene collegato automaticamente all'istanza.

Per i tipi di macchine per uso generico N1, ad eccezione di N1 con core condivisi (f1-micro e g1-small), puoi collegare un insieme selezionato di modelli di GPU. Alcuni di questi modelli di GPU supportano anche le workstation virtuali (vWS) NVIDIA RTX.

Per i workload AI, ML e HPC, scegli una delle seguenti opzioni:

Per creare istanze A4X (GB200), A4 (B200) o A3 Ultra (H200), consulta la Panoramica delle opzioni di deployment nella documentazione di AI Hypercomputer.
Per creare istanze A3 High (H100), Mega (H100), Edge (H100) o A2 (A100), consulta Crea un'istanza A3 o A2.

Per creare un'istanza G2 (L4) o G4 (RTX PRO 6000), consulta Crea un'istanza G2 o G4.

Per creare un'istanza N1 con GPU NVIDIA T4, P4, P100 o V100 collegate, consulta Crea un'istanza N1 con GPU collegate.

Affinché l'istanza utilizzi la GPU, devi installare il driver della GPU sull'istanza. Se hai attivato una workstation virtuale NVIDIA RTX (precedentemente nota come NVIDIA GRID), installa un driver per la workstation virtuale.

Passaggi successivi

Scopri di più sulle piattaforme GPU.
Scopri di più sulle funzionalità e limitazioni dell'utilizzo delle GPU.

Scopri come visualizzare l'utilizzo effettivo e previsto delle GPU.