Questa pagina fornisce informazioni di base su come le GPU funzionano con Dataflow, comprese informazioni sui prerequisiti e sui tipi di GPU supportati.
L'utilizzo delle GPU nei job Dataflow consente di accelerare alcune attività di elaborazione dati. Le GPU possono eseguire determinati calcoli più velocemente rispetto alle CPU. Questi calcoli sono in genere algebra numerici o lineari, spesso utilizzati nei casi d'uso di elaborazione di immagini e machine learning. L'entità del miglioramento delle prestazioni varia in base al caso d'uso, al tipo di calcolo e alla quantità di dati elaborati.
Prerequisiti per l'utilizzo delle GPU in Dataflow
- Per utilizzare le GPU con il job Dataflow, devi utilizzare Runner v2.
- Dataflow esegue il codice utente nelle VM worker all'interno di un container Docker.
Queste VM worker eseguono il Container-Optimized OS.
Affinché i job Dataflow utilizzino le GPU, devi disporre dei seguenti prerequisiti:
- I driver GPU sono installati su VM worker e accessibili al container Docker. Per maggiori informazioni, consulta Installare i driver GPU.
- Le librerie GPU richieste dalla tua pipeline, ad esempio le librerie NVIDIA CUDA-X o NVIDIA CUDA Toolkit, sono installate nell'immagine container personalizzata. Per maggiori informazioni, consulta Configurare l'immagine container.
- Poiché i container GPU sono in genere di grandi dimensioni, per evitare di esaurire lo spazio su disco, aumenta la dimensione predefinita del disco di avvio a 50 gigabyte o più.
Prezzi
I job che utilizzano GPU sono soggetti agli addebiti specificati nella pagina dei prezzi di Dataflow.
Disponibilità
Con Dataflow sono supportati i seguenti tipi di GPU:
Tipo di GPU | Stringa worker_accelerator |
---|---|
NVIDIA® L4 | nvidia-l4 |
NVIDIA® A100 da 40 GB | nvidia-tesla-a100 |
NVIDIA® A100 da 80 GB | nvidia-a100-80gb |
NVIDIA® Tesla® T4 | nvidia-tesla-t4 |
NVIDIA® Tesla® P4 | nvidia-tesla-p4 |
NVIDIA® Tesla® V100 | nvidia-tesla-v100 |
NVIDIA® Tesla® P100 | nvidia-tesla-p100 |
Per ulteriori informazioni su ciascun tipo di GPU, inclusi i dati sulle prestazioni, consulta Piattaforme GPU di Compute Engine.
Per informazioni sulle regioni e sulle zone disponibili per le GPU, consulta la pagina relativa alla disponibilità delle regioni e delle zone GPU nella documentazione di Compute Engine.
Carichi di lavoro consigliati
La seguente tabella fornisce suggerimenti sul tipo di GPU da utilizzare per i diversi carichi di lavoro. Gli esempi nella tabella sono solo suggerimenti e devi eseguire dei test nel tuo ambiente per determinare il tipo di GPU appropriato per il carico di lavoro.
Per informazioni più dettagliate su dimensioni della memoria GPU, disponibilità delle funzionalità e tipi di carichi di lavoro ideali per i diversi modelli GPU, consulta la tabella di confronto generale nella pagina delle piattaforme GPU.
Carico di lavoro | A100 | L4 | T4 |
---|---|---|---|
Messa a punto del modello | Consigliato | ||
Inferenza del modello grande | Consigliato | Consigliato | |
Inferenza del modello medio | Consigliato | Consigliato | |
Inferenza del modello piccola | Consigliato | Consigliato |
Passaggi successivi
- Consulta un esempio di flusso di lavoro degli sviluppatori per la creazione di pipeline che utilizzano GPU.
- Scopri come eseguire una pipeline Apache Beam su Dataflow con GPU.
- Esamina l'elaborazione delle immagini satellitari di Landsat con GPU.