Compatibilidade do Dataflow com GPUs

Nesta página, você verá informações básicas sobre como as GPUs funcionam com o Dataflow, incluindo informações sobre pré-requisitos e tipos de GPU compatíveis.

O uso de GPUs em jobs do Dataflow permite acelerar algumas tarefas de processamento de dados. As GPUs podem executar determinados cálculos mais rapidamente do que as CPUs. Esses cálculos geralmente são álgebra numérica ou linear, geralmente usados em casos de uso de processamento de imagem e machine learning. A extensão da melhoria de desempenho varia de acordo com o caso de uso, o tipo de computação e a quantidade de dados processados.

Pré-requisitos para usar GPUs no Dataflow

Para usar GPUs com o job do Dataflow, use o Runner v2.
O Dataflow executa o código do usuário nas VMs do worker dentro de um contêiner do Docker. Essas VMs de worker executam o Container-Optimized OS. Para que os jobs do Dataflow usem GPUs, você precisa dos seguintes pré-requisitos:
- Os drivers de GPU são instalados em VMs do worker e acessíveis ao contêiner do Docker. Para mais informações, consulte Instalar drivers de GPU.
- As bibliotecas de GPU necessárias para o pipeline, como as bibliotecas do NVIDIA CUDA-X ou o kit de ferramentas do NVIDIA CUDA, são instaladas na imagem de contêiner personalizada. Para mais informações, consulte Configurar a imagem de contêiner.
Como os contêineres de GPU geralmente são grandes, aumente o tamanho padrão do disco de inicialização para 50 gigabytes ou mais para evitar a falta de espaço em disco.

Preços

Jobs que usam GPUs geram cobranças conforme especificado na página de preços do Dataflow.

Disponibilidade

Os seguintes tipos de GPU são compatíveis com o Dataflow:

Tipo de GPU	`worker_accelerator` string
NVIDIA® L4	`nvidia-l4`
NVIDIA® A100 40 GB	`nvidia-tesla-a100`
NVIDIA® A100 80 GB	`nvidia-a100-80gb`
NVIDIA® Tesla® T4	`nvidia-tesla-t4`
NVIDIA® Tesla® P4	`nvidia-tesla-p4`
NVIDIA® Tesla® V100	`nvidia-tesla-v100`
NVIDIA® Tesla® P100	`nvidia-tesla-p100`

Para mais informações sobre cada tipo de GPU, incluindo dados de desempenho, consulte Plataformas de GPU do Compute Engine.

Para informações sobre regiões e zonas disponíveis para GPUs, consulte Disponibilidade de regiões e zonas de GPU na documentação do Compute Engine.

Cargas de trabalho recomendadas

A tabela a seguir fornece recomendações de qual tipo de GPU usar em diferentes cargas de trabalho. Os exemplos na tabela são apenas sugestões. Você precisa testar no seu ambiente para determinar o tipo de GPU apropriado para a carga de trabalho.

Para informações mais detalhadas sobre o tamanho da memória da GPU, a disponibilidade de recursos e os tipos de carga de trabalho ideais para diferentes modelos de GPU, consulte a tabela geral de comparação na página de plataformas de GPU.

Carga de trabalho	A100	L4	T4
Ajuste de modelos	Recomendado
Inferência de modelos grandes	Recomendado	Recomendado
Inferência de modelo médio		Recomendado	Recomendado
Inferência de modelo pequeno		Recomendado	Recomendado

A seguir

Veja um exemplo de fluxo de trabalho do desenvolvedor para a criação de pipelines que usam GPUs.
Saiba como executar um pipeline do Apache Beam no Dataflow com GPUs.
Trabalhe com o processamento de imagens de satélite do Landsat com GPUs.