Nesta página, descrevemos como impulsionar tarefas de aprendizado profundo, como reconhecimento de imagem, processamento de linguagem natural e outras tarefas que exigem computação intensiva usando pools de nós com aceleradores de hardware de unidade de processamento gráfico NVIDIA (GPU) para computação com a instância de contêiner do Cloud Run for Anthos.
Como adicionar um pool de nós com GPUs ao cluster do GKE
Peça para um administrador criar um pool de nós com GPUs:
Como configurar o serviço para consumir GPUs
É possível especificar um limite de recursos no consumo de GPUs de seu serviço usando o Console do Cloud ou a Google Cloud CLI ao implantar um novo serviço, atualizar um que já existe ou implantar uma revisão:
Console
- Acessar o Cloud Run for Anthos
Clique em Criar serviço para exibir o formulário Criar serviço.
Na seção Configurações do serviço:
- Selecione o cluster do GKE com o pool de nós ativado para GPU.
- Especifique o nome que você quer dar ao serviço.
- Clique em Avançar para acessar a próxima seção.
Na seção Configure a primeira revisão do serviço:
- Adicione um URL de imagem de contêiner.
- Clique em Configurações avançadas e, no menu GPU alocada, selecione o número de GPUs que você quer alocar para seu serviço.
Clique em Avançar para acessar a próxima seção.
Na seção Configurar como este serviço é acionado, selecione qual conectividade você quer usar para invocar o serviço.
Clique em Criar para implantar a imagem no Cloud Run for Anthos e aguarde a conclusão da implantação.
Linha de comando
Faça o download da configuração de um serviço existente para um
arquivo YAML com o comando gcloud run services describe
usando a
sinalização --format=export
.
Em seguida, modifique o arquivo YAML e implante
essas alterações com o comando gcloud beta run services replace
.
Modifique apenas os atributos especificados.
Faça o download da configuração do serviço em um arquivo chamado
service.yaml
no espaço de trabalho local:gcloud run services describe SERVICE --format export > service.yaml
Substitua SERVICE pelo nome do serviço do Cloud Run for Anthos.
No seu arquivo local, atualize o atributo
nvidia.com/gpu
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE_NAME spec: template: spec: containers: – image: IMAGE_URL resources: limits: nvidia.com/gpu: "GPU_UNITS"
Substitua GPU_UNITS pelo valor da GPU pretendido nas unidades de GPU do Kubernetes. Por exemplo, especifique
1
para 1 GPU.Implante o arquivo YAML e substitua o serviço pela nova configuração executando o seguinte comando:
gcloud beta run services replace service.yaml
Para mais informações sobre o desempenho e o custo da GPU, consulte GPUs.