Esta documentação se refere à versão mais recente do Knative serving, que usa frotas e o Anthos Service Mesh. Saiba mais.

A versão anterior (Cloud Run for Anthos) foi arquivada, mas a documentação continua disponível para os usuários atuais.

Versões disponíveis

Mais recente
Arquivar

Esta página foi traduzida pela API Cloud Translation.

Como usar GPUs NVIDIA

Nesta página, descrevemos como realizar tarefas de aprendizado profundo, como processamento de linguagem natural e outros processamentos usando pools de nós com Aceleradores de hardware da unidade de processamento gráfico (GPU) NVIDIA para computação potencial com sua instância de contêiner do Knative serving.

Como adicionar um pool de nós com GPUs ao cluster do GKE

Peça para um administrador criar um pool de nós com GPUs:

Como configurar o serviço para consumir GPUs

É possível especificar um limite de recursos no consumo de GPUs de seu serviço usando o console Google Cloud ou a Google Cloud CLI ao implantar um novo serviço, atualizar um que já existe ou implantar uma revisão:

Console

Acessar o Knative serving
Clique em Criar serviço para exibir o formulário Criar serviço.
Na seção Configurações do serviço:
1. Selecione o cluster do GKE com o pool de nós ativado para GPU.
2. Especifique o nome que você quer dar ao serviço.
3. Clique em Avançar para acessar a próxima seção.
Na seção Configure a primeira revisão do serviço:
1. Adicione um URL de imagem de contêiner.
2. Clique em Configurações avançadas e, no menu GPU alocada, selecione o número de GPUs que você quer alocar para seu serviço.
Clique em Avançar para acessar a próxima seção.
Na seção Configurar como este serviço é acionado, selecione qual conectividade você quer usar para invocar o serviço.
Clique em Criar para implantar a imagem no Knative serving e aguarde até que a implantação seja concluída.

Linha de comando

Faça o download da configuração de um serviço existente para um arquivo YAML com o comando gcloud run services describe usando a sinalização --format=export. Em seguida, modifique o arquivo YAML e implante essas alterações com o comando gcloud run services replace. Modifique apenas os atributos especificados.

Faça o download da configuração do serviço em um arquivo chamado service.yaml no espaço de trabalho local:
```
gcloud run services describe SERVICE --format export > service.yaml
```
Substitua SERVICE pelo nome do seu serviço do Knative serving.

No seu arquivo local, atualize o atributo nvidia.com/gpu:

apiVersion: serving.knative.dev/v1
kind: Service
metadata:
name: SERVICE_NAME
spec:
template:
 spec:
   containers:
   – image: IMAGE_URL
     resources:
       limits:
        nvidia.com/gpu: "GPU_UNITS"

Substitua GPU_UNITS pelo valor da GPU pretendido nas unidades de GPU do Kubernetes. Por exemplo, especifique 1 para 1 GPU.

Implante o arquivo YAML e substitua o serviço pela nova configuração executando o seguinte comando:
```
gcloud run services replace service.yaml
```

Para mais informações sobre o desempenho e o custo da GPU, consulte GPUs.