Questa pagina descrive come promuovere attività di deep learning come le immagini l'elaborazione del linguaggio naturale e altre applicazioni ad alta intensità utilizzando i pool di nodi con Acceleratori hardware NVIDIA (Graphics Processing Unit) (GPU) per il calcolo con la tua istanza di container Knative serving.
Aggiunta di un pool di nodi con GPU al cluster GKE
Chiedi a un amministratore di creare un pool di nodi con GPU:
Configurare il servizio in modo che utilizzi le GPU
Puoi specificare un limite delle risorse per utilizzare le GPU per il servizio mediante la console Google Cloud a Google Cloud CLI quando esegui il deployment service, aggiornare un servizio esistente o esegui il deployment di una revisione:
Console
- Vai a Knative serving
Fai clic su Crea servizio per visualizzare il modulo Crea servizio.
Nella sezione Impostazioni servizio:
- Seleziona il cluster GKE con il pool di nodi abilitato per GPU.
- Specifica il nome che vuoi assegnare al servizio.
- Fai clic su Avanti per passare alla sezione successiva.
Nella sezione Configura la prima revisione del servizio:
- Aggiungi un URL immagine del container.
- Fai clic su Impostazioni avanzate e nel menu GPU allocata seleziona il numero di GPU da allocare al servizio.
Fai clic su Avanti per passare alla sezione successiva.
Nella sezione Configura il modo in cui viene attivato questo servizio, seleziona la connettività da utilizzare per richiamare il servizio.
Fai clic su Crea per eseguire il deployment dell'immagine in Knative serving e attendi. per completare il deployment.
Riga di comando
Puoi scaricare la configurazione di un servizio esistente in un
file YAML con il comando gcloud run services describe
utilizzando il
--format=export
flag.
Puoi quindi modificare il file YAML e implementare queste modifiche con il comando gcloud run services replace
.
Assicurarsi di modificare solo gli attributi specificati.
Scarica la configurazione del servizio in un file denominato
service.yaml
nello spazio di lavoro locale:gcloud run services describe SERVICE --format export > service.yaml
Sostituisci SERVICE con il nome del tuo servizio Knative serving.
Nel file locale, aggiorna l'attributo
nvidia.com/gpu
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE_NAME spec: template: spec: containers: – image: IMAGE_URL resources: limits: nvidia.com/gpu: "GPU_UNITS"
Sostituisci GPU_UNITS con il valore GPU desiderato nelle unità GPU di Kubernetes. Ad esempio, specifica
1
per 1 GPU.Esegui il deployment del file YAML e sostituisci il servizio con la nuova configurazione eseguendo il seguente comando:
gcloud run services replace service.yaml
Per ulteriori informazioni sulle prestazioni e sui costi delle GPU, consulta GPU.