Halaman ini menjelaskan cara mendorong tugas deep learning seperti gambar pengenalan, natural language processing, serta teknik komputasi lainnya tugas menggunakan kumpulan node dengan Akselerator hardware unit pemrosesan grafis (GPU) NVIDIA untuk komputasi dengan instance container penyaluran Knative Anda.
Menambahkan node pool dengan GPU ke cluster GKE Anda
Minta administrator untuk membuat kumpulan node dengan GPU:
Menyiapkan layanan Anda untuk menggunakan GPU
Anda dapat menentukan batas resource menggunakan GPU untuk layanan Anda dengan menggunakan Konsol Google Cloud atau Google Cloud CLI saat Anda men-deploy layanan, memperbarui layanan yang ada, atau men-deploy revisi:
Konsol
- Buka penayangan Knative
Klik Buat layanan untuk menampilkan formulir Buat layanan.
Di bagian Setelan layanan:
- Memilih cluster GKE dengan node yang mendukung GPU kolam renang.
- Tentukan nama yang ingin Anda berikan ke layanan.
- Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Configure the service's first revision:
- Tambahkan URL image container.
- Klik Advanced settings dan di menu GPU allocated, pilih jumlah GPU yang ingin Anda alokasikan untuk layanan Anda.
Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Konfigurasi cara layanan ini dipicu, memilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.
Klik Create untuk men-deploy image ke inferensi Knative, lalu tunggu hingga deployment selesai.
Command line
Anda dapat mendownload konfigurasi layanan yang ada ke
YAML dengan perintah gcloud run services describe
menggunakan
Tanda --format=export
.
Anda kemudian dapat memodifikasi
file YAML itu dan men-deploy
perubahan tersebut dengan perintah gcloud run services replace
.
Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.
Download konfigurasi layanan Anda menjadi file bernama
service.yaml
pada ruang kerja lokal:gcloud run services describe SERVICE --format export > service.yaml
Ganti SERVICE dengan nama Anda Layanan penyaluran Knative.
Di file lokal Anda, perbarui atribut
nvidia.com/gpu
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE_NAME spec: template: spec: containers: – image: IMAGE_URL resources: limits: nvidia.com/gpu: "GPU_UNITS"
Ganti GPU_UNITS dengan yang diinginkan Nilai GPU dalam unit GPU Kubernetes. Misalnya, tentukan
1
untuk 1 GPU.Deploy file YAML dan ganti layanan Anda dengan konfigurasi baru dengan menjalankan perintah berikut:
gcloud run services replace service.yaml
Untuk mengetahui informasi lebih lanjut tentang performa dan biaya GPU, lihat GPU.