Meningkatkan kecepatan traffic jaringan untuk node GPU


Halaman ini menunjukkan cara meningkatkan bandwidth jaringan untuk node GPU di cluster Google Kubernetes Engine (GKE) menggunakan NIC Virtual Google (gVNIC).

Di cluster Autopilot, node yang menjalankan GKE versi 1.30.2-gke.1023000 dan yang lebih baru akan menginstal Google Virtual NIC (gVNIC) secara otomatis. Petunjuk di halaman ini hanya berlaku untuk cluster Standard.

Untuk meningkatkan bandwidth pada node CPU, pertimbangkan untuk mengaktifkan bandwidth Tingkat-1.

Sebelum memulai

Sebelum memulai, pastikan Anda telah menjalankan tugas berikut:

  • Aktifkan Google Kubernetes Engine API.
  • Aktifkan Google Kubernetes Engine API
  • Jika ingin menggunakan Google Cloud CLI untuk tugas ini, instal lalu lakukan inisialisasi gcloud CLI. Jika sebelumnya Anda telah menginstal gcloud CLI, dapatkan versi terbaru dengan menjalankan gcloud components update.

Batasan

Persyaratan

  • Node GKE harus menggunakan image node Container-Optimized OS.

Mengaktifkan gVNIC

Anda dapat membuat cluster yang memiliki kumpulan node yang menggunakan gVNIC, membuat kumpulan node dengan gVNIC yang diaktifkan, atau memperbarui kumpulan node untuk menggunakan gVNIC.

Membuat cluster

Buat cluster dengan kumpulan node yang menggunakan gVNIC:

gcloud container clusters create CLUSTER_NAME \
    --accelerator type=GPU_TYPE,count=AMOUNT \
    --machine-type=MACHINE_TYPE \
    --enable-gvnic

Ganti kode berikut:

  • CLUSTER_NAME: nama cluster baru.
  • GPU_TYPE: jenis akselerator GPU yang Anda gunakan. Misalnya, nvidia-tesla-t4.
  • AMOUNT: jumlah GPU yang akan dipasang ke node di node pool.
  • MACHINE_TYPE: jenis mesin yang ingin Anda gunakan. gVNIC tidak didukung pada jenis mesin yang memorinya dioptimalkan.

Membuat node pool

Buat node pool yang menggunakan gVNIC:

gcloud container node-pools create NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Ganti kode berikut:

  • NODEPOOL_NAME: nama node pool baru.
  • CLUSTER_NAME: nama cluster yang ada.

Memperbarui node pool

Update node pool untuk menggunakan gVNIC:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --enable-gvnic

Ganti kode berikut:

  • NODEPOOL_NAME: nama node pool yang ingin Anda perbarui.
  • CLUSTER_NAME: nama cluster yang ada.

Perubahan ini memerlukan pembuatan ulang node, yang dapat menyebabkan gangguan pada workload yang sedang berjalan. Untuk mengetahui detail tentang perubahan spesifik ini, temukan baris yang sesuai dalam tabel perubahan manual yang membuat ulang node menggunakan strategi upgrade node tanpa mematuhi kebijakan pemeliharaan. Untuk mempelajari update node lebih lanjut, lihat Merencanakan gangguan update node.

Menonaktifkan gVNIC

Update kumpulan node menggunakan flag --no-enable-gvnic:

gcloud container node-pools update NODEPOOL_NAME \
    --cluster=CLUSTER_NAME \
    --no-enable-gvnic

Perubahan ini memerlukan pembuatan ulang node, yang dapat menyebabkan gangguan pada workload yang sedang berjalan. Untuk mengetahui detail tentang perubahan spesifik ini, temukan baris yang sesuai dalam tabel perubahan manual yang membuat ulang node menggunakan strategi upgrade node tanpa mematuhi kebijakan pemeliharaan. Untuk mempelajari update node lebih lanjut, lihat Merencanakan gangguan update node.

Pemecahan masalah

Untuk memecahkan masalah gVNIC, lihat Memecahkan Masalah Google Virtual NIC.

Langkah berikutnya