Halaman ini menunjukkan cara meningkatkan bandwidth jaringan untuk node GPU di cluster Google Kubernetes Engine (GKE) menggunakan NIC Virtual Google (gVNIC).
Di cluster Autopilot, node yang menjalankan GKE versi 1.30.2-gke.1023000 dan yang lebih baru akan menginstal Google Virtual NIC (gVNIC) secara otomatis. Petunjuk di halaman ini hanya berlaku untuk cluster Standard.
Untuk meningkatkan bandwidth pada node CPU, pertimbangkan untuk mengaktifkan bandwidth Tingkat-1.
Sebelum memulai
Sebelum memulai, pastikan Anda telah menjalankan tugas berikut:
- Aktifkan Google Kubernetes Engine API. Aktifkan Google Kubernetes Engine API
- Jika ingin menggunakan Google Cloud CLI untuk tugas ini,
instal lalu
lakukan inisialisasi
gcloud CLI. Jika sebelumnya Anda telah menginstal gcloud CLI, dapatkan versi terbaru dengan menjalankan
gcloud components update
.
Batasan
- Keterbatasan Compute Engine berlaku.
Persyaratan
- Node GKE harus menggunakan image node Container-Optimized OS.
Mengaktifkan gVNIC
Anda dapat membuat cluster yang memiliki kumpulan node yang menggunakan gVNIC, membuat kumpulan node dengan gVNIC yang diaktifkan, atau memperbarui kumpulan node untuk menggunakan gVNIC.
Membuat cluster
Buat cluster dengan kumpulan node yang menggunakan gVNIC:
gcloud container clusters create CLUSTER_NAME \
--accelerator type=GPU_TYPE,count=AMOUNT \
--machine-type=MACHINE_TYPE \
--enable-gvnic
Ganti kode berikut:
CLUSTER_NAME
: nama cluster baru.GPU_TYPE
: jenis akselerator GPU yang Anda gunakan. Misalnya,nvidia-tesla-t4
.AMOUNT
: jumlah GPU yang akan dipasang ke node di node pool.MACHINE_TYPE
: jenis mesin yang ingin Anda gunakan. gVNIC tidak didukung pada jenis mesin yang memorinya dioptimalkan.
Membuat node pool
Buat node pool yang menggunakan gVNIC:
gcloud container node-pools create NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Ganti kode berikut:
NODEPOOL_NAME
: nama node pool baru.CLUSTER_NAME
: nama cluster yang ada.
Memperbarui node pool
Update node pool untuk menggunakan gVNIC:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--enable-gvnic
Ganti kode berikut:
NODEPOOL_NAME
: nama node pool yang ingin Anda perbarui.CLUSTER_NAME
: nama cluster yang ada.
Perubahan ini memerlukan pembuatan ulang node, yang dapat menyebabkan gangguan pada workload yang sedang berjalan. Untuk mengetahui detail tentang perubahan spesifik ini, temukan baris yang sesuai dalam tabel perubahan manual yang membuat ulang node menggunakan strategi upgrade node tanpa mematuhi kebijakan pemeliharaan. Untuk mempelajari update node lebih lanjut, lihat Merencanakan gangguan update node.
Menonaktifkan gVNIC
Update kumpulan node menggunakan flag --no-enable-gvnic
:
gcloud container node-pools update NODEPOOL_NAME \
--cluster=CLUSTER_NAME \
--no-enable-gvnic
Perubahan ini memerlukan pembuatan ulang node, yang dapat menyebabkan gangguan pada workload yang sedang berjalan. Untuk mengetahui detail tentang perubahan spesifik ini, temukan baris yang sesuai dalam tabel perubahan manual yang membuat ulang node menggunakan strategi upgrade node tanpa mematuhi kebijakan pemeliharaan. Untuk mempelajari update node lebih lanjut, lihat Merencanakan gangguan update node.
Pemecahan masalah
Untuk memecahkan masalah gVNIC, lihat Memecahkan Masalah Google Virtual NIC.
Langkah berikutnya
- Gunakan logging kebijakan jaringan untuk merekam kapan koneksi ke Pod diizinkan atau ditolak oleh kebijakan jaringan cluster Anda.