Dokumen ini berisi daftar kuota dan batas yang berlaku untuk Google Kubernetes Engine.
Kuota membatasi jumlah resource Google Cloud bersama tertentu yang dapat digunakan oleh project Google Cloud Anda, termasuk komponen hardware, software, dan jaringan.
Kuota adalah bagian dari sistem yang melakukan hal berikut:
- Memantau penggunaan atau konsumsi produk dan layanan Google Cloud oleh Anda.
- Membatasi konsumsi Anda atas sumber daya tersebut karena berbagai alasan, termasuk memastikan keadilan dan mengurangi lonjakan penggunaan.
- Mempertahankan konfigurasi yang otomatis menerapkan batasan yang ditentukan.
- Menyediakan cara untuk membuat atau meminta perubahan pada kuota.
Saat kuota terlampaui, umumnya sistem akan langsung memblokir akses ke resource Google yang relevan, dan tugas yang Anda coba lakukan akan gagal. Kuota umumnya berlaku untuk setiap project Google Cloud dan digunakan bersama oleh semua aplikasi dan alamat IP yang menggunakan project Google Cloud tersebut.
Untuk menambah atau mengurangi sebagian besar kuota, gunakan konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat Meminta batas kuota yang lebih tinggi.
Ada juga batasan pada resource GKE. Batas ini tidak terkait dengan sistem kuota. Batas tidak dapat diubah kecuali jika dinyatakan lain.
Batas per project
Dalam satu project, Anda dapat membuat maksimal 100 cluster zona per zona, ditambah 100 cluster regional per region.
Catatan: Cluster yang dibuat dalam mode Autopilot sudah dikonfigurasi sebelumnya sebagai cluster regional.
Batas per cluster
Tabel berikut menjelaskan batas per cluster GKE.
Setiap versi GKE yang ditentukan dalam tabel berikut berlaku untuk node cluster dan bidang kontrol.
Batas | Cluster GKE Standard | Cluster GKE Autopilot |
---|---|---|
Node per cluster |
15.000
Catatan: Jika Anda berencana menjalankan lebih dari 2.000 node, gunakan cluster regional. Catatan: Menjalankan lebih dari 5.000 node memerlukan peningkatan kuota ukuran cluster. Hubungi dukungan untuk mendapatkan bantuan. |
5.000
Catatan: Jika Anda berencana menjalankan lebih dari 1.000 node, gunakan GKE Autopilot versi 1.23 atau yang lebih baru. Catatan: Menjalankan lebih dari 400 node mungkin memerlukan peningkatan kuota ukuran cluster untuk cluster yang dibuat pada versi sebelumnya. Hubungi dukungan untuk mendapatkan bantuan. |
Node per node pool | 1.000 | Tidak berlaku |
Node dalam zona |
|
Tidak berlaku |
Pod per node2 |
256
Catatan: Untuk versi GKE yang lebih lama dari 1.23.5-gke.1300, batasnya adalah 110 Pod. |
32 |
Pod per cluster1 | 200.0002 | 25.000 |
Container per cluster | 400.000 | 25.000 |
Sebagai administrator platform, sebaiknya Anda memahami pengaruh kuota terhadap beban kerja besar yang berjalan di GKE. Untuk rekomendasi tambahan, praktik terbaik, batas, dan kuota untuk workload yang besar, lihat Panduan membuat cluster skalabel.
Batas untuk permintaan API
Batas kapasitas default untuk Kubernetes Engine API adalah 3.000 permintaan per menit, yang diberlakukan dengan interval setiap 100 detik.
Kuota resource
Untuk cluster di bawah 100 node, GKE menerapkan kuota resource Kubernetes ke setiap namespace. Kuota ini melindungi bidang kontrol cluster dari ketidakstabilan yang disebabkan oleh potensi bug dalam aplikasi yang di-deploy ke cluster. Anda tidak dapat menghapus kuota ini karena diterapkan oleh GKE.
GKE secara otomatis memperbarui nilai kuota resource sesuai dengan jumlah node. Untuk cluster di atas 100 node, GKE menghapus kuota resource.
Untuk memeriksa kuota resource, gunakan perintah berikut:
kubectl get resourcequota gke-resource-quotas -o yaml
Untuk melihat nilai namespace tertentu, tentukan namespace dengan menambahkan
opsi --namespace
.
Catatan
-
Jumlah maksimum Pod yang dapat dimuat dalam sebuah node bergantung pada ukuran permintaan resource Pod Anda dan kapasitas node. Anda mungkin tidak mencapai setiap batas secara bersamaan. Sebagai praktik terbaik, sebaiknya Anda memuat pengujian deployment besar. ↩
-
Jumlah maksimum Pod per cluster GKE Standard mencakup Pod sistem. Jumlah Pod sistem bervariasi, bergantung pada konfigurasi cluster dan fitur yang diaktifkan. ↩