Pengatur kuota

Dokumen ini menjelaskan cara menyesuaikan kuota menggunakan sistem penyesuaian kuota.

Pengatur kuota mengamati pemakaian resource Anda dan secara proaktif mengirimkan permintaan penyesuaian kuota atas nama Anda. Memantau penggunaan resource dan mengirimkan permintaan penyesuaian kuota secara proaktif dapat mencegah gangguan yang disebabkan oleh tercapainya nilai kuota Anda. Dengan menggunakan pengatur kuota, Anda tidak perlu memantau peningkatan penggunaan resource yang tidak direncanakan, dan Anda dapat mengirim lebih sedikit permintaan penyesuaian kuota secara manual.

Cara kerja pengatur kuota

Saat Anda mengaktifkan pengatur kuota, pengatur kuota akan memantau semua kuota yang berlaku dan menerapkan logika berikut:

  • Pengatur kuota memeriksa apakah penggunaan puncak telah mendekati nilai kuota selama durasi yang ditentukan.
  • Jika demikian, pengatur kuota akan mencoba meningkatkan nilai kuota (biasanya sekitar 10-20%).

Jika memungkinkan untuk meningkatkan nilai kuota, peningkatan tersebut akan disetujui dan nilai akan disesuaikan. Anda masih dapat meminta penambahan nilai kuota secara manual kapan saja, terlepas dari apakah pengatur kuota diaktifkan atau tidak.

Pengatur kuota hanya mengirimkan permintaan penyesuaian kuota untuk meningkatkan nilai kuota. Tidak mencoba menurunkan nilai. Untuk kuota yang memiliki batas kuota manual, pengatur kuota tidak mengirimkan permintaan penyesuaian kuota.

Anda dapat melihat permintaan yang dibuat oleh pengatur kuota di halaman Quotas & System Limits di konsolGoogle Cloud . Anda juga dapat menyiapkan pemberitahuan untuk memantau perubahan yang dimulai oleh pengatur kuota.

Batasan

Pengatur kuota memiliki batasan berikut:

  • Setelan pengatur kuota hanya tersedia per project.
  • Setelan pengatur kuota hanya dapat diakses dari konsolGoogle Cloud .
  • Penyesuai kuota tidak tersedia untuk semua kuota. Untuk mempelajari lebih lanjut, lihat Ketersediaan dalam dokumen ini.

Ketersediaan

Ketersediaan pengatur kuota bergantung pada Google Cloud project Anda dan hanya tersedia untuk beberapa kuota Google Cloud .

Kelayakan berdasarkan histori penggunaan

Pengatur kuota memerlukan volume data penggunaan historis yang memadai agar dapat menentukan waktu untuk meminta kuota tambahan secara akurat. Karena alasan ini, opsi untuk mengaktifkan pengatur kuota hanya tersedia di project dengan aktivitas historis yang cukup untuk mendukung prediksi yang akurat.

Kuota yang didukung

Penyesuai kuota tidak tersedia untuk semua kuotaGoogle Cloud . Layanan Google Cloud mungkin mendukung penyesuai kuota untuk semua, beberapa, atau tidak satu pun kuotanya. Jika Anda mengaktifkan pengatur kuota di project, pengatur kuota akan berlaku untuk semua kuota yang didukung.

Saat layanan Google Cloud menambahkan atau memperluas dukungan pengatur kuota untuk kuotanya, pengatur kuota akan otomatis memantau dan menyesuaikan kuota yang baru didukung ini untuk project Anda. Hal ini terjadi meskipun kuota spesifik ini tidak didukung saat Anda pertama kali mengaktifkan penyesuai kuota.

Tabel berikut mencantumkan kuota yang didukung oleh penyesuai kuota.

Layanan Kuota
Artifact Registry API Permintaan per project di multi-region Asia per menit
Artifact Registry API Permintaan per project di multi-region Eropa per menit
Artifact Registry API Permintaan per project di multi-region Amerika Serikat per menit
Artifact Registry API Permintaan per project per region per menit per region
Cloud Build API Permintaan Get Build dan Operasi per menit
Cloud Build API Permintaan Get Build dan Operasi per menit per pengguna
Cloud Build API CPU Build Serentak (Kumpulan Default Regional)
Cloud Build API Build Serentak (Kumpulan Default Non-regional)
Cloud Key Management Service API Permintaan kriptografi per menit
Cloud Key Management Service API Permintaan baca per menit
Cloud Key Management Service API Permintaan tulis per menit
Cloud Logging API Byte tulis log per menit per region
Cloud Resource Manager API Permintaan baca per menit
Cloud Run Admin API Permintaan menjalankan tugas per menit per region
Cloud Run Admin API Permintaan baca per menit per region
Cloud Run Admin API Total alokasi CPU, dalam milli vCPU, per project per region
Cloud Run Admin API Permintaan tulis per menit per region
Cloud Trace API Permintaan tulis (gratis) per menit
Compute Engine API Grup minat
Compute Engine API Bucket backend
Compute Engine API CPU C2
Compute Engine API CPU C2D
Compute Engine API CPU C3
Compute Engine API Komitmen
Compute Engine API CPU A2 yang dikomitmenkan
Compute Engine API CPU yang dikomitmenkan
Compute Engine API Lisensi terpakai
Compute Engine API Disk SSD lokal terpakai yang dialokasikan (GB)
Compute Engine API CPU M3 yang dikomitmenkan
Compute Engine API CPU yang Dioptimalkan untuk Memori yang Dikomitmenkan
Compute Engine API CPU N2 yang dikomitmenkan
Compute Engine API CPU N2D yang dikomitmenkan
Compute Engine API CPU T2D yang dikomitmenkan
Compute Engine API CPU
Compute Engine API CPU per keluarga VM
Compute Engine API Project Cross Project Networking Service
Compute Engine API Rute statis kustom per Jaringan VPC
Compute Engine API Layanan backend Load Balancer Jaringan passthrough eksternal
Compute Engine API Aturan penerusan Load Balancer Jaringan passthrough eksternal
Compute Engine API Aturan penerusan protokol eksternal
Compute Engine API Aturan firewall
Compute Engine API Aturan penerusan
Compute Engine API Layanan backend terkelola eksternal global
Compute Engine API Global External Managed Forwarding Rules
Compute Engine API Layanan backend LB proxy eksternal global
Compute Engine API Layanan backend global internal traffic director
Compute Engine API Jumlah GPU per kelompok GPU
Compute Engine API GPU (semua region)
Compute Engine API Health check
Compute Engine API Gambar
Compute Engine API Alamat IP yang digunakan
Compute Engine API Alamat IPv4 eksternal regional yang sedang digunakan
Compute Engine API Jadwal snapshot yang sedang digunakan
Compute Engine API Grup instance
Compute Engine API Template instance
Compute Engine API Instance Per grup peering
Compute Engine API Instance per Jaringan VPC
Compute Engine API Alamat IP internal
Compute Engine API Layanan backend Load Balancer Jaringan passthrough internal
Compute Engine API Aturan penerusan Load Balancer Jaringan passthrough internal per grup peering
Compute Engine API Aturan penerusan Load Balancer Jaringan passthrough internal per jaringan VPC
Compute Engine API IP Alias per grup peering
Compute Engine API Alias IP per Jaringan VPC
Compute Engine API Disk SSD lokal per kelompok VM (GB)
Compute Engine API CPU M1
Compute Engine API CPU M2
Compute Engine API CPU M3
Compute Engine API Grup instance terkelola
Compute Engine API CPU N2
Compute Engine API CPU N2D
Compute Engine API Network endpoint groups
Compute Engine API Kebijakan firewall jaringan
Compute Engine API Atribut aturan kebijakan keamanan load balancing jaringan
Compute Engine API Kebijakan keamanan load balancing jaringan
Compute Engine API Jaringan
Compute Engine API CPU NVIDIA A2
Compute Engine API Peering Per Jaringan VPC
Compute Engine API IOPS Persistent Disk
Compute Engine API SSD Persistent Disk (GB)
Compute Engine API Persistent Disk Standar (GB)
Compute Engine API CPU yang Dapat Ditentukan Sebelumnya
Compute Engine API SSD Lokal yang Dapat Di-preempt (GB)
Compute Engine API GPU NVIDIA A100 80 GB yang dapat di-preempt
Compute Engine API GPU NVIDIA A100 yang dapat di-preempt
Compute Engine API GPU NVIDIA H100 yang dapat di-preempt
Compute Engine API GPU MEGA NVIDIA H100 yang dapat di-preempt
Compute Engine API GPU NVIDIA K80 yang dapat di-preempt
Compute Engine API GPU NVIDIA L4 yang dapat di-preempt
Compute Engine API GPU Workstation Virtual NVIDIA L4 yang dapat di-preempt
Compute Engine API GPU NVIDIA P100 yang dapat di-preempt
Compute Engine API GPU Workstation Virtual NVIDIA P100 yang dapat di-preempt
Compute Engine API GPU NVIDIA P4 yang dapat di-preempt
Compute Engine API GPU Workstation Virtual NVIDIA P4 yang dapat di-preempt
Compute Engine API GPU NVIDIA T4 yang dapat di-preempt
Compute Engine API GPU Workstation Virtual NVIDIA T4 yang dapat di-preempt
Compute Engine API GPU NVIDIA V100 yang dapat di-preempt
Compute Engine API Imbuhan yang diberitahukan publik
Compute Engine API Layanan backend terkelola eksternal regional
Compute Engine API Aturan Penerusan Terkelola Eksternal Regional per region per Jaringan VPC
Compute Engine API Template Instance regional
Compute Engine API Layanan backend terkelola internal regional
Compute Engine API Layanan backend Traffic Director internal regional
Compute Engine API Grup instance terkelola regional
Compute Engine API Kebijakan keamanan regional
Compute Engine API Aturan kebijakan keamanan regional dengan kondisi kecocokan lanjutan
Compute Engine API Proxy TCP Target Regional
Compute Engine API Router
Compute Engine API Rute
Compute Engine API Kebijakan keamanan
Compute Engine API Aturan kebijakan keamanan
Compute Engine API Aturan bahasa aturan kebijakan keamanan
Compute Engine API Snapshot
Compute Engine API Sertifikat SSL
Compute Engine API Alamat IP BYOIP statis
Compute Engine API Alamat IP statis
Compute Engine API Rentang subnet Per grup peering
Compute Engine API Rentang subnet per Jaringan VPC
Compute Engine API CPU T2A
Compute Engine API CPU T2D
Compute Engine API Proxy HTTP Target
Compute Engine API Proxy HTTPS Target
Compute Engine API Proxy SSL target
Compute Engine API Proxy TCP target
Compute Engine API Gerbang VPN target
Compute Engine API Total disk SSD Lokal yang dialokasikan (GB)
Compute Engine API Peta URL
Compute Engine API Instance VM
Compute Engine API Gateway VPN
Compute Engine API Tunnel VPN
Connect Gateway API Permintaan Koneksi Gateway per menit
Dialogflow API Semua permintaan lainnya per menit
Filestore API Pencadangan per region
Filestore API Kapasitas HDD dasar (Standard) (GB) per region
Filestore API Kapasitas SSD Dasar (Premium) (GB) per region
Filestore API Kapasitas Zonal & Regional 1-10 TiB (Enterprise) (GB) per region
Filestore API Kapasitas (GB) Skala Tinggi 10-100 TiB Zona & Regional per region
Google Cloud Memorystore for Redis API Total kapasitas Redis (GB) per region
Google Cloud Memorystore for Redis API Total unit Redis Cluster per project per region
Memorystore API Total unit Memorystore per project per region
Vertex AI API CPU inferensi model kustom per region
Vertex AI API GPU Nvidia T4 untuk inferensi model kustom per region
Vertex AI API Pelatihan model kustom GPU Nvidia T4 per region
Vertex AI API Permintaan pembuatan konten per menit per project per model dasar
Vertex AI API

Permintaan prediksi online regional per menit per project per model dasar

Catatan: Untuk melihat daftar lengkap dimensi yang tersedia, luaskan entri ini di konsol Google Cloud .

Vertex AI API Permintaan pengelolaan resource (CRUD) per menit per region
Vertex AI API Core pod TPU V3 pelatihan gambar yang dibatasi per region

Mengaktifkan pengatur kuota

Untuk mengaktifkan pengatur kuota, Anda harus memiliki izin IAM berikut:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Untuk mengaktifkan pengatur kuota di project konsol Google Cloud Anda, pilih tab yang sesuai dan ikuti petunjuknya:

Konsol

Untuk mengaktifkan pengatur kuota di project Google Cloud dari konsol Google Cloud , ikuti langkah-langkah berikut:

  1. Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:

    Buka Quotas & System Limits

  2. Klik tab Konfigurasi.
  3. Klik tombol Aktifkan.

Saat kolom Status menampilkan Diaktifkan, pengatur kuota akan memantau penggunaan Anda dan mengeluarkan permintaan penyesuaian kuota saat penggunaan resource mendekati nilai kuotanya.

REST

  1. Untuk mengaktifkan pengatur kuota di project Google Cloud Anda menggunakan REST API (Pratinjau), buat permintaan HTTP untuk memperbarui setelan pengatur kuota:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Dalam isi permintaan, tentukan resource setelan penyesuai kuota dan tetapkan kolom enablement ke ENABLED. Anda juga dapat menentukan ETag, tetapi tindakan ini bersifat opsional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: ENABLED
      etag: OPTIONAL_ETAG
    }
    

    Ganti kode berikut:

    • PROJECT_ID_OR_NUMBER: project ID atau nomor project dari project yang ingin Anda aktifkan penyesuai kuotanya.
    • OPTIONAL_ETAG: string ETag opsional untuk setelan penyesuai kuota.

    Tindakan ini akan memperbarui status pengaktifan menjadi enabled.

gcloud

Untuk mengaktifkan pengatur kuota di Google Cloud project menggunakan gcloud CLI (Pratinjau), ikuti langkah-langkah berikut:

  1. Lakukan autentikasi menggunakan gcloud CLI:

    gcloud auth login
    
  2. Aktifkan setelan pengatur kuota:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=enabled
    

    Ganti PROJECT_ID_OR_NUMBER dengan project ID atau nomor project yang ingin Anda aktifkan penyesuai kuotanya.

  3. Verifikasi status pengaktifan:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Selama Anda memiliki izin yang diperlukan, perintah ini akan menampilkan status sebagai enabled.

Melihat permintaan penyesuaian kuota

Untuk melihat permintaan penyesuaian kuota, Anda harus memiliki izin IAM berikut:

  • resourcemanager.projects.get
  • serviceusage.services.list
  • serviceusage.quotas.get

Untuk melihat permintaan penyesuaian kuota yang dikeluarkan oleh pengatur kuota:

  1. Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:

    Buka Quotas & System Limits

  2. Klik tab Permintaan Penambahan. Tampilan Permintaan Penambahan menampilkan permintaan penambahan untuk project Anda, termasuk penambahan yang diminta secara manual dan permintaan yang dikeluarkan oleh pengatur kuota.
  3. Klik kolom Filter.
  4. Pilih Jenis dari menu, lalu masukkan Auto. Filter ini digunakan untuk permintaan yang dibuat oleh pengatur kuota.

Menyiapkan pemberitahuan pengatur kuota

Untuk menerima notifikasi dari pengatur kuota:

  1. Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:

    Buka Quotas & System Limits

  2. Klik tab Konfigurasi.
  3. Klik Buat Pemberitahuan.
  4. Pilih salah satu atau kedua template pemberitahuan:
    1. Semua penyesuaian oleh Quota Adjuster akan mengirimkan pemberitahuan setiap kali pengatur kuota mengeluarkan permintaan penyesuaian kuota untuk project.
    2. Error dan kegagalan Pengatur Kuota hanya mengirimkan pemberitahuan saat pengatur kuota mencoba meningkatkan nilai kuota dan tidak dapat melakukannya.
  5. Opsional: Sesuaikan nilai default untuk jumlah waktu minimum antara pemberitahuan dan durasi penutupan otomatis insiden dengan mengklik Tampilkan Opsi.
  6. Pilih Saluran Notifikasi untuk menerima pemberitahuan. Untuk menyesuaikan setelan saluran notifikasi atau membuat saluran notifikasi baru, klik Kelola Saluran Notifikasi.
  7. Klik Buat.

Mengedit atau menghapus pemberitahuan penyesuai kuota

Anda dapat mengedit atau menghapus pemberitahuan penyesuai kuota di konsol Google Cloud :

  1. Buka halaman Policies di konsol Cloud Monitoring.

    Buka Kebijakan

  2. Cari kebijakan pemberitahuan pengatur kuota Anda. Kebijakan pemberitahuan pengatur kuota memiliki nama berikut:

    • Quota adjuster errors and failures
    • All adjustments by quota adjuster
  3. Di baris yang menampilkan kebijakan pemberitahuan penyesuai kuota, klik Lihat lainnya.

  4. Klik Edit atau Hapus.

Menonaktifkan pengatur kuota

Untuk menonaktifkan pengatur kuota, Anda harus memiliki izin IAM berikut:

  • cloudquotas.quotas.update
  • cloudquotas.quotas.get

Untuk menonaktifkan pengatur kuota di project konsol Google Cloud Anda, pilih tab yang sesuai dan ikuti petunjuknya:

Konsol

  1. Di konsol Google Cloud , buka halaman IAM & Admin > Quotas & System Limits:

    Buka Quotas & System Limits

  2. Klik tab Konfigurasi.
  3. Klik tombol Aktifkan. Tombol beralih akan berubah menjadi abu-abu.

Jika tombol berwarna abu-abu dan kolom status menampilkan Tidak Aktif, pengatur kuota tidak lagi memantau penggunaan Anda atau mengeluarkan permintaan penyesuaian kuota.

REST

  1. Untuk menonaktifkan pengatur kuota di Google Cloud project menggunakan REST API (Pratinjau), buat permintaan HTTP untuk memperbarui setelan pengatur kuota:

    PATCH https://cloudquotas.googleapis.com/v1beta/projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
    
  2. Dalam isi permintaan, tentukan resource setelan penyesuai kuota dan tetapkan kolom enablement ke DISABLED. Anda juga dapat menentukan ETag, tetapi tindakan ini bersifat opsional:

    {
      name: projects/PROJECT_ID_OR_NUMBER/locations/global/quotaAdjusterSettings
      enablement: DISABLED
      etag: OPTIONAL_ETAG
    }
    

    Ganti kode berikut:

    • PROJECT_ID_OR_NUMBER: project ID atau nomor project dari project yang ingin Anda nonaktifkan penyesuai kuotanya.
    • OPTIONAL_ETAG: string ETag opsional untuk setelan penyesuai kuota.

    Tindakan ini akan memperbarui status pengaktifan menjadi disabled.

gcloud

Untuk menonaktifkan pengatur kuota di Google Cloud project menggunakan gcloud CLI (Pratinjau), ikuti langkah-langkah berikut:

  1. Lakukan autentikasi ke gcloud CLI:

    gcloud auth login
    
  2. Menonaktifkan setelan pengatur kuota:

    gcloud beta quotas adjuster settings update --project=PROJECT_ID_OR_NUMBER --enablement=disabled
    

    Ganti PROJECT_ID_OR_NUMBER dengan project ID atau nomor project yang ingin Anda nonaktifkan penyesuai kuotanya.

  3. Verifikasi status pengaktifan:

    gcloud beta quotas adjuster settings describe --project=PROJECT_ID_OR_NUMBER
    

    Selama Anda memiliki izin yang diperlukan, perintah ini akan menampilkan status sebagai disabled.

Memecahkan masalah penolakan penambahan kuota

Penambahan kuota yang dimulai oleh pengatur kuota mungkin akan ditolak. Hal ini terkadang terjadi ketika Google Cloud tidak dapat meningkatkan kuota untuk project, resource, atau region tertentu yang melebihi nilai tertentu. Dalam skenario ini, Anda masih dapat meminta penambahan kuota manual.

Untuk menerima notifikasi saat permintaan penyesuaian kuota yang dibuat oleh pengatur kuota ditolak, siapkan pemberitahuan pengatur kuota.