Kuota operasi serentak Compute Engine


Dokumen ini menjelaskan kuota operasi serentak untuk Compute Engine.

Kuota operasi serentak

Kuota operasi serentak menentukan jumlah operasi yang sedang berlangsung atau serentak yang dapat terjadi pada titik waktu tertentu. Setiap permintaan API yang membuat, mengubah, atau menghapus resource Compute Engine tunduk pada pemeriksaan batas operasi serentak untuk memastikan bahwa jumlah total operasi yang sedang berlangsung pada titik waktu tertentu tidak melebihi batas yang ditentukan untuk operasi tersebut.

Error batas operasi serentak terlampaui

Jika project Anda melebihi batas operasi serentak untuk operasi yang sedang berlangsung, Anda akan menerima error 403 dengan alasan rateLimitExceeded.

Respons API error terlihat mirip dengan yang berikut ini:

    "error": {
      "code": 403,
      "message": "Rate Limit Exceeded",
      "errors": [
        {
          "message": "Rate Limit Exceeded",
          "domain": "usageLimits",
          "reason": "rateLimitExceeded",
        ...
        ...
        }
      ],
      "details": [
        {
          "@type": "type.googleapis.com/google.rpc.ErrorInfo",
          "reason": "CONCURRENT_OPERATIONS_QUOTA_EXCEEDED",
          "domain": "compute.googleapis.com",
          "metadatas": {
            "containerType": "PROJECT",
            "containerId": "PROJECT_ID",
            "quotaMetric": "QUOTA_METRIC",
            "quotaLimit": "QUOTA_LIMIT",
            "operationType": "OPERATION_TYPE",
            "location": "global | REGION"
          }
        },
        {
          "@type": "type.googleapis.com/google.rpc.Help",
          "links": [
            {
              "description": "Concurrent operations quota documentation.",
              "url": "https://cloud.google.com/compute/operations-quota#concurrent_operation_limits"
            }
          ]
        },
      ...
      ... 

Detail error berisi nilai berikut:

  • PROJECT_ID: ID project tempat kuota melebihi batas.

  • QUOTA_METRIC: metrik untuk kuota serentak yang melebihi batas. Dapat berupa salah satu dari hal berikut:

    • compute.googleapis.com/global_concurrent_operations
    • compute.googleapis.com/regional_concurrent_operations
  • QUOTA_LIMIT: nama batas kuota serentak. Dapat berupa salah satu dari hal berikut:

    • GlobalConcurrentOperationsPerProject
    • GlobalConcurrentOperationsPerProjectOperationType
    • RegionalConcurrentOperationsPerProject
    • RegionalConcurrentOperationsPerProjectOperationType
  • OPERATION_TYPE: operasi global atau regional yang kuotanya melebihi batas. Untuk daftar operasi, lihat Grup kuota operasi serentak.

  • location dapat berupa salah satu dari hal berikut:

    • global: menentukan bahwa batas terlampaui untuk kuota operasi global
    • REGION: menentukan region tempat batas kuota operasi terlampaui

Log error mendetail hanya ditampilkan melalui respons API. Error di Logs Explorer mirip dengan yang berikut ini:

   "protoPayload":{
    "@type": "type.googleapis.com/google.cloud.audit.AuditLog",
    "status": {
      "message": "Rate Limit Exceeded"
    }
    "serviceName": "compute.googleapis.com",
    "methodName": "METHOD_NAME",
    ...
    ...
    "response": {
      "error": {
        "message": "Rate Limit Exceeded",
        "code": 403,
        "errors": [
          {
            "message": "Rate Limit Exceeded",
            "reason": "rateLimitExceeded",
            "domain": "usageLimits"
          }
        ]
      },
      "@type": "type.googleapis.com/error"
    },
    ...
    ... 

METHOD_NAME dalam error mewakili metode API yang batas kapasitasnya terlampaui. Contoh, v1.compute.instances.stop.

Grup kuota operasi serentak

Bagian ini menjelaskan batas untuk berbagai operasi Compute Engine yang sedang berlangsung atau serentak.

Kuota operasi global

Operasi global serentak memakai batas global yang ditentukan untuk jenis operasi per project. Tabel berikut mencantumkan kuota global untuk operasi yang sedang berlangsung dan metrik yang sesuai.

Anda dapat melihat kuota untuk operasi global menggunakan Konsol Google Cloud, Google Cloud CLI, dan Service Usage API. Untuk mengetahui informasi selengkapnya, lihat Melihat kuota dan batas operasi serentak.

Nama kuota
Deskripsi
Nama metrik Metode yang menggunakan kuota ini
Concurrent global operations per project
Membatasi jumlah total operasi global serentak untuk sebuah project.

Lihat kuota ini di Konsol Google Cloud

compute.googleapis.com/global_concurrent_operations

Semua metode global.

URL permintaan HTTP berisi global untuk metode ini. Misalnya, metode networks.insert:
POST /compute/v1/projects/{project}/global/networks

Concurrent global operations per project operation type
Membatasi jumlah operasi serentak per project per jenis operasi.

Lihat kuota ini di Konsol Google Cloud

compute.googleapis.com/global_concurrent_operations

Semua metode global.

Kuota operasi serentak default adalah 500 operasi yang sedang berlangsung per project, kecuali untuk metode berikut, yang memiliki batas default yang berbeda:

globaladdresses.move

firewalls.delete

firewalls.insert

images.delete

images.deprecate

images.insert

images.patch

images.setLabels

images.setIamPolicy

licenses.insert

machineimages.delete

machineimages.insert

networks.addPeering

networks.removePeering

networks.updatePeering

projects.setCommonInstaneMetadata

publicAdvertisedPrefixes.delete

publicAdvertisedPrefixes.insert

routes.delete

routes.insert

securityPolicies.patchRule

snapshots.delete

snapshots.insert

snapshots.setLabels

snapshots.setIamPolicy

snapshotSettings.patch

Kuota operasi regional

Operasi regional serentak menggunakan batas regional yang ditentukan untuk jenis operasi per project di region tertentu.

Tabel berikut mencantumkan kuota regional untuk operasi yang sedang berlangsung dan metrik yang sesuai.

Anda dapat melihat kuota untuk operasi regional menggunakan konsol Google Cloud, Google Cloud CLI, dan Service Usage API. Untuk mengetahui informasi selengkapnya, lihat Melihat kuota dan batas operasi serentak.

Nama kuota
Deskripsi
Nama metrik Metode yang menggunakan kuota ini
Concurrent regional operations per project
Membatasi jumlah total operasi regional serentak untuk sebuah project.

Lihat kuota ini di Konsol Google Cloud

compute.googleapis.com/regional_concurrent_operations

Semua metode regional.

URL permintaan HTTP berisi regions atau zones untuk metode ini.
Misalnya, metode instances.insert:
POST /compute/v1/projects/{project}/zones/{zone}/instances

Concurrent regional operations per project operation type
Membatasi jumlah operasi regional serentak per project per jenis operasi.

Lihat kuota ini di Konsol Google Cloud

compute.googleapis.com/regional_concurrent_operations

Semua metode regional.

Kuota operasi serentak default adalah 500 operasi yang sedang berlangsung per project per region, kecuali untuk metode berikut, yang memiliki batas default yang berbeda:

addresses.move

disks.insert

instances.delete

instances.insert

instances.simulateMaintenanceEvent

networkEndpointGroups.attachNetworkEndpoints

networkEndpointGroups.detachNetworkEndpoints

publicDelegatedPrefixes.delete

publicDelegatedPrefixes.insert

Melihat kuota dan batas operasi serentak

Untuk melihat penggunaan dan batas kuota dalam project, lakukan hal berikut:

Konsol

  1. Di Konsol Google Cloud, buka halaman Quotas.

    Buka Kuota

    Halaman Kuota mencantumkan semua penggunaan dan batas kuota untuk project Anda. Secara default, daftar ini diurutkan untuk menampilkan kuota yang paling banyak digunakan terlebih dahulu, yang membantu Anda melihat batas yang berisiko terlampaui.

  2. Untuk memfilter daftar dan melihat penggunaan serta batas untuk kuota tertentu, pilih Kuota atau Metrik di kolom Filter.

    Misalnya, pilih Quota Concurrent global operations per project operation type untuk melihat penggunaan kuota untuk metode global per jenis operasi.

    Untuk memfilter kuota untuk operasi tertentu, tambahkan Dimensions ke kueri filter dan pilih operation_type. Misalnya, pilih firewalls_insert untuk melihat penggunaan dan batas kuota untuk operasi firewalls.insert.

gcloud

Anda dapat menggunakan Google Cloud CLI untuk melihat penggunaan dan batas kuota operasi serentak.

Untuk menggunakan pendekatan ini, pastikan Anda telah menginstal komponen perintah alfa. Jika Anda menggunakan Cloud Shell untuk berinteraksi dengan Google Cloud, Google Cloud CLI akan diinstal untuk Anda.

Untuk melihat kuota, gunakan perintah berikut:

gcloud alpha services quota list \
    --service=compute.googleapis.com \
    --consumer=projects/PROJECT_ID

Ganti PROJECT_ID dengan ID project yang kuotanya ingin Anda lihat.

Praktik terbaik

Checklist berikut merangkum praktik terbaik untuk mengurangi error batas operasi serentak yang tidak memadai:

Langkah berikutnya