Jumlah maksimum instance (layanan)

Halaman ini menjelaskan cara mengatur maksimum instance yang dapat digunakan untuk layanan Cloud Run Anda. Menentukan instance maksimum di Cloud Run memungkinkan Anda untuk membatasi penskalaan layanan sebagai respons terhadap permintaan masuk, meskipun setelan maksimum dapat terlampaui untuk jangka waktu yang singkat karena keadaan seperti lonjakan traffic. Gunakan setelan ini sebagai salah satu cara untuk mengontrol biaya Anda atau untuk membatasi jumlah koneksi ke layanan cadangan seperti ke database.

Untuk informasi tentang batas maksimum instance yang mungkin diterapkan pada layanan Anda, baca Batas instance maksimum.

Untuk informasi selengkapnya tentang cara Cloud Run melakukan penskalaan otomatis pada instance container, baca Penskalaan otomatis instance.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk mengonfigurasi dan men-deploy layanan Cloud Run, minta administrator untuk memberi Anda peran IAM berikut:

Untuk daftar peran dan izin IAM yang terkait dengan Cloud Run, lihat Peran IAM Cloud Run dan izin IAM Cloud Run. Jika layanan Cloud Run Anda berinteraksi dengan Google Cloud API, seperti Library Klien Cloud, lihat panduan konfigurasi identitas layanan. Untuk mengetahui informasi selengkapnya tentang memberikan peran, lihat izin deployment dan mengelola akses.

Mengatur dan memperbarui instance maksimum

Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi berikutnya juga akan secara otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan update yang eksplisit untuk mengubahnya.

Secara default, layanan Cloud Run dikonfigurasi untuk melakukan penyebaran skala hingga maksimum 100 instance.

Anda dapat mengubah setelan instance maksimum menggunakan konsol Google Cloud, command line gcloud, atau file YAML saat Anda membuat layanan baru atau men-deploy revisi baru.

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang ada, klik layanan, lalu klik Edit and deploy new revision.

  3. Jika Anda mengonfigurasi layanan baru, isi halaman setelan layanan awal sesuai keinginan, kemudian klik Container, vo;ume, jejaring, sekuritas untuk memperluas halaman konfigurasi layanan.

  4. Klik tab Container.

    gambar

    • Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari 1 hingga batas maksimum
  5. Klik Create atau Deploy.

Command line

Anda dapat memperbarui jumlah maksimum instance untuk layanan tertentu menggunakan perintah berikut:

gcloud run services update SERVICE --max-instances MAX-VALUE

Ganti

  • SERVICE dengan nama layanan Anda dan
  • MAX-VALUE dengan jumlah maksimum instance container yang Anda inginkan, menggunakan nilai bilangan bulat apa pun dari 1 hingga batas maksimum. Tentukan default untuk menghapus setiap setelan maksimum instance dan memulihkan default 100 instance.

Anda juga dapat mengatur jumlah maksimum instance selama deployment menggunakan perintah:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Ganti

  • IMAGE_URL dengan referensi ke image container misalnya, us-docker.pkg.dev/cloudrun/container/hello:latest. Jika Anda menggunakan Artifact Registry, repositori REPO_NAME harus sudah dibuat. URL memiliki bentuk LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG .
  • MAX-VALUE dengan jumlah maksimum container instance yang diinginkan.

YAML

  1. Jika Anda membuat layanan baru, lewati langkah ini. Jika Anda mengupdate layanan yang ada, download konfigurasi YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Perbarui autoscaling.knative.dev/maxScale: atribut:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    Ganti

    • SERVICE dengan nama layanan Cloud Run Anda
    • MAX-INSTANCE dengan jumlah maksimum yang diinginkan.
    • REVISION dengan nama revisi baru atau hapus (jika ada). Jika Anda memberikan nama revisi baru, nama tersebut harus memenuhi kriteria berikut:
      • Dimulai denganSERVICE-
      • Hanya berisi huruf kecil, angka, dan -
      • Tidak diakhiri dengan -
      • Tidak melebihi 63 karakter
  3. Buat atau update layanan menggunakan perintah berikut:

    gcloud run services replace service.yaml

Terraform

Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform.

Resource google_cloud_run_v2_serviceberikut menentukan jumlah maksimum instance 10 pada template.scaling. Ganti 10 dengan jumlah maksimum instance yang Anda inginkan.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

Batas instance maksimum

Secara default, layanan Cloud Run dikonfigurasi hingga maksimum 100 instance

Batas maksimum tergantung pada region layanan Cloud Run dan konfigurasi CPU serta memori Cloud Run.

Halaman kuota menampilkan kuota dasar per region.

Jumlah maksimum instance ditentukan sebagai jumlah minimum:

  • dasar pengukuran kuota / permintaan kelipatan 1 CPU
  • dasar pengukuran kuota / permintaan kelipatan 2GB memori

Misalnya, kuota dasar sebanyak 1000 instance dengan 4GB memori atau 2CPU sama-sama akan mendapat batas efektif sebanyak 500.

Jika Anda ingin menentukan jumlah maksimal instance yang lebih besar dari jumlah maksimum yang diizinkan di region layanan Cloud Run, Anda harus membuat permintaan penambahan kuota.

Tampilan setelan instance maksimum

Guna menampilkan setelan instance maksimum untuk layanan Cloud Run Anda saat ini:

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik layanan yang Anda minati untuk membuka halaman Detail layanan.

  3. Klik tab Revisi.

  4. Di sebelah kanan panel detail, setelan instance maksimum tercantum di bagian tab Container.

Command line

  1. Gunakan perintah berikut:

    gcloud run services describe SERVICE
  2. Temukan setelan jumlah instance maksimum dalam konfigurasi yang ditampilkan.