Menetapkan jumlah maksimum instance (layanan)

Halaman ini menjelaskan cara mengatur maksimum instance yang dapat digunakan untuk layanan Cloud Run Anda.

Menentukan instance maksimum di Cloud Run memungkinkan Anda membatasi penskalaan layanan sebagai respons terhadap permintaan masuk, meskipun setelan maksimum dapat terlampaui untuk jangka waktu yang singkat karena keadaan seperti lonjakan traffic.

Anda dapat menggunakan setelan ini sebagai salah satu cara untuk mengontrol biaya Anda atau untuk membatasi jumlah koneksi ke layanan pendukung seperti ke database.

Untuk informasi tentang batas maksimum instance yang mungkin diterapkan pada layanan Anda, baca Batas instance maksimum.

Untuk informasi selengkapnya tentang cara Cloud Run melakukan penskalaan otomatis pada instance container, baca Penskalaan otomatis instance.

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan guna mengonfigurasi dan men-deploy layanan Cloud Run, minta administrator untuk memberi Anda peran IAM berikut:

Untuk mengetahui daftar peran dan izin IAM yang terkait dengan Cloud Run, lihat peran IAM Cloud Run dan izin IAM Cloud Run. Jika layanan Cloud Run Anda berinteraksi dengan Google Cloud API, seperti Library Klien Cloud, lihat panduan konfigurasi identitas layanan. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat izin deployment dan mengelola akses.

Menetapkan dan memperbarui instance maksimum

Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi berikutnya juga akan secara otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan update yang eksplisit untuk mengubahnya.

Secara default, layanan Cloud Run dikonfigurasi untuk melakukan penyebaran skala hingga maksimum 100 instance.

Anda dapat mengubah setelan instance maksimum menggunakan konsol Google Cloud, Google Cloud CLI, atau file YAML saat Anda membuat layanan baru atau men-deploy revisi baru.

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik Deploy container dan pilih Service untuk mengonfigurasi layanan baru. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan, lalu klik Edit dan deploy revisi baru.

  3. Jika Anda mengonfigurasi layanan baru, isi halaman setelan layanan awal, lalu klik Container, volume, networking, security untuk memperluas halaman konfigurasi layanan.

  4. Klik tab Container.

    gambar

    • Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari 1 hingga batas maksimum
  5. Klik Buat atau Deploy.

gcloud

Anda dapat memperbarui jumlah maksimum instance untuk layanan tertentu menggunakan perintah berikut:

gcloud run services update SERVICE --max-instances MAX-VALUE

Ganti

  • SERVICE dengan nama layanan Anda dan
  • MAX-VALUE dengan jumlah maksimum instance container yang Anda inginkan, menggunakan nilai bilangan bulat apa pun dari 1 hingga batas maksimum. Tentukan default untuk menghapus setiap setelan maksimum instance dan memulihkan default 100 instance.

Anda juga dapat mengatur jumlah maksimum instance selama deployment menggunakan perintah:

gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE

Ganti

  • IMAGE_URL dengan referensi ke image container misalnya, us-docker.pkg.dev/cloudrun/container/hello:latest. Jika Anda menggunakan Artifact Registry, repositori REPO_NAME harus sudah dibuat. URL memiliki bentuk LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG .
  • MAX-VALUE dengan jumlah maksimum container instance yang diinginkan.

YAML

  1. Jika Anda membuat layanan baru, lewati langkah ini. Jika Anda mengupdate layanan yang sudah ada, download konfigurasi YAML-nya:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Perbarui atribut autoscaling.knative.dev/maxScale::

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          annotations:
            autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
          name: REVISION

    Ganti

    • SERVICE dengan nama layanan Cloud Run Anda
    • MAX-INSTANCE dengan jumlah maksimum yang diperlukan.
    • REVISION dengan nama revisi baru atau hapus (jika ada). Jika Anda memberikan nama revisi baru, nama tersebut harus memenuhi kriteria berikut:
      • Dimulai denganSERVICE-
      • Hanya berisi huruf kecil, angka, dan -
      • Tidak diakhiri dengan -
      • Tidak melebihi 63 karakter
  3. Buat atau perbarui layanan menggunakan perintah berikut:

    gcloud run services replace service.yaml

Terraform

Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform.

Resource google_cloud_run_v2_serviceberikut menentukan jumlah maksimum instance 10 pada template.scaling. Ganti 10 dengan jumlah maksimum instance yang Anda perlukan.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-max-instances"
  location = "us-central1"

  deletion_protection = false # set to "true" in production

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    scaling {
      # Max instances
      max_instance_count = 10
    }
  }
}

Tampilkan setelan instance maksimum

Guna menampilkan setelan instance maksimum untuk layanan Cloud Run Anda saat ini:

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik layanan yang Anda minati untuk membuka halaman Detail layanan.

  3. Klik tab Revisi.

  4. Di sebelah kanan panel detail, setelan instance maksimum tercantum di bagian tab Container.

gcloud

  1. Gunakan perintah berikut:

    gcloud run services describe SERVICE
  2. Temukan setelan jumlah instance maksimum dalam konfigurasi yang ditampilkan.