Halaman ini menjelaskan cara mengatur maksimum instance yang dapat digunakan untuk layanan Cloud Run Anda.
Menentukan instance maksimum di Cloud Run memungkinkan Anda membatasi penskalaan layanan sebagai respons terhadap permintaan masuk, meskipun setelan maksimum dapat terlampaui untuk jangka waktu yang singkat karena keadaan seperti lonjakan traffic.
Anda dapat menggunakan setelan ini sebagai salah satu cara untuk mengontrol biaya Anda atau untuk membatasi jumlah koneksi ke layanan pendukung seperti ke database.
Untuk informasi tentang batas maksimum instance yang mungkin diterapkan pada layanan Anda, baca Batas instance maksimum.
Untuk informasi selengkapnya tentang cara Cloud Run melakukan penskalaan otomatis pada instance container, baca Penskalaan otomatis instance.
Peran yang diperlukan
Untuk mendapatkan izin yang diperlukan guna mengonfigurasi dan men-deploy layanan Cloud Run, minta administrator untuk memberi Anda peran IAM berikut:
-
Cloud Run Developer (
roles/run.developer
) di layanan Cloud Run -
Service Account User (
roles/iam.serviceAccountUser
) di identitas layanan
Untuk mengetahui daftar peran dan izin IAM yang terkait dengan Cloud Run, lihat peran IAM Cloud Run dan izin IAM Cloud Run. Jika layanan Cloud Run Anda berinteraksi dengan Google Cloud API, seperti Library Klien Cloud, lihat panduan konfigurasi identitas layanan. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat izin deployment dan mengelola akses.
Menetapkan dan memperbarui instance maksimum
Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi berikutnya juga akan secara otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan update yang eksplisit untuk mengubahnya.
Secara default, layanan Cloud Run dikonfigurasi untuk melakukan penyebaran skala hingga maksimum 100 instance.
Anda dapat mengubah setelan instance maksimum menggunakan konsol Google Cloud, Google Cloud CLI, atau file YAML saat Anda membuat layanan baru atau men-deploy revisi baru.
Konsol
Di konsol Google Cloud, buka Cloud Run:
Klik Deploy container dan pilih Service untuk mengonfigurasi layanan baru. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan, lalu klik Edit dan deploy revisi baru.
Jika Anda mengonfigurasi layanan baru, isi halaman setelan layanan awal, lalu klik Container, volume, networking, security untuk memperluas halaman konfigurasi layanan.
Klik tab Container.
- Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum
instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari
1
hingga batas maksimum
- Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum
instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari
Klik Buat atau Deploy.
gcloud
Anda dapat memperbarui jumlah maksimum instance untuk layanan tertentu menggunakan perintah berikut:
gcloud run services update SERVICE --max-instances MAX-VALUE
Ganti
- SERVICE dengan nama layanan Anda dan
- MAX-VALUE dengan jumlah maksimum instance container yang Anda
inginkan, menggunakan nilai bilangan bulat apa pun dari
1
hingga batas maksimum. Tentukandefault
untuk menghapus setiap setelan maksimum instance dan memulihkan default 100 instance.
Anda juga dapat mengatur jumlah maksimum instance selama deployment menggunakan perintah:
gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE
Ganti
- IMAGE_URL dengan referensi ke image container
misalnya,
us-docker.pkg.dev/cloudrun/container/hello:latest
. Jika Anda menggunakan Artifact Registry, repositori REPO_NAME harus sudah dibuat. URL memiliki bentukLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MAX-VALUE dengan jumlah maksimum container instance yang diinginkan.
YAML
Jika Anda membuat layanan baru, lewati langkah ini. Jika Anda mengupdate layanan yang sudah ada, download konfigurasi YAML-nya:
gcloud run services describe SERVICE --format export > service.yaml
Perbarui atribut
autoscaling.knative.dev/maxScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
Ganti
- SERVICE dengan nama layanan Cloud Run Anda
- MAX-INSTANCE dengan jumlah maksimum yang diperlukan.
- REVISION dengan nama revisi baru atau hapus (jika ada). Jika Anda memberikan nama revisi baru, nama tersebut harus memenuhi kriteria berikut:
- Dimulai dengan
SERVICE-
- Hanya berisi huruf kecil, angka, dan
-
- Tidak diakhiri dengan
-
- Tidak melebihi 63 karakter
- Dimulai dengan
Buat atau perbarui layanan menggunakan perintah berikut:
gcloud run services replace service.yaml
Terraform
Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform.
Resource google_cloud_run_v2_service
berikut menentukan jumlah maksimum
instance 10
pada template.scaling
.
Ganti 10
dengan jumlah maksimum instance yang Anda perlukan.
Tampilkan setelan instance maksimum
Guna menampilkan setelan instance maksimum untuk layanan Cloud Run Anda saat ini:
Konsol
Di konsol Google Cloud, buka Cloud Run:
Klik layanan yang Anda minati untuk membuka halaman Detail layanan.
Klik tab Revisi.
Di sebelah kanan panel detail, setelan instance maksimum tercantum di bagian tab Container.
gcloud
Gunakan perintah berikut:
gcloud run services describe SERVICE
Temukan setelan jumlah instance maksimum dalam konfigurasi yang ditampilkan.