Halaman ini menjelaskan cara menetapkan jumlah maksimum instance yang dapat digunakan untuk layanan Cloud Run Anda menggunakan perilaku penskalaan otomatis Cloud Run default. Jika menggunakan penskalaan manual, Anda juga harus membaca dokumentasi untuk penskalaan manual guna mendapatkan informasi tentang cara kerja setelan penagihan ini dengan layanan yang diskalakan secara manual.
Menentukan instance maksimum di Cloud Run memungkinkan Anda membatasi penskalaan layanan sebagai respons terhadap permintaan masuk, meskipun setelan maksimum dapat terlampaui untuk jangka waktu yang singkat karena keadaan seperti lonjakan traffic.
Anda dapat menggunakan setelan ini sebagai salah satu cara untuk mengontrol biaya Anda atau untuk membatasi jumlah koneksi ke layanan pendukung seperti ke database.
Untuk informasi tentang batas maksimum instance yang mungkin diterapkan pada layanan Anda, baca Batas instance maksimum.
Untuk informasi selengkapnya tentang cara Cloud Run melakukan penskalaan otomatis pada instance container, baca Penskalaan otomatis instance.
Peran yang diperlukan
Untuk mendapatkan izin yang Anda perlukan untuk mengonfigurasi dan men-deploy layanan Cloud Run, minta administrator untuk memberi Anda peran IAM berikut:
-
Cloud Run Developer (
roles/run.developer
) di layanan Cloud Run -
Service Account User (
roles/iam.serviceAccountUser
) di identitas layanan
Untuk mengetahui daftar peran dan izin IAM yang terkait dengan Cloud Run, lihat Peran IAM Cloud Run dan Izin IAM Cloud Run. Jika layanan Cloud Run Anda berinteraksi dengan Google Cloud API, seperti Library Klien Cloud, lihat panduan konfigurasi identitas layanan. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat izin deployment dan mengelola akses.
Menetapkan dan memperbarui instance maksimum
Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi berikutnya juga akan secara otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan update yang eksplisit untuk mengubahnya.
Secara default, layanan Cloud Run dikonfigurasi untuk melakukan penyebaran skala hingga maksimum 100 instance.
Anda dapat mengubah setelan instance maksimum menggunakan konsol Google Cloud, Google Cloud CLI, atau file YAML saat Anda membuat layanan baru atau men-deploy revisi baru.
Di konsol Google Cloud , buka Cloud Run:
Klik Deploy container dan pilih Service untuk mengonfigurasi layanan baru. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan, lalu klik Edit dan deploy revisi baru.
Jika Anda mengonfigurasi layanan baru, isi halaman setelan layanan awal, lalu klik Container, volume, networking, security untuk memperluas halaman konfigurasi layanan.
Klik tab Container.
- Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum
instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari
1
hingga batas maksimum.
- Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum
instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari
Klik Buat atau Deploy.
Anda dapat memperbarui jumlah maksimum instance untuk layanan tertentu menggunakan perintah berikut:
gcloud run services updateSERVICE --max-instancesMAX-VALUE
Ganti
- SERVICE dengan nama layanan Anda dan
- MAX-VALUE dengan jumlah maksimum instance container yang Anda
inginkan, menggunakan nilai bilangan bulat apa pun dari
1
hingga batas maksimum. Tentukandefault
untuk menghapus setiap setelan maksimum instance dan memulihkan default 100 instance.
Anda juga dapat mengatur jumlah maksimum instance selama deployment menggunakan perintah:
gcloud run deploy --imageIMAGE_URL --max-instancesMAX-VALUE
Ganti
- IMAGE_URL dengan referensi ke image container
misalnya,
us-docker.pkg.dev/cloudrun/container/hello:latest
. Jika Anda menggunakan Artifact Registry, repositori REPO_NAME harus sudah dibuat. URL memiliki bentukLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MAX-VALUE dengan jumlah maksimum container instance yang diinginkan.
Jika Anda membuat layanan baru, lewati langkah ini. Jika Anda mengupdate layanan yang sudah ada, download konfigurasi YAML-nya:
gcloud run services describe
SERVICE --format export > service.yamlPerbarui atribut
autoscaling.knative.dev/maxScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name:
SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE ' name:REVISION Ganti
- SERVICE dengan nama layanan Cloud Run Anda
- MAX-INSTANCE dengan jumlah maksimum yang diperlukan.
- REVISION dengan nama revisi baru atau hapus (jika ada). Jika Anda memberikan nama revisi baru, nama tersebut harus memenuhi kriteria berikut:
- Dimulai dengan
SERVICE-
- Hanya berisi huruf kecil, angka, dan
-
- Tidak diakhiri dengan
-
- Tidak melebihi 63 karakter
- Dimulai dengan
Buat atau perbarui layanan menggunakan perintah berikut:
gcloud run services replace service.yaml
Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform.
Resource google_cloud_run_v2_service
berikut menentukan jumlah maksimum
instance 10
pada template.scaling
.
Ganti 10
dengan jumlah maksimum instance yang Anda perlukan.
Tampilkan setelan instance maksimum
Guna menampilkan setelan instance maksimum untuk layanan Cloud Run Anda saat ini:
Di konsol Google Cloud , buka Cloud Run:
Klik layanan yang Anda minati untuk membuka halaman Detail layanan.
Klik tab Revisi.
Di sebelah kanan panel detail, setelan instance maksimum tercantum di bagian tab Container.
Gunakan perintah berikut:
gcloud run services describe
SERVICE Temukan setelan jumlah instance maksimum dalam konfigurasi yang ditampilkan.