Halaman ini menjelaskan cara mengatur maksimum instance yang dapat digunakan untuk layanan Cloud Run Anda. Menentukan instance maksimum di Cloud Run memungkinkan Anda untuk membatasi penskalaan layanan sebagai respons terhadap permintaan masuk, meskipun setelan maksimum dapat terlampaui untuk jangka waktu yang singkat karena keadaan seperti lonjakan traffic. Gunakan setelan ini sebagai salah satu cara untuk mengontrol biaya Anda atau untuk membatasi jumlah koneksi ke layanan cadangan seperti ke database.
Untuk informasi tentang batas maksimum instance yang mungkin diterapkan pada layanan Anda, baca Batas instance maksimum.
Untuk informasi selengkapnya tentang cara Cloud Run melakukan penskalaan otomatis pada instance container, baca Penskalaan otomatis instance.
Peran yang diperlukan
Untuk mendapatkan izin yang diperlukan untuk mengonfigurasi dan men-deploy layanan Cloud Run, minta administrator untuk memberi Anda peran IAM berikut:
-
Developer Cloud Run (
roles/run.developer
) di layanan Cloud Run -
Service Account User (
roles/iam.serviceAccountUser
) di identitas layanan
Untuk mengetahui daftar peran dan izin IAM yang terkait dengan Cloud Run, lihat peran IAM Cloud Run dan izin IAM Cloud Run. Jika antarmuka layanan Cloud Run Anda dengan Google Cloud API, seperti Library Klien Cloud, lihat panduan konfigurasi identitas layanan. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat izin deployment dan mengelola akses.
Mengatur dan memperbarui instance maksimum
Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi berikutnya juga akan secara otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan update yang eksplisit untuk mengubahnya.
Secara default, layanan Cloud Run dikonfigurasi untuk melakukan penyebaran skala hingga maksimum 100 instance.
Anda dapat mengubah setelan instance maksimum menggunakan konsol Google Cloud, command line gcloud, atau file YAML saat Anda membuat layanan baru atau men-deploy revisi baru.
Konsol
Di konsol Google Cloud, buka Cloud Run:
Klik Deploy container lalu pilih Service untuk mengonfigurasi layanan baru. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan, lalu klik Edit dan deploy revisi baru.
Jika Anda mengonfigurasi layanan baru, isi layanan awal halaman setelan, lalu klik Container, volume, networking, security untuk meluaskan konfigurasi layanan Google Cloud.
Klik tab Container.
- Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum
instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari
1
hingga batas maksimum
- Pada kolom berlabel Maximum number of instances, tentukan jumlah maksimum
instance yang diinginkan, menggunakan nilai bilangan bulat apa pun dari
Klik Buat atau Deploy.
gcloud
Anda dapat memperbarui jumlah maksimum instance untuk layanan tertentu menggunakan perintah berikut:
gcloud run services update SERVICE --max-instances MAX-VALUE
Ganti
- SERVICE dengan nama layanan Anda dan
- MAX-VALUE dengan jumlah maksimum instance container yang Anda
inginkan, menggunakan nilai bilangan bulat apa pun dari
1
hingga batas maksimum. Tentukandefault
untuk menghapus setiap setelan maksimum instance dan memulihkan default 100 instance.
Anda juga dapat mengatur jumlah maksimum instance selama deployment menggunakan perintah:
gcloud run deploy --image IMAGE_URL --max-instances MAX-VALUE
Ganti
- IMAGE_URL dengan referensi ke image container
misalnya,
us-docker.pkg.dev/cloudrun/container/hello:latest
. Jika Anda menggunakan Artifact Registry, repositori REPO_NAME harus sudah dibuat. URL memiliki bentukLOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
. - MAX-VALUE dengan jumlah maksimum container instance yang diinginkan.
YAML
Jika Anda membuat layanan baru, lewati langkah ini. Jika Anda mengupdate layanan yang sudah ada, download konfigurasi YAML:
gcloud run services describe SERVICE --format export > service.yaml
Perbarui atribut
autoscaling.knative.dev/maxScale:
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' name: REVISION
Ganti
- SERVICE dengan nama layanan Cloud Run Anda
- MAX-INSTANCE dengan jumlah maksimum yang diinginkan.
- REVISION dengan nama revisi baru atau hapus (jika ada). Jika Anda memberikan nama revisi baru, nama tersebut harus memenuhi kriteria berikut:
- Dimulai dengan
SERVICE-
- Hanya berisi huruf kecil, angka, dan
-
- Tidak diakhiri dengan
-
- Tidak melebihi 63 karakter
- Dimulai dengan
Buat atau update layanan menggunakan perintah berikut:
gcloud run services replace service.yaml
Terraform
Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform.
Resource google_cloud_run_v2_service
berikut menentukan jumlah maksimum
instance 10
pada template.scaling
.
Ganti 10
dengan jumlah maksimum instance yang Anda inginkan.
Batas instance maksimum
Secara default, layanan Cloud Run dikonfigurasi hingga maksimum 100 instance
Batas maksimum tergantung pada region layanan Cloud Run dan konfigurasi CPU serta memori Cloud Run.
Halaman kuota menampilkan dasar pengukuran kuota per-region.
Jumlah maksimum instance ditentukan sebagai jumlah minimum:
- dasar pengukuran kuota / permintaan kelipatan 1 CPU
- dasar pengukuran kuota / permintaan kelipatan 2GB memori
Misalnya, kuota dasar sebanyak 1000 instance dengan 4GB memori atau 2CPU sama-sama akan mendapat batas efektif sebanyak 500.
Jika Anda ingin menentukan jumlah maksimal instance yang lebih besar dari jumlah maksimum yang diizinkan di region layanan Cloud Run, Anda harus membuat permintaan penambahan kuota.
Tampilan setelan instance maksimum
Guna menampilkan setelan instance maksimum untuk layanan Cloud Run Anda saat ini:
Konsol
Di konsol Google Cloud, buka Cloud Run:
Klik layanan yang Anda minati untuk membuka Detail layanan kami.
Klik tab Revisi.
Di sebelah kanan panel detail, setelan instance maksimum tercantum di bagian tab Container.
gcloud
Gunakan perintah berikut:
gcloud run services describe SERVICE
Temukan setelan jumlah instance maksimum dalam konfigurasi yang ditampilkan.