Pelajari cara menetapkan jumlah maksimum instance container yang dapat digunakan untuk layanan penayangan Knative Anda. Menentukan instance maksimum di penayangan Knative memungkinkan Anda membatasi penskalaan layanan sebagai respons terhadap permintaan masuk. Gunakan setelan ini sebagai salah satu cara untuk mengontrol biaya Anda atau untuk membatasi jumlah koneksi ke layanan pendukung seperti ke database.
Untuk informasi selengkapnya tentang cara penayangan Knative melakukan penskalaan otomatis pada instance penampung, lihat Penskalaan otomatis instance.
Mengatur dan memperbarui instance maksimum
Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi selanjutnya juga akan otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.
Secara default, jumlah instance container dapat diskalakan tanpa batas. Anda dapat menetapkan batas atas untuk jumlah instance maksimum menggunakan konsol Google Cloud, atau Google Cloud CLI saat men-deploy layanan baru atau memperbarui layanan yang ada dan men-deploy revisi:
Konsol
Buka penayangan Knative di konsol Google Cloud:
Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan tersebut, lalu klik Edit & Deploy New Revision.
Di bagian Setelan lanjutan, klik Penampung.
Di kolom berlabel Maximum number of instances, tentukan jumlah maksimum instance container yang diinginkan.
Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Configure how this service is triggered, pilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.
Klik Create untuk men-deploy image ke layanan Knative dan tunggu deployment selesai.
Command line
Untuk layanan yang ada, tetapkan jumlah maksimum instance penampung dengan menjalankan perintah
gcloud run services update
dengan parameter--max-instances
:gcloud run services update SERVICE --max-instances MAX-VALUE
Ganti:
- SERVICE dengan nama layanan Anda.
- MAX-VALUE dengan jumlah maksimum instance penampung
yang diinginkan. Tentukan
default
untuk menghapus semua setelan instance maksimum.
Untuk layanan baru, tetapkan jumlah maksimum instance penampung dengan menjalankan perintah
gcloud run deploy
dengan parameter--max-instances
:gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE
Ganti:
- SERVICE dengan nama layanan Anda.
- IMAGE_URL dengan referensi ke image container,
misalnya,
gcr.io/cloudrun/hello
. - MAX-VALUE dengan jumlah maksimum instance penampung
yang diinginkan. Tentukan
default
untuk menghapus semua setelan instance maksimum.
YAML
Anda dapat mendownload konfigurasi layanan yang ada ke dalam
file YAML dengan perintah gcloud run services describe
menggunakan
tanda --format=export
.
Kemudian, Anda dapat mengubah file YAML tersebut dan men-deploy
perubahan tersebut dengan perintah gcloud run services replace
.
Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.
Download konfigurasi layanan Anda ke file bernama
service.yaml
di ruang kerja lokal:gcloud run services describe SERVICE --format export > service.yaml
Ganti SERVICE dengan nama layanan penayangan Knative Anda.
Dalam file lokal, perbarui atribut
autoscaling.knative.dev/maxScale:
:spec: template: metadata: annotations: autoscaling.knative.dev/maxScale: 'MAX-INSTANCE'
Ganti
- MAX-INSTANCE dengan jumlah maksimum yang diinginkan.
Ganti layanan dengan konfigurasi barunya menggunakan perintah berikut:
gcloud run services replace service.yaml