Menetapkan jumlah maksimum instance container

Pelajari cara menetapkan jumlah maksimum instance container yang dapat digunakan untuk layanan penyaluran Knative Anda. Menentukan {i>instance<i} maksimum di Penyajian Knative memungkinkan Anda untuk membatasi penskalaan respons terhadap permintaan yang masuk. Gunakan setelan ini sebagai cara untuk mengontrol biaya Anda atau untuk membatasi jumlah koneksi ke layanan pendukung, seperti ke di skrip untuk menyiapkan database.

Untuk mengetahui informasi selengkapnya tentang cara Knative melakukan penskalaan otomatis untuk instance container, lihat Penskalaan otomatis instance.

Mengatur dan memperbarui instance maksimum

Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi selanjutnya juga akan otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.

Secara default, jumlah instance container dapat diskalakan tanpa batas. Anda dapat mengatur batas atas untuk jumlah instance maksimum yang menggunakan Konsol Google Cloud, atau Google Cloud CLI saat Anda men-deploy service atau memperbarui layanan yang ada dan men-deploy revisi:

Konsol

  1. Buka penyaluran Knative di Konsol Google Cloud:

    Buka penayangan Knative

  2. Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang ada, klik layanan, lalu klik Edit & Deploy Revisi Baru.

  3. Di bagian Setelan lanjutan, klik Penampung.

  4. Di kolom berlabel Jumlah maksimum instance, tentukan jumlah maksimum container yang diinginkan. instance Compute Engine.

  5. Klik Berikutnya untuk melanjutkan ke bagian berikutnya.

  6. Di bagian Konfigurasi cara layanan ini dipicu, memilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.

  7. Klik Create untuk men-deploy image ke inferensi Knative, lalu tunggu hingga deployment selesai.

Command line

  • Untuk layanan yang ada, tetapkan jumlah maksimum instance container dengan menjalankan perintah gcloud run services update dengan --max-instances :

    gcloud run services update SERVICE --max-instances MAX-VALUE
    

    Ganti:

    • SERVICE dengan nama layanan Anda.
    • MAX-VALUE dengan jumlah maksimum instance container secara otomatis. Tentukan default untuk menghapus instance maksimum deskripsi tempat.
  • Untuk layanan baru, tetapkan jumlah maksimum instance container dengan menjalankan perintah gcloud run deploy dengan --max-instances :

    gcloud run deploy SERVICE --image=IMAGE_URL --max-instances MAX-VALUE
    

    Ganti:

    • SERVICE dengan nama layanan Anda.
    • IMAGE_URL dengan referensi ke image container, misalnya, gcr.io/cloudrun/hello.
    • MAX-VALUE dengan jumlah maksimum instance container secara otomatis. Tentukan default untuk menghapus instance maksimum deskripsi tempat.

YAML

Anda dapat mendownload konfigurasi layanan yang ada ke YAML dengan perintah gcloud run services describe menggunakan Tanda --format=export. Anda kemudian dapat memodifikasi file YAML itu dan men-deploy perubahan tersebut dengan perintah gcloud run services replace. Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.

  1. Download konfigurasi layanan Anda menjadi file bernama service.yaml pada ruang kerja lokal:

    gcloud run services describe SERVICE --format export > service.yaml

    Ganti SERVICE dengan nama Anda Layanan penyaluran Knative.

  2. Di file lokal Anda, perbarui autoscaling.knative.dev/maxScale: :

    spec:
     template:
       metadata:
         annotations:
           autoscaling.knative.dev/maxScale: 'MAX-INSTANCE' 

    Ganti

    • MAX-INSTANCE dengan jumlah maksimum yang diinginkan.
  3. Ganti layanan dengan konfigurasi barunya menggunakan perintah berikut:

    gcloud run services replace service.yaml