Menetapkan maksimum permintaan serentak per instance (layanan)

Untuk memahami setelan permintaan serentak maksimum per instance, baca dokumen konsep.

Peran yang diperlukan

Untuk mendapatkan izin yang diperlukan untuk mengonfigurasi dan men-deploy layanan Cloud Run, minta administrator untuk memberi Anda peran IAM berikut:

Untuk mengetahui daftar peran dan izin IAM yang terkait dengan Cloud Run, lihat Peran IAM Cloud Run dan Izin IAM Cloud Run. Jika antarmuka layanan Cloud Run Anda dengan Google Cloud API, seperti Library Klien Cloud, lihat panduan konfigurasi identitas layanan. Untuk mengetahui informasi selengkapnya tentang cara memberikan peran, lihat izin deployment dan mengelola akses.

Mengonfigurasi permintaan serentak maksimum per instance

Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi berikutnya juga otomatis akan mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.

Untuk layanan Cloud Run, Anda dapat menetapkan permintaan serentak maksimum per instance menggunakan konsol Google Cloud, command line gcloud, atau file .yaml saat Anda membuat layanan baru atau men-deploy revisi baru:

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik Deploy container lalu pilih Service untuk mengonfigurasi layanan baru. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan, lalu klik Edit dan deploy revisi baru.

  3. Jika Anda mengonfigurasi layanan baru, isi layanan awal halaman setelan, lalu klik Container, volume, networking, security untuk meluaskan konfigurasi layanan Google Cloud.

  4. Klik tab Container.

    gambar

    • Tetapkan nilai permintaan serentak maksimum per instance yang diinginkan dalam kotak teks Permintaan maksimum per container.
  5. Klik Buat atau Deploy.

gcloud

Untuk menetapkan permintaan serentak maksimum per instance, gunakan perintah berikut:

gcloud run services update SERVICE --concurrency CONCURRENCY

Ganti

  • SERVICE dengan nama layanan Anda.
  • CONCURRENCY dengan jumlah maksimum permintaan serentak per instance. Misalnya, perintah berikut menetapkan jumlah maksimum sebesar 1 permintaan serentak:

    gcloud run services update SERVICE --concurrency 1

Jika jumlah permintaan serentak maksimum per instance dari layanan tertentu diubah, setelan ini akan disertakan di revisi baru.

Untuk mengembalikan permintaan serentak maksimum per instance ke default (80), gunakan perintah berikut

gcloud run services update SERVICE --concurrency default

Ganti SERVICE dengan nama layanan yang Anda konfigurasi.

YAML

  1. Jika Anda membuat layanan baru, lewati langkah ini. Jika Anda mengupdate layanan yang sudah ada, download konfigurasi YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Perbarui atribut containerConcurrency:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containerConcurrency: CONCURRENCY

    Ganti

    • SERVICE dengan nama layanan Cloud Run Anda
    • IMAGE_URL dengan referensi ke image container, misalnya, us-docker.pkg.dev/cloudrun/container/hello:latest. Jika Anda menggunakan Artifact Registry, repositori REPO_NAME harus sudah dibuat. URL berbentuk LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
    • CONCURRENCY dengan jumlah maksimum permintaan serentak per instance.
    • REVISION dengan nama revisi baru atau hapus (jika ada). Jika Anda memberikan nama revisi baru, nama tersebut harus memenuhi kriteria berikut:
      • Dimulai denganSERVICE-
      • Hanya berisi huruf kecil, angka, dan -
      • Tidak diakhiri dengan -
      • Tidak melebihi 63 karakter
  3. Buat atau update layanan menggunakan perintah berikut:

    gcloud run services replace service.yaml

Terraform

Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform.

Tambahkan kode google_cloud_run_v2_service berikut ke resource di konfigurasi Terraform Anda, pada template. Ganti 80 dengan jumlah maksimum permintaan serentak yang Anda inginkan.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-concurrency"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    # Maximum concurrent requests
    max_instance_request_concurrency = 80
  }
}

Lihat setelan konkurensi

Untuk melihat setelan konkurensi Anda saat ini di layanan Cloud Run Anda:

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik layanan yang Anda minati untuk membuka Detail layanan kami.

  3. Klik tab Revisi.

  4. Pada panel detail di sebelah kanan, setelan konkurensi terletak di bawah tab Container.

gcloud

  1. Gunakan perintah berikut:

    gcloud run services describe SERVICE
  2. Temukan setelan konkurensi dalam konfigurasi yang ditampilkan.