Menetapkan maksimum permintaan serentak per instance (layanan)

Untuk memahami setelan permintaan serentak maksimum per instance, baca dokumen konsep.

Peran yang diperlukan

Untuk mendapatkan izin yang Anda perlukan untuk mengonfigurasi dan men-deploy layanan Cloud Run, minta administrator untuk memberi Anda peran IAM berikut:

Untuk daftar peran dan izin IAM yang terkait dengan Cloud Run, lihat Peran IAM Cloud Run dan izin IAM Cloud Run. Jika layanan Cloud Run Anda berinteraksi dengan Google Cloud API, seperti Library Klien Cloud, lihat panduan konfigurasi identitas layanan. Untuk mengetahui informasi selengkapnya tentang memberikan peran, lihat izin deployment dan mengelola akses.

Mengonfigurasi permintaan serentak maksimum per instance

Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi berikutnya juga otomatis akan mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.

Untuk layanan Cloud Run, Anda dapat menetapkan permintaan serentak maksimum per instance menggunakan konsol Google Cloud, command line gcloud, atau file .yaml saat Anda membuat layanan baru atau men-deploy revisi baru:

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang ada, klik layanan, lalu klik Edit and deploy new revision.

  3. Jika Anda mengonfigurasi layanan baru, isi halaman setelan layanan awal sesuai keinginan, kemudian klik Container, vo;ume, jejaring, sekuritas untuk memperluas halaman konfigurasi layanan.

  4. Klik tab Container.

    gambar

    • Tetapkan nilai permintaan serentak maksimum per instance yang diinginkan dalam kotak teks Permintaan maksimum per container.
  5. Klik Buat atau Deploy.

Command line

Untuk menetapkan permintaan serentak maksimum per instance, gunakan perintah berikut:

gcloud run services update SERVICE --concurrency CONCURRENCY

Ganti

  • SERVICE dengan nama layanan Anda.
  • CONCURRENCY dengan jumlah maksimum permintaan serentak per instance. Misalnya, perintah berikut menetapkan jumlah maksimum sebesar 1 permintaan serentak:

    gcloud run services update SERVICE --concurrency 1

Jika jumlah permintaan serentak maksimum per instance dari layanan tertentu diubah, setelan ini akan disertakan di revisi baru.

Untuk mengembalikan permintaan serentak maksimum per instance ke default (80), gunakan perintah berikut

gcloud run services update SERVICE --concurrency default

Ganti SERVICE dengan nama layanan yang Anda konfigurasi.

YAML

  1. Jika Anda membuat layanan baru, lewati langkah ini. Jika Anda mengupdate layanan yang ada, download konfigurasi YAML:

    gcloud run services describe SERVICE --format export > service.yaml
  2. Perbarui containerConcurrency atribut:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        metadata:
          name: REVISION
        spec:
          containerConcurrency: CONCURRENCY

    Ganti

    • SERVICE dengan nama layanan Cloud Run Anda
    • IMAGE_URL dengan referensi ke image container, misalnya, us-docker.pkg.dev/cloudrun/container/hello:latest. Jika Anda menggunakan Artifact Registry, repositori REPO_NAME harus sudah dibuat. URL berbentuk LOCATION-docker.pkg.dev/PROJECT_ID/REPO_NAME/PATH:TAG
    • CONCURRENCY dengan jumlah maksimum permintaan serentak per instance.
    • REVISION dengan nama revisi baru atau hapus (jika ada). Jika Anda memberikan nama revisi baru, nama tersebut harus memenuhi kriteria berikut:
      • Dimulai denganSERVICE-
      • Hanya berisi huruf kecil, angka, dan -
      • Tidak diakhiri dengan -
      • Tidak melebihi 63 karakter
  3. Buat atau update layanan menggunakan perintah berikut:

    gcloud run services replace service.yaml

Terraform

Untuk mempelajari cara menerapkan atau menghapus konfigurasi Terraform, lihat Perintah dasar Terraform.

Tambahkan kode google_cloud_run_v2_service berikut ke resource di konfigurasi Terraform Anda, pada template. Ganti 80 dengan jumlah maksimum permintaan serentak yang Anda inginkan.

resource "google_cloud_run_v2_service" "default" {
  name     = "cloudrun-service-concurrency"
  location = "us-central1"

  template {
    containers {
      image = "us-docker.pkg.dev/cloudrun/container/hello"
    }
    # Maximum concurrent requests
    max_instance_request_concurrency = 80
  }
}

Lihat setelan konkurensi

Untuk melihat setelan konkurensi Anda saat ini di layanan Cloud Run Anda:

Konsol

  1. Di konsol Google Cloud, buka Cloud Run:

    Buka Cloud Run

  2. Klik layanan yang Anda minati untuk membuka halaman Detail layanan.

  3. Klik tab Revisi.

  4. Pada panel detail di sebelah kanan, setelan konkurensi terletak di bawah tab Container.

Command line

  1. Gunakan perintah berikut:

    gcloud run services describe SERVICE
  2. Temukan setelan konkurensi dalam konfigurasi yang ditampilkan.