Mengonfigurasi alokasi CPU

Pelajari cara menentukan jumlah CPU yang akan dialokasikan untuk setiap instance container penayangan Knative. Secara default, penayangan Knative tidak menentukan jumlah CPU minimum atau maksimum. Sebagai gantinya, layanan Anda dibatasi oleh jumlah resource yang tersedia. Pelajari lebih lanjut resource CPU di kontrak runtime container.

Menetapkan dan memperbarui alokasi CPU

Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi selanjutnya juga akan otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.

Anda dapat menetapkan alokasi CPU menggunakan konsol Google Cloud, Google Cloud CLI, atau file YAML saat men-deploy layanan baru atau memperbarui layanan yang ada dan men-deploy revisi:

Konsol

  1. Buka penayangan Knative di konsol Google Cloud:

    Buka Inferensi Knative

  2. Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang sudah ada, klik layanan tersebut, lalu klik Edit & Deploy New Revision.

  3. Di bagian Setelan lanjutan, klik Penampung.

  4. Pilih alokasi CPU yang diinginkan dari daftar dropdown. Anda dapat memilih angka dalam unit CPU Kubernetes. Misalnya, tentukan 1 untuk 1 CPU, 400m untuk 0,4 CPU, dan sebagainya.

  5. Klik Berikutnya untuk melanjutkan ke bagian berikutnya.

  6. Di bagian Configure how this service is triggered, pilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.

  7. Klik Create untuk men-deploy image ke layanan Knative dan tunggu deployment selesai.

Command line

  • Untuk layanan yang ada, tetapkan jumlah CPU yang akan dialokasikan dengan menjalankan perintah gcloud run services update dengan parameter --cpu:

    gcloud run services update SERVICE --cpu CPU

    Ganti:

    • SERVICE dengan nama layanan Anda.
    • CPU dengan alokasi CPU yang diinginkan. Tentukan nilai dalam unit CPU Kubernetes. Misalnya, tentukan 1 untuk 1 CPU, 400m untuk 0,4 CPU, dan seterusnya.
  • Untuk layanan baru, tetapkan jumlah CPU yang akan dialokasikan dengan menjalankan perintah gcloud run deploy dengan parameter --cpu:

    gcloud run deploy SERVICE --image=IMAGE_URL --cpu CPU

    Ganti:

    • SERVICE dengan nama layanan Anda.
    • IMAGE_URL dengan referensi ke image container, misalnya, gcr.io/cloudrun/hello.
    • CPU dengan alokasi CPU yang diinginkan. Tentukan nilai dalam unit CPU Kubernetes. Misalnya, tentukan 1 untuk 1 CPU, 400m untuk 0,4 CPU, dan seterusnya.

YAML

Anda dapat mendownload konfigurasi layanan yang ada ke dalam file YAML dengan perintah gcloud run services describe menggunakan tanda --format=export. Kemudian, Anda dapat mengubah file YAML tersebut dan men-deploy perubahan tersebut dengan perintah gcloud run services replace. Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.

  1. Download konfigurasi layanan Anda ke file bernama service.yaml di ruang kerja lokal:

    gcloud run services describe SERVICE --format export > service.yaml

    Ganti SERVICE dengan nama layanan penayangan Knative Anda.

  2. Di file lokal, perbarui atribut cpu:

    apiVersion: serving.knative.dev/v1
    kind: Service
    metadata:
      name: SERVICE
    spec:
      template:
        spec:
          containers:
          - image: IMAGE
            resources:
              limits:
                cpu: CPU

    Ganti

    • SERVICE dengan nama layanan penayangan Knative Anda
    • IMAGE dengan URL image container Anda.
    • CPU dengan nilai CPU yang diinginkan. Tentukan nilai dalam unit CPU Kubernetes. Misalnya, tentukan 1 untuk 1 CPU, 400m untuk 0,4 CPU, dan seterusnya.
  3. Ganti layanan dengan konfigurasi barunya menggunakan perintah berikut:

    gcloud run services replace service.yaml