Pelajari cara menentukan jumlah CPU yang akan dialokasikan untuk setiap CPU instance container penyaluran Knative. Secara {i>default<i}, Penyajian Knative tidak menentukan jumlah minimum atau maksimum CPU. Sebaliknya, layanan Anda dibatasi oleh jumlah resource yang tersedia. Pelajari resource CPU lebih lanjut di kontrak runtime container.
Menyetel dan mengupdate alokasi CPU
Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi selanjutnya juga akan otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.
Anda dapat menetapkan alokasi CPU menggunakan Konsol Google Cloud, Google Cloud CLI, atau file YAML saat Anda men-deploy service atau memperbarui layanan yang ada dan men-deploy revisi:
Konsol
Buka penyaluran Knative di Konsol Google Cloud:
Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang ada, klik layanan, lalu klik Edit & Deploy Revisi Baru.
Di bagian Setelan lanjutan, klik Penampung.
Pilih alokasi CPU yang diinginkan dari menu dropdown daftar. Anda dapat memilih nomor di Unit CPU Kubernetes. Misalnya, tentukan
1
untuk 1 CPU,400m
untuk 0,4 CPU, dan sebagainya dan seterusnya.Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Konfigurasi cara layanan ini dipicu, memilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.
Klik Create untuk men-deploy image ke inferensi Knative, lalu tunggu hingga deployment selesai.
Command line
Untuk layanan yang ada, setel jumlah CPU yang akan dialokasikan oleh menjalankan perintah
gcloud run services update
dengan--cpu
:gcloud run services update SERVICE --cpu CPU
Ganti:
- SERVICE dengan nama layanan Anda.
- CPU dengan alokasi CPU yang diinginkan. Tentukan
nilai di
Unit CPU Kubernetes.
Misalnya, tentukan
1
untuk 1 CPU,400m
untuk 0,4 CPU, dan seterusnya.
Untuk layanan baru, atur jumlah CPU yang akan dialokasikan dengan menjalankan perintah
gcloud run deploy
dengan--cpu
:gcloud run deploy SERVICE --image=IMAGE_URL --cpu CPU
Ganti:
- SERVICE dengan nama layanan Anda.
- IMAGE_URL dengan referensi ke image container,
misalnya,
gcr.io/cloudrun/hello
. - CPU dengan alokasi CPU yang diinginkan. Tentukan
nilai di
Unit CPU Kubernetes.
Misalnya, tentukan
1
untuk 1 CPU,400m
untuk 0,4 CPU, dan seterusnya.
YAML
Anda dapat mendownload konfigurasi layanan yang ada ke
YAML dengan perintah gcloud run services describe
menggunakan
Tanda --format=export
.
Anda kemudian dapat memodifikasi
file YAML itu dan men-deploy
perubahan tersebut dengan perintah gcloud run services replace
.
Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.
Download konfigurasi layanan Anda menjadi file bernama
service.yaml
pada ruang kerja lokal:gcloud run services describe SERVICE --format export > service.yaml
Ganti SERVICE dengan nama Anda Layanan penyaluran Knative.
Di file lokal Anda, perbarui atribut
cpu
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containers: - image: IMAGE resources: limits: cpu: CPU
Ganti
- SERVICE dengan nama layanan penayangan Knative Anda
- IMAGE dengan URL image container Anda.
- CPU dengan nilai CPU yang diinginkan.
Tentukan nilai di
Unit CPU Kubernetes.
Misalnya, tentukan
1
untuk 1 CPU,400m
untuk 0,4 CPU, dan seterusnya.
Ganti layanan dengan konfigurasi barunya menggunakan perintah berikut:
gcloud run services replace service.yaml