Diagram berikut menunjukkan model resource penyaluran Knative:
Diagram menunjukkan project Google Cloud yang berisi dua inferensi Knative
layanan, Service A
dan Service B
, yang masing-masing memiliki beberapa revisi.
Pada diagram, Service A
menerima banyak permintaan, yang menghasilkan
dan menjalankan beberapa instance container. Perhatikan bahwa Service B
adalah
saat ini tidak menerima permintaan, jadi belum ada instance container yang dimulai.
Layanan penyaluran Knative
Layanan ini adalah resource utama penyaluran Knative. Setiap layanan berada di namespace cluster GKE tertentu.
Project Google Cloud dapat menjalankan banyak layanan di berbagai region atau Cluster GKE.
Setiap layanan mengekspos endpoint unik dan secara otomatis menskalakan infrastruktur yang mendasarinya untuk menangani permintaan masuk.
Revisi inferensi Knative
Setiap deployment ke layanan membuat revisi. Sebuah revisi terdiri dari image container tertentu, beserta setelan lingkungan seperti lingkungan variabel, batas memori, atau nilai konkurensi.
Revisi tidak dapat diubah: setelah revisi dibuat, revisi tidak dapat dimodifikasi. Misalnya, saat Anda men-deploy image container ke Layanan penyaluran Knative, revisi pertama dibuat. Jika kemudian Anda men-deploy image container yang berbeda ke layanan yang sama, revisi kedua akan dibuat. Jika selanjutnya Anda menetapkan variabel lingkungan, revisi ketiga akan dibuat, dan seterusnya .
Permintaan akan diarahkan secara otomatis sesegera mungkin ke revisi layanan responsif terbaru. Anda dapat traffic terpisah di antara revisi yang berbeda sesuai keinginan.
Instance penampung penayangan Knative
Setiap permintaan revisi yang diterima secara otomatis diskalakan ke jumlah instance container yang diperlukan untuk menangani semua permintaan ini. Perhatikan bahwa container instance dapat menerima banyak permintaan sekaligus. Dengan setelan konkurensi, Anda dapat menetapkan jumlah permintaan maksimum yang dapat dikirim secara paralel ke penampung tertentu di instance Compute Engine.