Pelajari cara mengatur waktu kapan respons untuk permintaan harus ditampilkan
oleh layanan inferensi Knative Anda. Jika respons tidak ditampilkan dalam
waktu yang ditentukan, permintaan berakhir dan error 504
ditampilkan.
Batas waktu tunggu
Batas waktu tunggu maksimum berbeda-beda berdasarkan versi Cluster GKE.
Versi GKE | Batas default | Batas waktu tunggu maksimum |
---|---|---|
0.16.0-gke.1 dan yang lebih baru | 300 detik | 24 jam |
0.15.0-gke.3 dan yang lebih lama | 300 detik | 900 detik |
Selain mengubah waktu tunggu permintaan penayangan Knative, Anda harus memeriksa framework bahasa Anda untuk melihat apakah framework tersebut memiliki permintaan sendiri yang juga harus Anda perbarui.
Menyetel dan memperbarui waktu tunggu permintaan
Setiap perubahan konfigurasi akan menghasilkan revisi baru. Revisi selanjutnya juga akan otomatis mendapatkan setelan konfigurasi ini, kecuali jika Anda melakukan pembaruan eksplisit untuk mengubahnya.
Anda dapat mengatur waktu tunggu permintaan menggunakan Konsol Google Cloud, Google Cloud CLI, atau file YAML saat Anda men-deploy service atau memperbarui layanan yang ada dan men-deploy revisi:
Konsol
Buka penyaluran Knative di Konsol Google Cloud:
Klik Buat Layanan jika Anda mengonfigurasi layanan baru yang akan di-deploy. Jika Anda mengonfigurasi layanan yang ada, klik layanan, lalu klik Edit & Deploy Revisi Baru.
Di bagian Setelan lanjutan, klik Penampung.
Di kolom Waktu tunggu permintaan, masukkan yang ingin Anda gunakan. Nilai yang Anda tetapkan harus lebih kecil dari batas waktu tunggu untuk GKE cluster .
Klik Berikutnya untuk melanjutkan ke bagian berikutnya.
Di bagian Konfigurasi cara layanan ini dipicu, memilih konektivitas yang ingin Anda gunakan untuk memanggil layanan.
Klik Create untuk men-deploy image ke inferensi Knative, lalu tunggu hingga deployment selesai.
Command line
Untuk layanan yang ada, atur batas waktu tunggu permintaan dengan menjalankan perintah
gcloud run services update
dengan--timeout
:gcloud run services update SERVICE --timeout TIMEOUT
Ganti:
- SERVICE dengan nama layanan Anda.
- TIMEOUT dengan waktu yang diinginkan, menggunakan bilangan bulat
nilai dalam detik, atau
nilai durasi absolut,
misalnya
1m20s
yaitu 1 menit, 20 detik. Nilai yang Anda harus lebih kecil dari batas waktu tunggu untuk versi GKE cluster. Tentukan0
untuk menyetel waktu tunggu ke nilai default.
Untuk layanan baru, setel waktu tunggu permintaan dengan menjalankan perintah
gcloud run deploy
dengan--timeout
:gcloud run deploy SERVICE --image=IMAGE_URL --timeout TIMEOUT
Ganti:
- SERVICE dengan nama layanan Anda.
- IMAGE_URL dengan referensi ke image container,
misalnya,
gcr.io/cloudrun/hello
. - TIMEOUT dengan waktu yang diinginkan, menggunakan bilangan bulat
nilai dalam detik, atau
nilai durasi absolut,
misalnya
1m20s
yaitu 1 menit, 20 detik. Nilai yang Anda harus lebih kecil dari batas waktu tunggu untuk versi GKE cluster. Tentukan0
untuk menyetel waktu tunggu ke nilai default.
YAML
Anda dapat mendownload konfigurasi layanan yang ada ke
YAML dengan perintah gcloud run services describe
menggunakan
Tanda --format=export
.
Anda kemudian dapat memodifikasi
file YAML itu dan men-deploy
perubahan tersebut dengan perintah gcloud run services replace
.
Anda harus memastikan bahwa Anda hanya mengubah atribut yang ditentukan.
Download konfigurasi layanan Anda menjadi file bernama
service.yaml
pada ruang kerja lokal:gcloud run services describe SERVICE --format export > service.yaml
Ganti SERVICE dengan nama Anda Layanan penyaluran Knative.
Di file lokal Anda, perbarui atribut
timeoutSeconds
:apiVersion: serving.knative.dev/v1 kind: Service metadata: name: SERVICE spec: template: spec: containers: - image: IMAGE timeoutSeconds: TIMEOUT
Ganti:
- SERVICE dengan nama layanan penayangan Knative Anda
- IMAGE_URL dengan referensi ke image container,
misalnya,
gcr.io/cloudrun/hello
. - TIMEOUT dengan waktu tunggu yang diinginkan, dalam satuan detik.
Ganti layanan dengan konfigurasi barunya menggunakan perintah berikut:
gcloud run services replace service.yaml