Error AI Generatif di Vertex AI inference API

Panduan ini memberikan daftar error yang mungkin Anda temui saat menggunakan referensi Model API untuk AI Generatif. Error ini mengikuti model error Google Cloud API, yang merekomendasikan agar kita memberikan panduan tentang penyebab dan solusi khusus untuk model AI generatif.

Error API

Tabel ini memberikan kode dan deskripsi error API.

Kode error HTTP Kode error kanonis Penyebab Contoh Solusi
400 INVALID_ARGUMENT / FAILED_PRECONDITION Permintaan gagal dalam validasi API, atau Anda mencoba mengakses model yang memerlukan daftar yang diizinkan atau tidak diizinkan oleh kebijakan organisasi. Permintaan melebihi batas token input model. Lihat Referensi API model untuk AI Generatif untuk parameter permintaan, jumlah token, dan parameter lainnya.
403 PERMISSION_DENIED Klien tidak memiliki izin yang memadai untuk memanggil API. Akun layanan tidak memiliki izin untuk mengakses bucket Cloud Storage yang menghosting resource gambar atau video. 1. Pastikan semua API yang diperlukan diaktifkan, dan akun layanan memiliki izin yang tepat untuk mengakses layanan Vertex AI yang dipilih.

2. Akun layanan per produk, per project (P4SA) Vertex AI diberi izin yang diperlukan untuk mengakses resource yang dirujuk dalam input.
404 NOT_FOUND Tidak ada objek yang valid yang ditemukan dari URL yang ditetapkan. File gambar tidak ditemukan di URL penyimpanan. Periksa dan perbaiki lokasi file.
429 RESOURCE_EXHAUSTED Bergantung pada pesan error, error dapat disebabkan oleh hal berikut:

1. Kuota API melebihi batas.

2. Kelebihan beban server karena kapasitas server bersama.

3. Anda telah mencapai batas harian untuk permintaan yang menggunakan logprobs.
Gemini API melebihi batas permintaan per menit. 1. Periksa batas kuota AI Generatif Vertex AI. Jika perlu, minta kuota yang lebih tinggi.

2. Coba lagi setelah beberapa detik. Jika error terus berlanjut setelah jangka waktu yang lama (jam), hubungi dukungan Vertex AI.
499 CANCELLED Permintaan dibatalkan oleh klien.
500 UNKNOWN / INTERNAL Error server karena kelebihan beban atau kegagalan dependensi. Permintaan dibatasi, karena layanan kelebihan beban untuk sementara. Coba lagi setelah beberapa detik. Jika error terus berlanjut setelah jangka waktu yang lama (jam), hubungi dukungan Vertex AI.
503 UNAVAILABLE Layanan tidak tersedia untuk sementara. Server tidak merespons permintaan masuk. Status tidak tersedia mungkin bersifat sementara. Namun, jika error tetap berlanjut, hubungi dukungan Vertex AI.
504 DEADLINE_EXCEEDED Klien menetapkan batas waktu yang lebih singkat dari batas waktu default server (10 menit), dan permintaan tidak selesai dalam batas waktu yang diberikan klien. Pertimbangkan untuk meningkatkan batas waktu yang diberikan klien.

Menangani error

Hindari lonjakan traffic. Lonjakan adalah peningkatan jumlah permintaan secara tiba-tiba dan signifikan dalam waktu yang sangat singkat. Terkadang, lonjakan traffic dapat menyebabkan masalah penerapan kuota dan dapat meningkatkan kemungkinan server kelebihan beban.

Berhati-hatilah saat mencoba kembali peristiwa. Sebaiknya coba lagi tidak lebih dari dua kali. Penundaan minimum adalah satu detik dengan permintaan berikutnya yang mundur secara eksponensial.

Langkah berikutnya