Error AI Generatif pada Vertex AI inferensi API

Panduan ini menyediakan daftar error yang mungkin Anda alami saat menggunakan Referensi Model API untuk AI Generatif. Error tersebut mengikuti model error Google Cloud API, yang merekomendasikan agar kami memberikan panduan tentang penyebab dan solusi khusus untuk model AI generatif.

Error API

Tabel ini menyajikan kode dan deskripsi error API.

Kode error HTTP Kode error kanonis Penyebab Contoh Solusi
400 INVALID_ARGUMENT / FAILED_PRECONDITION Permintaan gagal dalam validasi API, atau Anda mencoba mengakses model yang memerlukan pemberian izin atau tidak diizinkan oleh kebijakan organisasi. Permintaan melebihi batas token input model. Lihat referensi Model API untuk AI Generatif guna mengetahui parameter permintaan, jumlah token, dan parameter lainnya.
403 PERMISSION_DENIED Klien tidak memiliki izin yang memadai untuk memanggil API. Akun layanan tidak memiliki izin untuk mengakses bucket Cloud Storage yang menghosting resource gambar atau video. 1. Pastikan semua API yang diperlukan telah diaktifkan, dan akun layanan memiliki izin yang tepat untuk mengakses layanan Vertex AI yang dipilih.

2. Akun layanan per produk dan per project (P4SA) Vertex AI diberi izin yang diperlukan untuk mengakses resource yang direferensikan dalam input.
404 NOT_FOUND Tidak ada objek valid yang ditemukan dari URL yang ditetapkan. File gambar tidak ditemukan di URL penyimpanan. Periksa dan perbaiki lokasi file.
429 RESOURCE_EXHAUSTED Bergantung pada pesan error-nya, error tersebut dapat disebabkan oleh hal berikut:

1. Kuota API melebihi batas.

2. Server kelebihan beban karena kapasitas server bersama.
Gemini API melebihi batas permintaan per menit. 1. Periksa batas kuota AI Generatif Vertex AI. Jika perlu, ajukan permintaan kuota yang lebih tinggi.

2. Coba lagi setelah beberapa detik. Jika error terus berlanjut setelah jangka waktu (jam) yang lama, hubungi dukungan Vertex AI.
499 CANCELLED Permintaan dibatalkan oleh klien.
500 UNKNOWN / INTERNAL Error server karena kelebihan beban atau kegagalan dependensi. Permintaan dibatasi karena layanan untuk sementara kelebihan beban. Coba lagi setelah beberapa detik. Jika error terus berlanjut setelah jangka waktu (jam) yang lama, hubungi dukungan Vertex AI.
503 UNAVAILABLE Layanan tidak tersedia untuk sementara. Server tidak menanggapi permintaan masuk. Status tidak tersedia mungkin bersifat sementara. Namun, jika error tetap berlanjut, hubungi dukungan Vertex AI.
504 DEADLINE_EXCEEDED Klien menetapkan batas waktu yang lebih singkat dari batas waktu default server (10 menit), dan permintaan tidak selesai dalam batas waktu yang diberikan klien. Pertimbangkan untuk meningkatkan batas waktu yang diberikan klien.

Menangani error

Hindari lonjakan traffic. Lonjakan adalah peningkatan jumlah permintaan secara tiba-tiba dan signifikan dalam waktu yang sangat singkat. Terkadang, lonjakan traffic dapat menyebabkan masalah penerapan kuota dan dapat meningkatkan kemungkinan kelebihan beban server.

Berhati-hatilah jika mencoba kembali sebuah peristiwa. Sebaiknya coba lagi tidak lebih dari dua kali. Penundaan minimum adalah satu detik dengan permintaan berikutnya dicadangkan secara eksponensial.

Langkah selanjutnya