Panduan ini menyediakan daftar error yang mungkin Anda alami saat menggunakan Referensi Model API untuk AI Generatif. Error tersebut mengikuti model error Google Cloud API, yang merekomendasikan agar kami memberikan panduan tentang penyebab dan solusi khusus untuk model AI generatif.
Error API
Tabel ini menyajikan kode dan deskripsi error API.
Kode error HTTP | Kode error kanonis | Penyebab | Contoh | Solusi |
---|---|---|---|---|
400 | INVALID_ARGUMENT / FAILED_PRECONDITION |
Permintaan gagal dalam validasi API, atau Anda mencoba mengakses model yang memerlukan pemberian izin atau tidak diizinkan oleh kebijakan organisasi. | Permintaan melebihi batas token input model. | Lihat referensi Model API untuk AI Generatif guna mengetahui parameter permintaan, jumlah token, dan parameter lainnya. |
403 | PERMISSION_DENIED |
Klien tidak memiliki izin yang memadai untuk memanggil API. | Akun layanan tidak memiliki izin untuk mengakses bucket Cloud Storage yang menghosting resource gambar atau video. | 1. Pastikan semua API yang diperlukan telah diaktifkan, dan akun layanan memiliki izin yang tepat untuk mengakses layanan Vertex AI yang dipilih. 2. Akun layanan per produk dan per project (P4SA) Vertex AI diberi izin yang diperlukan untuk mengakses resource yang direferensikan dalam input. |
404 | NOT_FOUND |
Tidak ada objek valid yang ditemukan dari URL yang ditetapkan. | File gambar tidak ditemukan di URL penyimpanan. | Periksa dan perbaiki lokasi file. |
429 | RESOURCE_EXHAUSTED |
Bergantung pada pesan error-nya, error tersebut dapat disebabkan oleh hal berikut: 1. Kuota API melebihi batas. 2. Server kelebihan beban karena kapasitas server bersama. |
Gemini API melebihi batas permintaan per menit. | 1. Periksa batas kuota AI Generatif Vertex AI. Jika perlu, ajukan permintaan kuota yang lebih tinggi. 2. Coba lagi setelah beberapa detik. Jika error terus berlanjut setelah jangka waktu (jam) yang lama, hubungi dukungan Vertex AI. |
499 | CANCELLED |
Permintaan dibatalkan oleh klien. | ||
500 | UNKNOWN / INTERNAL |
Error server karena kelebihan beban atau kegagalan dependensi. | Permintaan dibatasi karena layanan untuk sementara kelebihan beban. | Coba lagi setelah beberapa detik. Jika error terus berlanjut setelah jangka waktu (jam) yang lama, hubungi dukungan Vertex AI. |
503 | UNAVAILABLE |
Layanan tidak tersedia untuk sementara. | Server tidak menanggapi permintaan masuk. | Status tidak tersedia mungkin bersifat sementara. Namun, jika error tetap berlanjut, hubungi dukungan Vertex AI. |
504 | DEADLINE_EXCEEDED |
Klien menetapkan batas waktu yang lebih singkat dari batas waktu default server (10 menit), dan permintaan tidak selesai dalam batas waktu yang diberikan klien. | Pertimbangkan untuk meningkatkan batas waktu yang diberikan klien. |
Menangani error
Hindari lonjakan traffic. Lonjakan adalah peningkatan jumlah permintaan secara tiba-tiba dan signifikan dalam waktu yang sangat singkat. Terkadang, lonjakan traffic dapat menyebabkan masalah penerapan kuota dan dapat meningkatkan kemungkinan kelebihan beban server.
Berhati-hatilah jika mencoba kembali sebuah peristiwa. Sebaiknya coba lagi tidak lebih dari dua kali. Penundaan minimum adalah satu detik dengan permintaan berikutnya dicadangkan secara eksponensial.
Langkah selanjutnya
- AI Generatif di Vertex AI memiliki beberapa keterbatasan. Untuk mempelajari lebih lanjut, lihat Keterbatasan PaLM API.
- Coba tutorial panduan memulai menggunakan Vertex AI Studio atau Vertex AI API.
- Pelajari model terlatih di Model Garden.
- Pelajari kuota dan batas
- Pelajari pricing