Halaman ini diterjemahkan oleh Cloud Translation API.

Error AI Generatif di Vertex AI inference API

Panduan ini memberikan daftar error yang mungkin Anda temui saat menggunakan Referensi API Model untuk AI Generatif. Error mengikuti model error Google Cloud API, yang merekomendasikan agar kami memberikan panduan tentang penyebab dan solusi khusus untuk model AI generatif.

Error API

Tabel ini menyediakan kode dan deskripsi error API.

Kode error HTTP	Kode error kanonis	Penyebab	Contoh	Solusi
400	`INVALID_ARGUMENT / FAILED_PRECONDITION`	Permintaan gagal divalidasi API, atau Anda mencoba mengakses model yang memerlukan izin masuk atau tidak diizinkan oleh kebijakan organisasi.	Permintaan melebihi batas token input model.	Lihat Referensi Model API untuk AI Generatif untuk mengetahui parameter permintaan, jumlah token, dan parameter lainnya.
403	`PERMISSION_DENIED`	Klien tidak memiliki izin yang memadai untuk memanggil API.	Akun layanan tidak memiliki izin untuk mengakses bucket Cloud Storage yang menghosting resource gambar atau video.	1. Pastikan semua API yang diperlukan diaktifkan, dan akun layanan memiliki izin yang tepat untuk mengakses layanan Vertex AI yang dipilih. 2. Akun layanan per-produk, per-project (P4SA) Vertex AI diberi izin yang diperlukan untuk mengakses resource yang dirujuk dalam input.
404	`NOT_FOUND`	Tidak ada objek valid yang ditemukan dari URL yang ditentukan.	File gambar tidak ditemukan di URL penyimpanan.	Periksa dan perbaiki lokasi file.
429	`RESOURCE_EXHAUSTED`	Bergantung pada pesan error, error dapat disebabkan oleh hal berikut: 1. Kuota API melebihi batas. 2. Server kelebihan beban karena kapasitas server bersama. 3. Anda telah mencapai batas harian untuk permintaan menggunakan `logprobs`.	Gemini API melampaui batas permintaan per menit.	1. Periksa batas kuota Vertex AI Generative AI. Jika perlu, ajukan permohonan untuk mendapatkan kuota yang lebih tinggi. 2. Coba lagi setelah beberapa detik. Jika error berlanjut setelah jangka waktu yang lama (berjam-jam), hubungi dukungan Vertex AI. 3. Pertimbangkan untuk membeli Throughput yang Disediakan.
499	`CANCELLED`	Permintaan dibatalkan oleh klien.
500	`UNKNOWN / INTERNAL`	Error server karena kelebihan beban atau kegagalan dependensi.	Permintaan dibatasi, karena layanan kelebihan beban untuk sementara.	Coba lagi setelah beberapa detik. Jika error berlanjut setelah jangka waktu yang lama (berjam-jam), hubungi dukungan Vertex AI.
503	`UNAVAILABLE`	Layanan tidak tersedia untuk sementara.	Server tidak merespons permintaan masuk.	Status tidak tersedia mungkin bersifat sementara. Namun, jika error tetap berlanjut, hubungi dukungan Vertex AI.
504	`DEADLINE_EXCEEDED`	Klien menetapkan batas waktu yang lebih singkat daripada batas waktu default server (10 menit), dan permintaan tidak selesai dalam batas waktu yang diberikan klien.	Pertimbangkan untuk memperpanjang batas waktu yang diberikan klien.

Menangani error

Hindari lonjakan traffic. Lonjakan adalah peningkatan jumlah permintaan yang tiba-tiba dan signifikan dalam jangka waktu yang sangat singkat. Terkadang, lonjakan traffic dapat menyebabkan masalah pada penegakan kuota dan meningkatkan kemungkinan server kelebihan beban.

Berhati-hatilah saat mencoba lagi peristiwa. Sebaiknya coba lagi maksimal dua kali. Penundaan minimum adalah satu detik dengan permintaan berikutnya yang dicadangkan secara eksponensial.

Langkah berikutnya

AI Generatif di Vertex AI memiliki beberapa keterbatasan. Untuk mempelajari lebih lanjut, lihat Keterbatasan PaLM API.
Coba tutorial panduan memulai menggunakan Vertex AI Studio atau Vertex AI API.
Pelajari model terlatih di Model Garden.
Pelajari kuota dan batas
Pelajari harga