Halaman ini menyediakan kuota model yang disesuaikan, batas penyematan teks, dan kuota Vertex AI Agent Engine.
Kuota model yang disesuaikan
Kuota berikut berlaku untuk AI Generatif pada model yang disesuaikan Vertex AI untuk project dan region tertentu:
Kuota | Nilai |
---|---|
Core pod TPU V3 pelatihan gambar yang dibatasi per region * Region yang didukung - europe-west4 |
64 |
GPU Nvidia A100 80 GB untuk pelatihan gambar yang dibatasi per region * Region yang didukung - us-central1 * Region yang didukung - us-east4 |
8 2 |
Batas penyematan teks
Setiap permintaan model penyematan teks dapat memiliki hingga 250 teks input (menghasilkan 1 penyematan per teks input) dan 20.000 token per permintaan.
Hanya 8.192 token pertama di setiap teks input yang digunakan untuk menghitung penyematan. Setiap permintaan mungkin hanya menyertakan satu teks input.
Batas Vertex AI Agent Engine
Batas berikut berlaku untuk Vertex AI Agent Engine untuk project tertentu di setiap region.
Deskripsi | Batas |
---|---|
Membuat/Menghapus/Memperbarui Mesin Agen Vertex AI per menit | 10 |
Mesin Agen Vertex AI Query/StreamQuery per menit | 60 |
Jumlah maksimum resource Vertex AI Agent Engine | 100 |
Langkah berikutnya
- Untuk mempelajari kuota dan batas untuk Vertex AI, lihat Kuota dan batas Vertex AI.
- Untuk mempelajari kuota dan batas Google Cloud lebih lanjut, lihat Memahami nilai kuota dan batas sistem.