Kuota dan batas model yang disesuaikan, penyematan teks, dan Vertex AI Agent Engine

Halaman ini menyediakan kuota model yang disesuaikan, batas penyematan teks, dan kuota Vertex AI Agent Engine.

Kuota model yang disesuaikan

Kuota berikut berlaku untuk AI Generatif pada model yang disesuaikan Vertex AI untuk project dan region tertentu:

Kuota Nilai
Core pod TPU V3 pelatihan gambar yang dibatasi per region
* Region yang didukung - europe-west4
64
GPU Nvidia A100 80 GB untuk pelatihan gambar yang dibatasi per region
* Region yang didukung - us-central1
* Region yang didukung - us-east4

8
2
* Skenario penyesuaian memiliki reservasi akselerator di region tertentu. Kuota untuk penyesuaian didukung dan harus diminta di wilayah tertentu.

Batas penyematan teks

Setiap permintaan model penyematan teks dapat memiliki hingga 250 teks input (menghasilkan 1 penyematan per teks input) dan 20.000 token per permintaan.

Hanya 8.192 token pertama di setiap teks input yang digunakan untuk menghitung penyematan. Setiap permintaan mungkin hanya menyertakan satu teks input.

Batas Vertex AI Agent Engine

Batas berikut berlaku untuk Vertex AI Agent Engine untuk project tertentu di setiap region.

Deskripsi Batas
Membuat/Menghapus/Memperbarui Mesin Agen Vertex AI per menit 10
Mesin Agen Vertex AI Query/StreamQuery per menit 60
Jumlah maksimum resource Vertex AI Agent Engine 100

Langkah berikutnya