Kuota dan batas

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Vertex AI Agent Builder.

  • Kuota menentukan jumlah resource bersama yang dapat dihitung dan dapat Anda gunakan. Kuota ditentukan oleh Google Cloud layanan seperti Vertex AI Agent Builder.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah Google Cloud resource yang dapat digunakan Google Cloud project Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas penggunaGoogle Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud Anda sendiri.

Sistem Kuota Cloud melakukan hal berikut:

  • Memantau pemakaian Google Cloud produk dan layanan Anda
  • Membatasi pemakaian resource tersebut
  • Memberikan cara untuk meminta perubahan pada nilai kuota

Pada umumnya, saat Anda mencoba menggunakan resource lebih dari kuota yang diizinkan, sistem akan memblokir akses ke resource, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level project Google Cloud. Penggunaan resource di satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud, kuota dibagikan ke semua aplikasi dan alamat IP.

Ada juga batas sistem pada resource Vertex AI Agent Builder. Batas sistem tidak dapat diubah.

Kuota alokasi

Kuota berikut tidak dimuat ulang seiring waktu dan akan dilepaskan saat Anda merilis resource. Anda dapat meminta penambahan kuota jika kuota default tidak cukup.

Kuota Nilai
Jumlah dokumen per project 1.000.000
Jumlah penyimpanan data per project 100*
Jumlah mesin per project 100
Jumlah operasi impor yang berjalan lama yang tertunda per project 300
Jumlah operasi jangka panjang dokumen penghapusan yang tertunda per project 100
Jumlah kontrol penayangan per project 1.000
Jumlah kontrol penayangan boost per konfigurasi penayangan 100
Jumlah kontrol penayangan filter per konfigurasi penayangan 100
Jumlah kontrol penayangan pengalihan per konfigurasi penayangan 100
Jumlah kontrol penayangan sinonim per konfigurasi penayangan 100
Jumlah peristiwa pengguna per project 40.000.000.000

* Karena keterbatasan teknis, kuota maksimum untuk penyimpanan data adalah 500 per project. Jika Anda memerlukan lebih banyak penyimpanan data, gunakan project baru.

Karena keterbatasan teknis, kuota maksimum untuk mesin adalah 500 per project. Jika Anda memerlukan lebih banyak mesin, gunakan project baru.

Meminta kuota

Kuota berikut berlaku untuk permintaan Vertex AI Agent Builder API. Anda dapat meminta penambahan kuota jika kuota default tidak cukup.

Kuota Nilai
Menyelesaikan permintaan kueri per menit per project 300
Permintaan baca penelusuran percakapan per menit per project 300
Permintaan tulis penelusuran percakapan per menit per project 300
Permintaan batch dokumen (seperti impor dan penghapusan inline) per menit per project 100
Mendokumentasikan permintaan impor asinkron (Cloud Storage, BigQuery, dll.) per menit per project 5
Permintaan penghapusan dokumen per menit per project 100
Mendokumentasikan permintaan baca per menit per project 300
Permintaan tulis dokumen per menit per project 12.000
Permintaan pembuatan evaluasi per hari per project 5
Permintaan baca evaluasi per menit per project 100
Permintaan tulis evaluasi per menit per project 100
Permintaan kueri LLM (ringkasan penelusuran, penelusuran multi-giliran) per menit per project 60
Jumlah penulisan streaming FHIR atau BigQuery yang tertunda per menit 6.000
Jumlah set kueri contoh per project 100
Permintaan API peringkat per menit per project 500
Permintaan rekomendasi per menit per project 60.000
Contoh permintaan baca kueri per menit per project 200
Contoh permintaan baca set kueri per menit per project 100
Contoh permintaan tulis set kueri per menit per project 100
Contoh permintaan tulis kueri per menit per project 200
Permintaan baca skema per menit per project 100
Permintaan tulis skema per menit per project 100
Permintaan penelusuran per menit per project 300
Permintaan batch peristiwa pengguna (seperti impor dan penghapusan) per menit per project 100
Permintaan pengumpulan peristiwa pengguna per menit per project per pengguna 240
Permintaan tulis peristiwa pengguna per menit per project 60.000

Kuota untuk pengindeksan halaman web

Jika Anda memiliki penyimpanan data dengan Pengindeksan situs lanjutan diaktifkan, setiap halaman web yang Anda indekskan akan diperhitungkan dalam kuota "Jumlah dokumen per project" dalam daftar Kuota alokasi. Anda juga dapat melihat jumlah halaman dalam project dan kuota halaman untuk project tersebut di kolom Project pages vs quota di halaman Data untuk penyimpanan data.

Jika Anda menambahkan situs ke penyimpanan data dalam project dan halaman web di situs tersebut menyebabkan kuota untuk project terlampaui, situs tersebut tidak akan diindeks. Jika Anda memiliki situs di penyimpanan data yang sudah diindeks, situs tersebut akan terus diindeks seperti sebelumnya. Anda dapat meminta untuk mengupgrade kuota kapan saja.

Meminta penambahan kuota

Untuk menyesuaikan sebagian besar kuota, gunakan Konsol Google Cloud. Untuk informasi selengkapnya, lihat Meminta penyesuaian kuota.