Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Vertex AI Agent Builder. Kuota menentukan jumlah resource bersama yang dapat dihitung dan dapat Anda gunakan, dan ditentukan oleh layanan Google Cloud seperti Vertex AI Agent Builder. Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah resource Google Cloud yang dapat digunakan project Google Cloud Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas pengguna Google Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud Anda sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian produk dan layanan Google Cloud oleh Anda
- Membatasi pemakaian resource tersebut
- Memberikan cara untuk meminta perubahan pada nilai kuota
Pada umumnya, saat Anda mencoba menggunakan resource lebih dari kuota yang diizinkan, sistem akan memblokir akses ke resource, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level project Google Cloud. Penggunaan resource di satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud, kuota dibagikan ke semua aplikasi dan alamat IP.
Ada juga batas sistem pada resource Vertex AI Agent Builder. Batas sistem tidak dapat diubah.
Kuota alokasi
Kuota berikut tidak direset dari waktu ke waktu dan akan dilepaskan saat Anda merilis resource:
Kuota | Nilai |
---|---|
Jumlah dokumen per project | 1.000.000 |
Jumlah dokumen per organisasi | 5.000.000 |
Jumlah operasi impor yang berjalan lama yang tertunda per project | 300 |
Jumlah operasi yang berjalan lama untuk impor yang tertunda per organisasi | 1500 |
Jumlah operasi jangka panjang dokumen penghapusan yang tertunda per project | 100 |
Jumlah operasi yang berjalan lama untuk dokumen penghapusan tertunda per organisasi | 500 |
Jumlah kontrol penayangan per project | 1.000 |
Jumlah kontrol penayangan boost per konfigurasi penayangan | 100 |
Jumlah kontrol penayangan filter per konfigurasi penayangan | 100 |
Jumlah kontrol penayangan pengalihan per konfigurasi penayangan | 100 |
Jumlah kontrol penayangan sinonim per konfigurasi penayangan | 100 |
Jumlah peristiwa pengguna per project | 40.000.000.000 |
Jumlah peristiwa pengguna per organisasi | 200.000.000.000 |
Meminta kuota
Kuota berikut berlaku untuk permintaan Vertex AI Agent Builder:
Kuota | Nilai |
---|---|
Menyelesaikan permintaan kueri per menit per project | 300 |
Permintaan kueri lengkap per menit per organisasi | 1.500 |
Permintaan baca penelusuran percakapan per menit per project | 300 |
Permintaan baca penelusuran percakapan per menit per organisasi | 500 |
Permintaan tulis penelusuran percakapan per menit per project | 300 |
Permintaan tulis penelusuran percakapan per menit per organisasi | 500 |
Permintaan batch dokumen per menit per project | 100 |
Permintaan batch dokumen per menit per organisasi | 500 |
Mendokumentasikan permintaan baca per menit per project | 300 |
Permintaan baca dokumen per menit per organisasi | 1500 |
Permintaan tulis dokumen per menit per project | 12.000 |
Permintaan tulis dokumen per menit per organisasi | 60.000 |
Permintaan pembuatan evaluasi per hari per organisasi | 5 |
Permintaan pembuatan evaluasi per hari per project | 5 |
Permintaan baca evaluasi per menit per organisasi | 500 |
Permintaan baca evaluasi per menit per project | 100 |
Permintaan tulis evaluasi per menit per organisasi | 500 |
Permintaan tulis evaluasi per menit per project | 100 |
Permintaan kueri LLM (ringkasan penelusuran, penelusuran multi-giliran) per menit per project | 15 |
Permintaan kueri LLM (ringkasan penelusuran, penelusuran multi-giliran) per menit per organisasi | 75 |
Jumlah penulisan streaming FHIR/BQ yang tertunda per menit | 6.000 |
Jumlah set kueri sampel per organisasi | 500 |
Jumlah set kueri contoh per project | 100 |
Permintaan API peringkat per menit per project | 500 |
Permintaan rekomendasi per menit per project | 60.000 |
Merekomendasikan permintaan per menit per organisasi | Tidak terbatas |
Contoh permintaan baca kueri per menit per organisasi | 1000 |
Contoh permintaan baca kueri per menit per project | 200 |
Contoh permintaan baca kumpulan kueri per menit per organisasi | 500 |
Contoh permintaan baca set kueri per menit per project | 100 |
Contoh permintaan tulis set kueri per menit per organisasi | 500 |
Contoh permintaan tulis set kueri per menit per project | 100 |
Contoh permintaan tulis kueri per menit per organisasi | 1000 |
Contoh permintaan tulis kueri per menit per project | 200 |
Permintaan baca skema per menit per project | 100 |
Permintaan baca skema per menit per organisasi | 500 |
Permintaan tulis skema per menit per project | 100 |
Permintaan tulis skema per menit per organisasi | 500 |
Permintaan penelusuran per menit per project | 300 |
Permintaan penelusuran per menit per organisasi | Tidak terbatas |
Permintaan batch peristiwa pengguna (seperti impor dan penghapusan) per menit per project | 100 |
Permintaan batch peristiwa pengguna (seperti impor dan penghapusan) per menit per organisasi | 500 |
Permintaan pengumpulan peristiwa pengguna per menit per project per pengguna | 240 |
Permintaan pengumpulan peristiwa pengguna per menit per organisasi per pengguna | 1200 |
Permintaan tulis peristiwa pengguna per menit per project | 60.000 |
Permintaan tulis peristiwa pengguna per menit per organisasi | 300.000 |
Kuota untuk pengindeksan halaman web
Jika Anda memiliki penyimpanan data dengan Pengindeksan situs lanjutan diaktifkan, setiap halaman web yang Anda indekskan akan diperhitungkan dalam kuota "Jumlah dokumen per project" dalam daftar Kuota alokasi. Anda juga dapat melihat jumlah halaman dalam project dan kuota halaman untuk project tersebut di kolom Project pages vs quota di halaman Data untuk penyimpanan data.
Jika Anda menambahkan situs ke penyimpanan data dalam project dan halaman web di situs tersebut menyebabkan kuota untuk project terlampaui, situs tersebut tidak akan diindeks. Jika Anda memiliki situs di penyimpanan data yang sudah diindeks, situs tersebut akan terus diindeks seperti sebelumnya. Anda dapat meminta untuk mengupgrade kuota kapan saja.
Meminta penambahan kuota
Untuk menyesuaikan sebagian besar kuota, gunakan Konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.