Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini untuk Google Cloud.
- Kuota menentukan jumlah resource bersama yang dapat dihitung dan dapat Anda gunakan. Kuota ditentukan oleh layanan Google Cloud seperti Gemini untuk Google Cloud.
- Batas sistem adalah nilai tetap yang tidak dapat diubah.
Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah resource Google Cloud yang dapat digunakan project Google Cloud Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas pengguna Google Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud Anda sendiri.
Sistem Kuota Cloud melakukan hal berikut:
- Memantau pemakaian produk dan layanan Google Cloud oleh Anda
- Membatasi pemakaian resource tersebut
- Memberikan cara untuk meminta perubahan pada nilai kuota
Pada umumnya, saat Anda mencoba menggunakan resource lebih dari kuota yang diizinkan, sistem akan memblokir akses ke resource, dan tugas yang Anda coba lakukan akan gagal.
Kuota umumnya berlaku di level project Google Cloud. Penggunaan resource di satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud, kuota dibagikan ke semua aplikasi dan alamat IP.
Ada juga batas sistem pada resource Gemini. Batas sistem tidak dapat diubah.
Permintaan per detik
Gemini untuk Google Cloud menerapkan kuota pada permintaan per detik untuk setiap pengguna dalam project.
Kuota | Nilai |
---|---|
Permintaan per detik | 2 |
Permintaan per hari
Gemini untuk Google Cloud menerapkan kuota untuk jumlah total permintaan per hari untuk setiap pengguna dalam project.
Kuota | Nilai |
---|---|
Permintaan per hari untuk Gemini Code Assist atau Gemini dalam permintaan kode BigQuery, seperti pembuatan kode dan penyelesaian kode. | 6000 |
Permintaan per hari untuk chat, visualisasi, pemindaian tabel insight data, dan permintaan lainnya yang menampilkan respons di panel Gemini di konsol Google Cloud dan IDE. | 240 |
Kuota untuk Gemini Code Assist
Gemini Code Assist menerapkan kuota untuk fitur tertentu.
Kuota | Nilai |
---|---|
Awareness codebase lokal | Jendela konteks 128.000 token |
Repositori penyesuaian kode | 950 |
Kuota untuk Gemini di BigQuery
Untuk pelanggan yang menggunakan Gemini di BigQuery dengan edisi BigQuery Enterprise Plus, kuota diberikan berdasarkan penggunaan rata-rata harian jam slot Enterprise Plus selama bulan kalender penuh terakhir. Kuota ini berlaku untuk tingkat organisasi dan tersedia untuk semua project di organisasi tersebut yang memiliki slot edisi Enterprise Plus yang ditetapkan. Kuota dibulatkan ke atas ke penggunaan 100 slot-jam terdekat.
Kuota per 100 slot-jam (penggunaan rata-rata harian edisi Enterprise Plus) | Nilai |
---|---|
Permintaan penyelesaian kode per hari | 150 |
Permintaan pembuatan kode per hari | 10 |
Permintaan per hari untuk chat, visualisasi, pemindaian tabel, dan permintaan lainnya yang menampilkan respons di panel Gemini di konsol Google Cloud. | 5 |
Contoh: Organisasi yang memiliki reservasi edisi Enterprise Plus dengan 100 slot sebagai dasar pengukurannya akan menggunakan rata-rata 2.400 slot-jam setiap hari (100 slot * 24 jam = 2.400 slot-jam). Akibatnya, pada bulan berikutnya, mereka mendapatkan kuota harian berikut:
- 3.600 permintaan penyelesaian kode per hari
- 240 permintaan pembuatan kode per hari
- 120 pemindaian tabel chat, visualisasi, dan analisis data per hari
Jika organisasi Anda belum membeli reservasi edisi BigQuery Enterprise Plus hingga saat ini, setelah membeli reservasi edisi Enterprise Plus, Anda akan menerima kuota default berikut untuk bulan kalender penuh pertama:
- 7.500 permintaan penyelesaian kode per hari
- 500 permintaan pembuatan kode per hari
- 250 pemindaian tabel chat, visualisasi, dan analisis data per hari
Jika Anda mulai menggunakan reservasi edisi Enterprise Plus pada pertengahan bulan, kuota default akan berlaku hingga akhir bulan berikutnya.
Meminta penambahan kuota
Untuk menyesuaikan sebagian besar kuota, gunakan Konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.