Kuota dan batas

Dokumen ini mencantumkan kuota dan batas sistem yang berlaku untuk Gemini untuk Google Cloud.

  • Kuota menentukan jumlah resource bersama yang dapat dihitung dan dapat Anda gunakan. Kuota ditentukan oleh layanan Google Cloud seperti Gemini untuk Google Cloud.
  • Batas sistem adalah nilai tetap yang tidak dapat diubah.

Google Cloud menggunakan kuota untuk membantu memastikan keadilan dan mengurangi lonjakan penggunaan dan ketersediaan resource. Kuota membatasi jumlah resource Google Cloud yang dapat digunakan project Google Cloud Anda. Kuota berlaku untuk berbagai jenis resource, termasuk komponen hardware, software, dan jaringan. Misalnya, kuota dapat membatasi jumlah panggilan API ke layanan, jumlah load balancer yang digunakan secara bersamaan oleh project Anda, atau jumlah project yang dapat Anda buat. Kuota melindungi komunitas pengguna Google Cloud dengan mencegah kelebihan beban layanan. Kuota juga membantu Anda mengelola resource Google Cloud Anda sendiri.

Sistem Kuota Cloud melakukan hal berikut:

  • Memantau pemakaian produk dan layanan Google Cloud oleh Anda
  • Membatasi pemakaian resource tersebut
  • Memberikan cara untuk meminta perubahan pada nilai kuota

Pada umumnya, saat Anda mencoba menggunakan resource lebih dari kuota yang diizinkan, sistem akan memblokir akses ke resource, dan tugas yang Anda coba lakukan akan gagal.

Kuota umumnya berlaku di level project Google Cloud. Penggunaan resource di satu project tidak memengaruhi kuota yang tersedia di project lain. Dalam project Google Cloud, kuota dibagikan ke semua aplikasi dan alamat IP.

Ada juga batas sistem pada resource Gemini. Batas sistem tidak dapat diubah.

Permintaan per detik

Gemini untuk Google Cloud menerapkan kuota pada permintaan per detik untuk setiap pengguna dalam project.

Kuota Nilai
Permintaan per detik 2

Permintaan per hari

Gemini untuk Google Cloud menerapkan kuota untuk jumlah total permintaan per hari untuk setiap pengguna dalam project.

Kuota Nilai
Permintaan per hari untuk Gemini Code Assist atau Gemini dalam permintaan kode BigQuery, seperti pembuatan kode dan penyelesaian kode. 6000
Permintaan per hari untuk chat, visualisasi, pemindaian tabel insight data, dan permintaan lainnya yang menampilkan respons di panel Gemini di konsol Google Cloud dan IDE. 240

Kuota untuk Gemini Code Assist

Gemini Code Assist menerapkan kuota untuk fitur tertentu.

Kuota Nilai
Awareness codebase lokal Jendela konteks 128.000 token
Repositori penyesuaian kode 950

Kuota untuk Gemini di BigQuery

Untuk pelanggan yang menggunakan Gemini di BigQuery dengan edisi BigQuery Enterprise Plus, kuota diberikan berdasarkan penggunaan rata-rata harian jam slot Enterprise Plus selama bulan kalender penuh terakhir. Kuota ini berlaku untuk tingkat organisasi dan tersedia untuk semua project di organisasi tersebut yang memiliki slot edisi Enterprise Plus yang ditetapkan. Kuota dibulatkan ke atas ke penggunaan 100 slot-jam terdekat.

Kuota per 100 slot-jam (penggunaan rata-rata harian edisi Enterprise Plus) Nilai
Permintaan penyelesaian kode per hari 150
Permintaan pembuatan kode per hari 10
Permintaan per hari untuk chat, visualisasi, pemindaian tabel, dan permintaan lainnya yang menampilkan respons di panel Gemini di konsol Google Cloud. 5

Contoh: Organisasi yang memiliki reservasi edisi Enterprise Plus dengan 100 slot sebagai dasar pengukurannya akan menggunakan rata-rata 2.400 slot-jam setiap hari (100 slot * 24 jam = 2.400 slot-jam). Akibatnya, pada bulan berikutnya, mereka mendapatkan kuota harian berikut:

  • 3.600 permintaan penyelesaian kode per hari
  • 240 permintaan pembuatan kode per hari
  • 120 pemindaian tabel chat, visualisasi, dan analisis data per hari

Jika organisasi Anda belum membeli reservasi edisi BigQuery Enterprise Plus hingga saat ini, setelah membeli reservasi edisi Enterprise Plus, Anda akan menerima kuota default berikut untuk bulan kalender penuh pertama:

  • 7.500 permintaan penyelesaian kode per hari
  • 500 permintaan pembuatan kode per hari
  • 250 pemindaian tabel chat, visualisasi, dan analisis data per hari

Jika Anda mulai menggunakan reservasi edisi Enterprise Plus pada pertengahan bulan, kuota default akan berlaku hingga akhir bulan berikutnya.

Meminta penambahan kuota

Untuk menyesuaikan sebagian besar kuota, gunakan Konsol Google Cloud. Untuk mengetahui informasi selengkapnya, lihat Meminta penyesuaian kuota.