Kuota bersama dinamis

Halaman ini menjelaskan kuota bersama dinamis (DSQ) dan perbedaan DSQ dengan Throughput yang Disediakan.

Pengantar kuota bersama dinamis

Kuota bersama dinamis (DSQ) mendistribusikan kapasitas on-demand yang tersedia di antara semua kueri yang diproses oleh layanan Google Cloud untuk model tertentu. Kemampuan ini menghilangkan kebutuhan untuk menetapkan batas kuota dan mengirimkan permintaan penambahan kuota (QIR).

DSQ memproses permintaan dari semua pelanggan ke endpoint regional atau multi-regional yang sama. Kuota dihapus, dan kapasitas yang tersedia didistribusikan ke setiap project.

Throughput yang Disediakan adalah satu-satunya cara untuk memastikan ketersediaan tinggi untuk aplikasi Anda dan mendapatkan tingkat layanan yang dapat diprediksi untuk workload produksi Anda. Untuk informasi selengkapnya tentang Provisioned Throughput, lihat Provisioned Throughput.

Model yang didukung

Bagian ini mencantumkan model yang mendukung kuota bersama dinamis (DSQ), yang diaktifkan secara default dalam model ini.

Model Google

Tabel berikut mencantumkan model (dan versi) Google yang mendukung DSQ:

Model Tanggal rilis DSQ Status
Gemini 2.0 Flash (gemini-2.0-flash-001) 5 Februari 2025 Aktif
Gemini 1.5 Flash (gemini-1.5-flash-002) 24 September 2024 Aktif
Gemini 1.5 Pro (gemini-1.5-pro-002) 24 September 2024 Aktif

Kuota DSQ tidak tercantum di halaman Quotas & System Limits di konsol Google Cloud.

Memecahkan masalah error DSQ

Jika kapasitas tidak memadai untuk menayangkan kueri, Anda mungkin menerima error 429. Untuk memecahkan masalah error yang mungkin terjadi, lihat Kode error 429.

Langkah berikutnya