Halaman ini menjelaskan kuota bersama dinamis (DSQ) dan perbedaan DSQ dengan Throughput yang Disediakan.
Pengantar kuota bersama dinamis
Kuota bersama dinamis (DSQ) mendistribusikan kapasitas on-demand yang tersedia di antara semua kueri yang diproses oleh layanan Google Cloud untuk model tertentu. Kemampuan ini menghilangkan kebutuhan untuk menetapkan batas kuota dan mengirimkan permintaan penambahan kuota (QIR).
DSQ memproses permintaan dari semua pelanggan ke endpoint regional atau multi-regional yang sama. Kuota dihapus, dan kapasitas yang tersedia didistribusikan ke setiap project.
Throughput yang Disediakan adalah satu-satunya cara untuk memastikan ketersediaan tinggi untuk aplikasi Anda dan mendapatkan tingkat layanan yang dapat diprediksi untuk workload produksi Anda. Untuk informasi selengkapnya tentang Provisioned Throughput, lihat Provisioned Throughput.
Model yang didukung
Bagian ini mencantumkan model yang mendukung kuota bersama dinamis (DSQ), yang diaktifkan secara default dalam model ini.
Model Google
Tabel berikut mencantumkan model (dan versi) Google yang mendukung DSQ:
Model | Tanggal rilis DSQ | Status |
---|---|---|
Gemini 2.0 Flash (gemini-2.0-flash-001 ) |
5 Februari 2025 | Aktif |
Gemini 1.5 Flash (gemini-1.5-flash-002 ) |
24 September 2024 | Aktif |
Gemini 1.5 Pro (gemini-1.5-pro-002 ) |
24 September 2024 | Aktif |
Kuota DSQ tidak tercantum di halaman Quotas & System Limits di konsol Google Cloud.
Memecahkan masalah error DSQ
Jika kapasitas tidak memadai untuk menayangkan kueri, Anda mungkin menerima error 429. Untuk memecahkan masalah error yang mungkin terjadi, lihat Kode error 429.
Langkah berikutnya
- Untuk mempelajari lebih lanjut model Gemini yang mendukung DSQ, lihat Model Gemini.
- Untuk mempelajari kuota dan batas AI Generatif lebih lanjut, lihat Batas kapasitas AI Generatif di Vertex AI.
- Untuk mempelajari kuota dan batas Vertex AI lebih lanjut, lihat Kuota dan batas Vertex AI.
- Untuk mempelajari Google Cloud kuota dan batas lebih lanjut, lihat Memahami nilai kuota dan batas sistem.