En esta página, se explica la cuota compartida dinámica (DSQ) y en qué se diferencia de la capacidad de procesamiento aprovisionada.
Introducción a la cuota compartida dinámica
La cuota compartida dinámica (DSQ) distribuye la capacidad disponible según demanda entre todas las consultas que procesan los servicios de Google Cloud para modelos específicos. Esta función elimina la necesidad de establecer límites de cuota y enviar solicitudes de aumento de cuota (QIR).
DSQ procesa las solicitudes de todos los clientes a los mismos extremos regionales o multiregionales. Se quitan las cuotas y se distribuye la capacidad disponible a cada proyecto.
La capacidad de procesamiento aprovisionada es la única forma de garantizar la alta disponibilidad para tu aplicación y obtener niveles de servicio predecibles para tus cargas de trabajo de producción. Para obtener más información sobre la capacidad de procesamiento aprovisionada, consulta Capacidad de procesamiento aprovisionada.
Modelos compatibles
En esta sección, se enumeran los modelos que admiten la cuota compartida dinámica (DSQ), que está habilitada de forma predeterminada en estos modelos.
Modelos de Google
En la siguiente tabla, se enumeran los modelos (y las versiones) de Google que admiten DSQ:
Modelo | Fecha de lanzamiento de DSQ | Estado |
---|---|---|
Gemini 2.0 Flash (gemini-2.0-flash-001 ) |
5 de febrero de 2025 | En vivo |
Gemini 1.5 Flash (gemini-1.5-flash-002 ) |
24 de septiembre de 2024 | En vivo |
Gemini 1.5 Pro (gemini-1.5-pro-002 ) |
24 de septiembre de 2024 | En vivo |
Las cuotas de DSQ no se enumeran en la página Cuotas y límites del sistema de la consola de Google Cloud.
Cómo solucionar problemas de DSQ
Cuando no hay suficiente capacidad para entregar tu consulta, es posible que recibas un error 429. Para solucionar los errores que puedan ocurrir, consulta Código de error 429.
¿Qué sigue?
- Para obtener más información sobre los modelos de Gemini que admiten DSQ, consulta Modelos de Gemini.
- Para obtener más información sobre las cuotas y límites de IA generativa, consulta Límites de frecuencia de IA generativa en Vertex AI.
- Para obtener más información sobre las cuotas y los límites de Vertex AI, consulta Cuotas y límites de Vertex AI.
- Para obtener más información sobre las Google Cloud cuotas y los límites, consulta Comprende los valores de cuota y los límites del sistema.