Cuota compartida dinámica

En esta página, se explica la cuota compartida dinámica (DSQ) y en qué se diferencia de la capacidad de procesamiento aprovisionada.

Introducción a la cuota compartida dinámica

La cuota compartida dinámica (DSQ) distribuye la capacidad disponible según demanda entre todas las consultas que procesan los servicios de Google Cloud para modelos específicos. Esta función elimina la necesidad de establecer límites de cuota y enviar solicitudes de aumento de cuota (QIR).

DSQ procesa las solicitudes de todos los clientes a los mismos extremos regionales o multiregionales. Se quitan las cuotas y se distribuye la capacidad disponible a cada proyecto.

La capacidad de procesamiento aprovisionada es la única forma de garantizar la alta disponibilidad para tu aplicación y obtener niveles de servicio predecibles para tus cargas de trabajo de producción. Para obtener más información sobre la capacidad de procesamiento aprovisionada, consulta Capacidad de procesamiento aprovisionada.

Modelos compatibles

En esta sección, se enumeran los modelos que admiten la cuota compartida dinámica (DSQ), que está habilitada de forma predeterminada en estos modelos.

Modelos de Google

En la siguiente tabla, se enumeran los modelos (y las versiones) de Google que admiten DSQ:

Modelo Fecha de lanzamiento de DSQ Estado
Gemini 2.0 Flash (gemini-2.0-flash-001) 5 de febrero de 2025 En vivo
Gemini 1.5 Flash (gemini-1.5-flash-002) 24 de septiembre de 2024 En vivo
Gemini 1.5 Pro (gemini-1.5-pro-002) 24 de septiembre de 2024 En vivo

Las cuotas de DSQ no se enumeran en la página Cuotas y límites del sistema de la consola de Google Cloud.

Cómo solucionar problemas de DSQ

Cuando no hay suficiente capacidad para entregar tu consulta, es posible que recibas un error 429. Para solucionar los errores que puedan ocurrir, consulta Código de error 429.

¿Qué sigue?