En este documento, se enumeran las cuotas y los límites que se aplican a Gemini para Google Cloud.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso de Google Cloud que puede usar tu proyecto de Google Cloud. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios de Google Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud.
El sistema de cuotas Cloud realiza las siguientes acciones:
- Supervisa el consumo de productos y servicios de Google Cloud.
- Restringe el consumo de esos recursos.
- Proporciona un medio para solicitar cambios en el valor de la cuota.
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.
Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También existen límites para los recursos de Gemini. Estos límites no están relacionados con el sistema de cuotas. Los límites no se pueden cambiar, a menos que se indique lo contrario.
Solicitudes por segundo
Gemini para Google Cloud aplica cuotas a las solicitudes por segundo para cada usuario en un proyecto.
Cuota | Valor |
---|---|
Solicitudes por segundo | 2 |
Solicitudes por día
Gemini para Google Cloud aplica cuotas para la cantidad total de solicitudes por día de cada usuario en un proyecto.
Cuota | Valor |
---|---|
Solicitudes diarias de Gemini Code Assist o Gemini en Solicitudes de código de BigQuery, como generación y código del proyecto. | 6000 |
Solicitudes por día de chat, visualización, análisis de tablas de estadísticas de datos y otras solicitudes que muestren respuestas en el panel de Gemini del la consola de Google Cloud y los IDE. | 240 |
Cuotas de Gemini en BigQuery
Para los clientes que usan Gemini en BigQuery con edición Enterprise Plus de BigQuery, las cuotas se proporcionan según el uso promedio diario de las horas de ranuras de Enterprise Plus en el último calendario completo mes. Esta cuota se aplica al nivel de la organización y está disponible para todos proyectos de esa organización que tengan asignadas ranuras de la edición Enterprise Plus. Las cuotas se redondean al uso de 100 ranuras-hora más cercano.
Cuotas por 100 ranuras-hora (uso promedio diario de la edición Enterprise Plus) | Valor |
---|---|
Solicitudes de finalización de código por día | 150 |
Solicitudes de generación de código por día | 10 |
Solicitudes por día para chat, visualización, análisis de tablas y otras solicitudes que muestran respuestas en el panel Gemini de la consola de Google Cloud. | 5 |
Ejemplo: Una organización que tiene una reserva de la edición Enterprise Plus con 100 ranuras como modelo de referencia usará un promedio de 2,400 horas de ranuras cada una día (100 ranuras × 24 horas = 2,400 horas de ranuras). Como resultado, en los siguientes por mes, tendrán la siguiente cuota diaria:
- 3,600 solicitudes de finalización de código por día
- 240 solicitudes de generación de código por día
- 120 análisis de tablas de chat, visualización y estadísticas de datos al día
Si tu organización no compró ninguna reserva de la edición Enterprise Plus de BigQuery hasta ahora, después de comprar una reserva de la edición Enterprise Plus, recibirás la cuota predeterminada de lo siguiente para el primer mes calendario completo:
- 7,500 solicitudes de finalización de código por día
- 500 solicitudes de generación de código por día
- 250 análisis de tablas de chat, visualizaciones y estadísticas de datos por día
Si comienzas a usar las reservas de la edición Enterprise Plus a mitad de mes, el la cuota predeterminada se aplica hasta el final del mes siguiente.
Solicitar un aumento de cuota
Para aumentar o disminuir la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita una cuota mayor.