Cuotas y límites

En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Vertex AI Agent Builder.

  • Las cuotas especifican la cantidad de un recurso compartido contable que puedes usar. Las cuotas se definen según los servicios de Google Cloud, como Vertex AI Agent Builder.
  • Los límites del sistema son valores fijos que no se pueden cambiar.

Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso de Google Cloud que puede usar tu proyecto de Google Cloud. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios de Google Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud.

El sistema de cuotas Cloud realiza las siguientes acciones:

  • Supervisa el consumo de productos y servicios de Google Cloud.
  • Restringe el consumo de esos recursos.
  • Proporciona un medio para solicitar cambios en el valor de la cuota.

En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.

Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.

También existen límites del sistema para los recursos de Vertex AI Agent Builder. Los límites del sistema no se pueden cambiar.

Cuotas de asignación

Las siguientes cuotas no se restablecen con el tiempo y, en su lugar, se liberan cuando liberas el recurso:

Cuotas Valor
Cantidad de documentos por proyecto 1,000,000
Cantidad de documentos por organización 5,000,000
Cantidad de operaciones de importación de larga duración pendientes por proyecto 300
Cantidad de operaciones de importación de larga duración pendientes por organización 1500
Cantidad de operaciones de larga duración de documentos de purga pendientes por proyecto 100
Cantidad de operaciones de larga duración de documentos de purga pendientes por organización 500
Cantidad de controles de publicación por proyecto 1,000
Cantidad de controles de entrega de aumento por configuración de entrega 100
Cantidad de controles de publicación de filtros por configuración de publicación 100
Cantidad de controles de entrega de redireccionamientos por configuración de entrega 100
Cantidad de controles de publicación de sinónimos por configuración de publicación 100
Cantidad de eventos de usuarios por proyecto 40,000,000,000
Cantidad de eventos de usuarios por organización 200,000,000,000

Solicita cuotas

Las siguientes cuotas se aplican a las solicitudes de Vertex AI Agent Builder:

Cuotas Valor
Solicitudes de consulta completas por minuto por proyecto 300
Solicitudes de consulta completas por minuto por organización 1,500
Solicitudes de lectura de la búsqueda conversacional por minuto por proyecto 300
Solicitudes de lectura de la búsqueda conversacional por minuto por organización 500
Solicitudes de escritura de búsqueda conversacional por minuto por proyecto 300
Solicitudes de escritura de búsqueda conversacional por minuto por organización 500
Solicitudes de lotes de documentos por minuto por proyecto 100
Solicitudes de lotes de documentos por minuto por organización 500
Solicitudes de lectura de documentos por minuto por proyecto 300
Solicitudes de lectura de documentos por minuto por organización 1500
Solicitudes de escritura de documentos por minuto por proyecto 12,000
Solicitudes de escritura de documentos por minuto por organización 60,000
Solicitudes de creación de evaluaciones por día por organización 5
Solicitudes de creación de evaluaciones por día y por proyecto 5
Solicitudes de lectura de evaluación por minuto por organización 500
Solicitudes de lectura de evaluación por minuto por proyecto 100
Solicitudes de escritura de evaluación por minuto por organización 500
Solicitudes de escritura de evaluación por minuto por proyecto 100
Solicitudes de consulta de LLM (resumen de búsqueda, búsqueda de varias instrucciones) por minuto por proyecto 15
Solicitudes de consulta de LLM (resumen de búsqueda, búsqueda de varios turnos) por minuto por organización 75
Cantidad de operaciones de escritura de transmisión pendientes de FHIR o BQ por minuto 6,000
Cantidad de conjuntos de consultas de muestra por organización 500
Cantidad de conjuntos de consultas de muestra por proyecto 100
Solicitudes a la API de clasificación por minuto por proyecto 500
Solicitudes de recomendación por minuto por proyecto 60,000
Solicitudes de recomendación por minuto por organización Ilimitado
Ejemplo de solicitudes de lectura de consultas por minuto por organización 1000
Ejemplo de solicitudes de lectura de consultas por minuto por proyecto 200
Ejemplo de solicitudes de lectura de conjuntos de consultas por minuto por organización 500
Ejemplo de solicitudes de lectura de conjunto de consultas por minuto por proyecto 100
Ejemplo de solicitudes de escritura de conjuntos de consultas por minuto por organización 500
Ejemplo de solicitudes de escritura de conjuntos de consultas por minuto por proyecto 100
Ejemplo de solicitudes de escritura de consultas por minuto por organización 1000
Ejemplo de solicitudes de escritura de consultas por minuto por proyecto 200
Solicitudes de lectura de esquemas por minuto por proyecto 100
Solicitudes de lectura de esquemas por minuto por organización 500
Solicitudes de escritura de esquemas por minuto por proyecto 100
Solicitudes de escritura de esquemas por minuto por organización 500
Solicitudes de búsqueda por minuto por proyecto 300
Solicitudes de búsqueda por minuto por organización Ilimitado
Solicitudes por lotes de eventos del usuario (como importación y eliminación) por minuto por proyecto 100
Solicitudes por lotes de eventos del usuario (como importación y eliminación) por minuto por organización 500
Solicitudes de recopilación de eventos del usuario por minuto por proyecto por usuario 240
Solicitudes de recopilación de eventos del usuario por minuto por organización por usuario 1200
Solicitudes de operaciones de escritura de eventos del usuario por minuto por proyecto 60,000
Solicitudes de operaciones de escritura de eventos del usuario por minuto por organización 300,000

Cuota para la indexación de páginas web

Cuando tienes un almacén de datos con la indexación de sitios web avanzada activada, cada página web que indexes se considera para la cuota "Cantidad de documentos por proyecto" en la lista Cuotas de asignación. También puedes ver la cantidad de páginas de tu proyecto y la cuota de páginas de ese proyecto en el campo Páginas del proyecto en comparación con la cuota en la página Datos de un almacén de datos.

Si agregas sitios web a un almacén de datos en un proyecto y las páginas web de esos sitios web hacen que se supere la cuota del proyecto, los sitios web no se indexarán. Si tienes sitios web en tu almacén de datos que ya están indexados, estos sitios web se seguirán indexando como antes. Puedes solicitar que se actualice tu cuota en cualquier momento.

Solicitar un aumento de cuota

Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita un ajuste de cuota.