En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Vertex AI Agent Builder.
- Las cuotas especifican la cantidad de un recurso compartido contable que puedes usar. Las cuotas se definen mediante Google Cloud servicios como Vertex AI Agent Builder.
- Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso deGoogle Cloud que puede usar tu Google Cloud proyecto. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios deGoogle Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios Google Cloud recursos.
El sistema de cuotas Cloud realiza las siguientes acciones:
- Supervisa el consumo de Google Cloud productos y servicios
- Restringe el consumo de esos recursos.
- Proporciona un medio para solicitar cambios en el valor de la cuota.
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.
Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También existen límites del sistema para los recursos de Vertex AI Agent Builder. Los límites del sistema no se pueden cambiar.
Cuotas de asignación
Las siguientes cuotas no se restablecen con el tiempo y, en su lugar, se liberan cuando liberas el recurso: Puedes solicitar un aumento de la cuota si la cuota predeterminada no es suficiente.
Cuotas | Valor |
---|---|
Cantidad de documentos por proyecto | 1,000,000 |
Cantidad de almacenes de datos por proyecto | 100* |
Cantidad de motores por proyecto | 100† |
Cantidad de operaciones de importación de larga duración pendientes por proyecto | 300 |
Cantidad de operaciones de larga duración de documentos de purga pendientes por proyecto | 100 |
Cantidad de controles de publicación por proyecto | 1,000 |
Cantidad de controles de entrega de aumento por configuración de entrega | 100 |
Cantidad de controles de publicación de filtros por configuración de publicación | 100 |
Cantidad de controles de entrega de redireccionamientos por configuración de entrega | 100 |
Cantidad de controles de publicación de sinónimos por configuración de publicación | 100 |
Cantidad de eventos de usuarios por proyecto | 40,000,000,000 |
* Debido a una limitación técnica, la cuota máxima para los almacenes de datos es de 500 por proyecto. Si necesitas más almacenes de datos, usa proyectos nuevos.
† Debido a una limitación técnica, la cuota máxima de motores es de 500 por proyecto. Si necesitas más motores, usa proyectos nuevos.
Cuotas de solicitudes
Las siguientes cuotas se aplican a las solicitudes a la API de Vertex AI Agent Builder. Puedes solicitar un aumento de la cuota si la cuota predeterminada no es suficiente.
Cuotas | Valor |
---|---|
Solicitudes de consulta completas por minuto por proyecto | 300 |
Solicitudes de lectura de la búsqueda conversacional por minuto por proyecto | 300 |
Solicitudes de escritura de búsqueda conversacional por minuto por proyecto | 300 |
Solicitudes por lotes de documentos (como importación intercalada y purga) por minuto por proyecto | 100 |
Solicitudes de importación asíncrona de documentos (Cloud Storage, BigQuery, etcétera) por minuto por proyecto | 5 |
Solicitudes de eliminación de documentos por minuto por proyecto | 100 |
Solicitudes de lectura de documentos por minuto por proyecto | 300 |
Solicitudes de escritura de documentos por minuto por proyecto | 12,000 |
Solicitudes de creación de evaluaciones por día y por proyecto | 5 |
Solicitudes de lectura de evaluación por minuto por proyecto | 100 |
Solicitudes de escritura de evaluación por minuto por proyecto | 100 |
Solicitudes de consulta de LLM (resumen de búsqueda, búsqueda de varias instrucciones) por minuto por proyecto | 60 |
Cantidad de operaciones de escritura pendientes de transmisión de FHIR o BigQuery por minuto | 6,000 |
Cantidad de conjuntos de consultas de muestra por proyecto | 100 |
Solicitudes a la API de clasificación por minuto por proyecto | 500 |
Solicitudes de recomendación por minuto por proyecto | 60,000 |
Ejemplo de solicitudes de lectura de consultas por minuto por proyecto | 200 |
Ejemplo de solicitudes de lectura de conjuntos de consultas por minuto por proyecto | 100 |
Ejemplo de solicitudes de escritura de conjuntos de consultas por minuto por proyecto | 100 |
Ejemplo de solicitudes de escritura de consultas por minuto por proyecto | 200 |
Solicitudes de lectura de esquemas por minuto por proyecto | 100 |
Solicitudes de escritura de esquemas por minuto por proyecto | 100 |
Solicitudes de búsqueda por minuto por proyecto | 300 |
Solicitudes por lotes de eventos del usuario (como importación y eliminación) por minuto por proyecto | 100 |
Solicitudes de recopilación de eventos del usuario por minuto por proyecto por usuario | 240 |
Solicitudes de operaciones de escritura de eventos del usuario por minuto por proyecto | 60,000 |
Cuota para la indexación de páginas web
Cuando tienes un almacén de datos con la indexación de sitios web avanzada activada, cada página web que indexes se considera para la cuota "Cantidad de documentos por proyecto" en la lista Cuotas de asignación. También puedes ver la cantidad de páginas de tu proyecto y la cuota de páginas de ese proyecto en el campo Páginas del proyecto en comparación con la cuota en la página Datos de un almacén de datos.
Si agregas sitios web a un almacén de datos en un proyecto y las páginas web de esos sitios web hacen que se supere la cuota del proyecto, los sitios web no se indexarán. Si tienes sitios web en tu almacén de datos que ya están indexados, estos sitios web se seguirán indexando como antes. Puedes solicitar que se actualice tu cuota en cualquier momento.
Solicita un aumento de la cuota
Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita un ajuste de cuota.