En este documento, se enumeran las cuotas y los límites del sistema que se aplican a Vertex AI Agent Builder. Las cuotas especifican la cantidad de un recurso compartido contable que puedes usar, y las definen los servicios de Google Cloud, como Vertex AI Agent Builder. Los límites del sistema son valores fijos que no se pueden cambiar.
Google Cloud usa cuotas para garantizar la equidad y reducir los aumentos repentinos en el uso y la disponibilidad de los recursos. Una cuota restringe la cantidad de un recurso de Google Cloud que puede usar tu proyecto de Google Cloud. Las cuotas se aplican a una variedad de tipos de recursos, incluidos los componentes de hardware, software y red. Por ejemplo, las cuotas pueden restringir la cantidad de llamadas a la API para un servicio, la cantidad de balanceadores de cargas que se usan en simultáneo en tu proyecto o la cantidad de proyectos que puedes crear. Las cuotas protegen a la comunidad de usuarios de Google Cloud mediante la prevención de la sobrecarga de los servicios. También te ayudan a administrar tus propios recursos de Google Cloud.
El sistema de cuotas Cloud realiza las siguientes acciones:
- Supervisa el consumo de productos y servicios de Google Cloud.
- Restringe el consumo de esos recursos.
- Proporciona un medio para solicitar cambios en el valor de la cuota.
En la mayoría de los casos, cuando intentas consumir más de lo que permite la cuota de un recurso, el sistema bloquea el acceso al recurso, y la tarea que intentas realizar falla.
Por lo general, las cuotas se aplican a nivel del proyecto de Google Cloud. El uso de un recurso en un proyecto no afecta tu cuota disponible en otro proyecto. Dentro de un proyecto de Google Cloud, las cuotas se comparten entre todas las aplicaciones y direcciones IP.
También existen límites del sistema para los recursos de Vertex AI Agent Builder. Los límites del sistema no se pueden cambiar.
Cuotas de asignación
Las siguientes cuotas no se restablecen con el tiempo y, en su lugar, se liberan cuando liberas el recurso:
Cuotas | Valor |
---|---|
Cantidad de documentos por proyecto | 1,000,000 |
Cantidad de documentos por organización | 5,000,000 |
Cantidad de operaciones de importación de larga duración pendientes por proyecto | 300 |
Cantidad de operaciones de importación de larga duración pendientes por organización | 1500 |
Cantidad de operaciones de larga duración de documentos de purga pendientes por proyecto | 100 |
Cantidad de operaciones de larga duración de documentos de purga pendientes por organización | 500 |
Cantidad de controles de publicación por proyecto | 1,000 |
Cantidad de controles de entrega de aumento por configuración de entrega | 100 |
Cantidad de controles de publicación de filtros por configuración de publicación | 100 |
Cantidad de controles de entrega de redireccionamientos por configuración de entrega | 100 |
Cantidad de controles de publicación de sinónimos por configuración de publicación | 100 |
Cantidad de eventos de usuarios por proyecto | 40,000,000,000 |
Cantidad de eventos de usuarios por organización | 200,000,000,000 |
Solicita cuotas
Las siguientes cuotas se aplican a las solicitudes de Vertex AI Agent Builder:
Cuotas | Valor |
---|---|
Solicitudes de consulta completas por minuto por proyecto | 300 |
Solicitudes de consulta completas por minuto por organización | 1,500 |
Solicitudes de lectura de la búsqueda conversacional por minuto por proyecto | 300 |
Solicitudes de lectura de la búsqueda conversacional por minuto por organización | 500 |
Solicitudes de escritura de búsqueda conversacional por minuto por proyecto | 300 |
Solicitudes de escritura de búsqueda conversacional por minuto por organización | 500 |
Solicitudes de lotes de documentos por minuto por proyecto | 100 |
Solicitudes de lotes de documentos por minuto por organización | 500 |
Solicitudes de lectura de documentos por minuto por proyecto | 300 |
Solicitudes de lectura de documentos por minuto por organización | 1500 |
Solicitudes de escritura de documentos por minuto por proyecto | 12,000 |
Solicitudes de escritura de documentos por minuto por organización | 60,000 |
Solicitudes de creación de evaluaciones por día por organización | 5 |
Solicitudes de creación de evaluaciones por día y por proyecto | 5 |
Solicitudes de lectura de evaluación por minuto por organización | 500 |
Solicitudes de lectura de evaluación por minuto por proyecto | 100 |
Solicitudes de escritura de evaluación por minuto por organización | 500 |
Solicitudes de escritura de evaluación por minuto por proyecto | 100 |
Solicitudes de consulta de LLM (resumen de búsqueda, búsqueda de varias instrucciones) por minuto por proyecto | 15 |
Solicitudes de consulta de LLM (resumen de búsqueda, búsqueda de varios turnos) por minuto por organización | 75 |
Cantidad de operaciones de escritura de transmisión pendientes de FHIR o BQ por minuto | 6,000 |
Cantidad de conjuntos de consultas de muestra por organización | 500 |
Cantidad de conjuntos de consultas de muestra por proyecto | 100 |
Solicitudes a la API de clasificación por minuto por proyecto | 500 |
Solicitudes de recomendación por minuto por proyecto | 60,000 |
Solicitudes de recomendación por minuto por organización | Ilimitado |
Ejemplo de solicitudes de lectura de consultas por minuto por organización | 1000 |
Ejemplo de solicitudes de lectura de consultas por minuto por proyecto | 200 |
Ejemplo de solicitudes de lectura de conjuntos de consultas por minuto por organización | 500 |
Ejemplo de solicitudes de lectura de conjuntos de consultas por minuto por proyecto | 100 |
Ejemplo de solicitudes de escritura de conjuntos de consultas por minuto por organización | 500 |
Ejemplo de solicitudes de escritura de conjuntos de consultas por minuto por proyecto | 100 |
Ejemplo de solicitudes de escritura de consultas por minuto por organización | 1000 |
Ejemplo de solicitudes de escritura de consultas por minuto por proyecto | 200 |
Solicitudes de lectura de esquemas por minuto por proyecto | 100 |
Solicitudes de lectura de esquemas por minuto por organización | 500 |
Solicitudes de escritura de esquemas por minuto por proyecto | 100 |
Solicitudes de escritura de esquemas por minuto por organización | 500 |
Solicitudes de búsqueda por minuto por proyecto | 300 |
Solicitudes de búsqueda por minuto por organización | Ilimitado |
Solicitudes por lotes de eventos del usuario (como importación y eliminación) por minuto por proyecto | 100 |
Solicitudes por lotes de eventos del usuario (como importación y eliminación) por minuto por organización | 500 |
Solicitudes de recopilación de eventos del usuario por minuto por proyecto por usuario | 240 |
Solicitudes de recopilación de eventos del usuario por minuto por organización por usuario | 1200 |
Solicitudes de operaciones de escritura de eventos del usuario por minuto por proyecto | 60,000 |
Solicitudes de operaciones de escritura de eventos del usuario por minuto por organización | 300,000 |
Cuota para la indexación de páginas web
Cuando tienes un almacén de datos con la indexación de sitios web avanzada activada, cada página web que indexes se considera para la cuota "Cantidad de documentos por proyecto" en la lista Cuotas de asignación. También puedes ver la cantidad de páginas de tu proyecto y la cuota de páginas de ese proyecto en el campo Páginas del proyecto en comparación con la cuota en la página Datos de un almacén de datos.
Si agregas sitios web a un almacén de datos en un proyecto y las páginas web de esos sitios web hacen que se supere la cuota del proyecto, los sitios web no se indexarán. Si tienes sitios web en tu almacén de datos que ya están indexados, estos sitios web se seguirán indexando como antes. Puedes solicitar que se actualice tu cuota en cualquier momento.
Solicitar un aumento de cuota
Para ajustar la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita un ajuste de cuota.