En esta página, se proporcionan cuotas de modelos ajustados, límites de incorporación de texto y cuotas de Vertex AI Agent Engine.
Cuotas de modelos ajustados
Las siguientes cuotas se aplican a los modelos generativos de IA de Vertex AI para un proyecto y una región determinados:
Cuota | Valor |
---|---|
Núcleos de pods de TPU V3 de entrenamiento de imagen restringido por región *Región compatible: europe-west4 |
64 |
GPU Nvidia A100 de 80 GB de entrenamiento de imagen restringido por región * Región compatible: us-central1 * Región compatible: us-east4 |
8 2 |
Límites de embedding de texto
Cada solicitud de modelo de incorporación de texto puede tener hasta 250 textos de entrada (generando 1 incorporación por texto de entrada) y 20,000 tokens por solicitud.
Solo se usan los primeros 8,192 tokens de cada texto de entrada para calcular las incorporaciones. Cada solicitud solo puede incluir un texto de entrada.
Límites de Vertex AI Agent Engine
Los siguientes límites se aplican a Vertex AI Agent Engine para un proyecto determinado en cada región.
Descripción | Límite |
---|---|
Crea, borra o actualiza Vertex AI Agent Engine por minuto | 10 |
Motor de agentes de Query/StreamQuery de Vertex AI por minuto | 60 |
Cantidad máxima de recursos de Vertex AI Agent Engine | 100 |
¿Qué sigue?
- Para obtener información sobre las cuotas y los límites de Vertex AI, consulta Cuotas y límites de Vertex AI.
- Para obtener más información sobre las Google Cloud cuotas y los límites, consulta Comprende los valores de cuota y los límites del sistema.