Cuotas y límites de modelos ajustados, incorporación de texto y motor de agentes de Vertex AI

En esta página, se proporcionan cuotas de modelos ajustados, límites de incorporación de texto y cuotas de Vertex AI Agent Engine.

Cuotas de modelos ajustados

Las siguientes cuotas se aplican a los modelos generativos de IA de Vertex AI para un proyecto y una región determinados:

Cuota Valor
Núcleos de pods de TPU V3 de entrenamiento de imagen restringido por región
*Región compatible: europe-west4
64
GPU Nvidia A100 de 80 GB de entrenamiento de imagen restringido por región
* Región compatible: us-central1
* Región compatible: us-east4

8
2
* Las situaciones de ajuste tienen reservas de aceleradores en regiones específicas. Las cuotas para el ajuste son compatibles y deben solicitarse en regiones específicas.

Límites de embedding de texto

Cada solicitud de modelo de incorporación de texto puede tener hasta 250 textos de entrada (generando 1 incorporación por texto de entrada) y 20,000 tokens por solicitud.

Solo se usan los primeros 8,192 tokens de cada texto de entrada para calcular las incorporaciones. Cada solicitud solo puede incluir un texto de entrada.

Límites de Vertex AI Agent Engine

Los siguientes límites se aplican a Vertex AI Agent Engine para un proyecto determinado en cada región.

Descripción Límite
Crea, borra o actualiza Vertex AI Agent Engine por minuto 10
Motor de agentes de Query/StreamQuery de Vertex AI por minuto 60
Cantidad máxima de recursos de Vertex AI Agent Engine 100

¿Qué sigue?