Se usó la API de Cloud Translation para traducir esta página.

Cuotas y límites de modelos ajustados, incorporación de texto y motor de agentes de Vertex AI

En esta página, se proporcionan cuotas de modelos ajustados, límites de incorporación de texto y cuotas de Vertex AI Agent Engine.

Cuotas de modelos ajustados

Las siguientes cuotas se aplican a los modelos generativos de IA de Vertex AI para un proyecto y una región determinados:

Cuota	Valor
Núcleos de pods de TPU V3 de entrenamiento de imagen restringido por región *Región compatible: europe-west4	64
GPU Nvidia A100 de 80 GB de entrenamiento de imagen restringido por región * Región compatible: us-central1 * Región compatible: us-east4	8 2

* Las situaciones de ajuste tienen reservas de aceleradores en regiones específicas. Las cuotas para el ajuste son compatibles y deben solicitarse en regiones específicas.

Límites de embedding de texto

Cada solicitud de modelo de incorporación de texto puede tener hasta 250 textos de entrada (generando 1 incorporación por texto de entrada) y 20,000 tokens por solicitud.

Solo se usan los primeros 8,192 tokens de cada texto de entrada para calcular las incorporaciones. Cada solicitud solo puede incluir un texto de entrada.

Límites de Vertex AI Agent Engine

Los siguientes límites se aplican a Vertex AI Agent Engine para un proyecto determinado en cada región.

Descripción	Límite
Crea, borra o actualiza Vertex AI Agent Engine por minuto	10
Motor de agentes de Query/StreamQuery de Vertex AI por minuto	60
Cantidad máxima de recursos de Vertex AI Agent Engine	100

¿Qué sigue?

Para obtener información sobre las cuotas y los límites de Vertex AI, consulta Cuotas y límites de Vertex AI.
Para obtener más información sobre las Google Cloud cuotas y los límites, consulta Comprende los valores de cuota y los límites del sistema.

Cuotas y límites de modelos ajustados, incorporación de texto y motor de agentes de Vertex AI Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Cuotas de modelos ajustados

Límites de embedding de texto

Límites de Vertex AI Agent Engine

¿Qué sigue?

Cuotas y límites de modelos ajustados, incorporación de texto y motor de agentes de Vertex AI