Kontingente und Limits für optimierte Modelle, Texteinbettungen und die Vertex AI-Agent Engine

Auf dieser Seite finden Sie Kontingente für optimierte Modelle, Limits für die Texteinbettung und Kontingente für die Vertex AI-Agent Engine.

Kontingente für abgestimmte Modelle

Die folgenden Kontingente gelten für Generative AI von Vertex AI-Modellen für ein bestimmtes Projekt und eine bestimmte Region:

Kontingent Wert
Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region
* unterstützte Region - europe-west4
64
Eingeschränktes Bildtraining Nvidia A100 80 GB GPUs pro Region
* unterstützte Region – us-central1
* unterstützte Region – us-east4

8
2
* Feinabstimmungsszenarien haben Beschleunigerreservierungen in bestimmten Regionen. Kontingente für die Feinabstimmung werden unterstützt und müssen in bestimmten Regionen angefordert werden.

Einschränkungen bei der Texteinbettung

Jede Anfrage für ein Modell für Text-Embeddings kann bis zu 250 Eingabetexte (1 Embedding pro Eingabetext) und 20.000 Token pro Anfrage enthalten.

Für die Berechnung der Einbettungen werden nur die ersten 8.192 Tokens in jedem Eingabetext verwendet. Jede Anfrage kann nur einen einzelnen Eingabetext enthalten.

Limits der Vertex AI Agent Engine

Für die Vertex AI Agent Engine gelten die folgenden Limits für ein bestimmtes Projekt in den einzelnen Regionen.

Beschreibung Limit
Vertex AI Agent Engine pro Minute erstellen/löschen/aktualisieren 10
Vertex AI Agent Engine-Anfragen vom Typ „Abfrage“/„StreamQuery“ pro Minute 60
Maximale Anzahl von Vertex AI Agent Engine-Ressourcen 100

Nächste Schritte