Diese Seite wurde von der Cloud Translation API übersetzt.

Kontingente und Limits für optimierte Modelle, Texteinbettungen und die Vertex AI-Agent Engine

Auf dieser Seite finden Sie Kontingente für optimierte Modelle, Limits für die Texteinbettung und Kontingente für die Vertex AI-Agent Engine.

Kontingente für abgestimmte Modelle

Die folgenden Kontingente gelten für Generative AI von Vertex AI-Modellen für ein bestimmtes Projekt und eine bestimmte Region:

Kontingent	Wert
Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region * unterstützte Region - europe-west4	64
Eingeschränktes Bildtraining Nvidia A100 80 GB GPUs pro Region * unterstützte Region – us-central1 * unterstützte Region – us-east4	8 2

* Feinabstimmungsszenarien haben Beschleunigerreservierungen in bestimmten Regionen. Kontingente für die Feinabstimmung werden unterstützt und müssen in bestimmten Regionen angefordert werden.

Einschränkungen bei der Texteinbettung

Jede Anfrage für ein Modell für Text-Embeddings kann bis zu 250 Eingabetexte (1 Embedding pro Eingabetext) und 20.000 Token pro Anfrage enthalten.

Für die Berechnung der Einbettungen werden nur die ersten 8.192 Tokens in jedem Eingabetext verwendet. Jede Anfrage kann nur einen einzelnen Eingabetext enthalten.

Limits der Vertex AI Agent Engine

Für die Vertex AI Agent Engine gelten die folgenden Limits für ein bestimmtes Projekt in den einzelnen Regionen.

Beschreibung	Limit
Vertex AI Agent Engine pro Minute erstellen/löschen/aktualisieren	10
Vertex AI Agent Engine-Anfragen vom Typ „Abfrage“/„StreamQuery“ pro Minute	60
Maximale Anzahl von Vertex AI Agent Engine-Ressourcen	100

Nächste Schritte

Weitere Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
Weitere Informationen zu Google Cloud Kontingenten und Limits finden Sie unter Informationen zu Kontingentwerten und Systemlimits.

Kontingente und Limits für optimierte Modelle, Texteinbettungen und die Vertex AI-Agent Engine Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Kontingente für abgestimmte Modelle

Einschränkungen bei der Texteinbettung

Limits der Vertex AI Agent Engine

Nächste Schritte

Kontingente und Limits für optimierte Modelle, Texteinbettungen und die Vertex AI-Agent Engine