Auf dieser Seite finden Sie Kontingente für optimierte Modelle, Limits für die Texteinbettung und Kontingente für die Vertex AI-Agent Engine.
Kontingente für abgestimmte Modelle
Die folgenden Kontingente gelten für Generative AI von Vertex AI-Modellen für ein bestimmtes Projekt und eine bestimmte Region:
Kontingent | Wert |
---|---|
Eingeschränkte Image-Trainings-TPU V3 Pod-Kerne pro Region * unterstützte Region - europe-west4 |
64 |
Eingeschränktes Bildtraining Nvidia A100 80 GB GPUs pro Region * unterstützte Region – us-central1 * unterstützte Region – us-east4 |
8 2 |
Einschränkungen bei der Texteinbettung
Jede Anfrage für ein Modell für Text-Embeddings kann bis zu 250 Eingabetexte (1 Embedding pro Eingabetext) und 20.000 Token pro Anfrage enthalten.
Für die Berechnung der Einbettungen werden nur die ersten 8.192 Tokens in jedem Eingabetext verwendet. Jede Anfrage kann nur einen einzelnen Eingabetext enthalten.
Limits der Vertex AI Agent Engine
Für die Vertex AI Agent Engine gelten die folgenden Limits für ein bestimmtes Projekt in den einzelnen Regionen.
Beschreibung | Limit |
---|---|
Vertex AI Agent Engine pro Minute erstellen/löschen/aktualisieren | 10 |
Vertex AI Agent Engine-Anfragen vom Typ „Abfrage“/„StreamQuery“ pro Minute | 60 |
Maximale Anzahl von Vertex AI Agent Engine-Ressourcen | 100 |
Nächste Schritte
- Weitere Informationen zu Kontingenten und Limits für Vertex AI finden Sie unter Vertex AI-Kontingente und -Limits.
- Weitere Informationen zu Google Cloud Kontingenten und Limits finden Sie unter Informationen zu Kontingentwerten und Systemlimits.