In diesem Dokument sind die Kontingente und Systemlimits für Vertex AI Agent Builder. Kontingente geben die Menge einer zählbaren, gemeinsam genutzten Ressource an, die Sie verwenden können und die von Google Cloud-Diensten wie Vertex AI Agent Builder. Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Google Cloud-Ressource Ihr Google Cloud-Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Google Cloud-Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud-Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Ihren Verbrauch von Google Cloud-Produkten und -Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Vertex AI Agent Builder-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Zuteilungskontingente
Die folgenden Kontingente werden im Laufe der Zeit nicht zurückgesetzt und stattdessen freigegeben, wenn Sie die Ressource freigeben:
Kontingente | Wert |
---|---|
Anzahl der Dokumente pro Projekt | 1.000.000 |
Anzahl der Dokumente pro Organisation | 5.000.000 |
Anzahl der ausstehenden lang andauernden Importvorgänge pro Projekt | 300 |
Anzahl der ausstehenden Importvorgänge pro Organisation mit langer Ausführungszeit | 1500 |
Anzahl der lang andauernden Vorgänge zum dauerhaften Löschen von Dokumenten pro Projekt | 100 |
Anzahl der lang andauernden Vorgänge zum dauerhaften Löschen von Dokumenten pro Organisation | 500 |
Anzahl der Nutzerereignisse pro Projekt | 40.000.000.000 |
Anzahl der Nutzerereignisse pro Organisation | 200.000.000.000 |
Anfragekontingente
Für Vertex AI Agent Builder-Anfragen gelten die folgenden Kontingente:
Kontingente | Wert |
---|---|
Abgeschlossene Abfrageanfragen pro Minute und Projekt | 300 |
Vollständige Abfrageanfragen pro Minute und Organisation | 1.500 |
Leseanfragen für die Konversationssuche pro Minute und Projekt | 300 |
Leseanfragen für die Konversationssuche pro Minute und Organisation | 500 |
Schreibanfragen pro Minute und Projekt für die Konversationssuche | 300 |
Schreibanfragen für die Konversationssuche pro Minute und Organisation | 500 |
Batchanfragen für Dokumente pro Minute und Projekt | 100 |
Batchanfragen für Dokumente pro Minute und Organisation | 500 |
Leseanfragen pro Minute und Projekt | 300 |
Dokumentleseanfragen pro Minute und Organisation | 1500 |
Schreibanfragen für Dokumente pro Minute und Projekt | 12.000 |
Schreibanfragen für Dokumente pro Minute und Organisation | 60.000 |
Anfragen zur Bewertungserstellung pro Tag und Organisation | 5 |
Erstellungsanfragen für die Bewertung pro Tag und Projekt | 5 |
Leseanfragen für die Bewertung pro Minute und Organisation | 500 |
Leseanfragen für die Bewertung pro Minute und Projekt | 100 |
Bewertungsschreibanfragen pro Minute und Organisation | 500 |
Schreibanfragen für die Bewertung pro Minute und Projekt | 100 |
LLM-Anfrageanfragen (Suchsummarisierung, mehrstufige Suche) pro Minute und Projekt | 15 |
LLM-Abfrageanfragen (Zusammenfassung der Suche, Suche in mehreren Schritten) pro Minute und Organisation | 75 |
Anzahl der ausstehenden FHIR/BQ-Streaming-Schreibvorgänge pro Minute | 6.000 |
Anzahl der Beispielabfragesätze pro Organisation | 500 |
Anzahl der Beispielabfragesätze pro Projekt | 100 |
Anfragen pro Minute und Projekt empfehlen | 60.000 |
Empfehlungen pro Minute und Organisation | Unbegrenzt |
Beispiel: Leseanfragen für Abfragen pro Minute und Organisation | 1000 |
Beispiel für Leseanfragen pro Minute und Projekt | 200 |
Beispiel-Leseanfragen für Abfragesätze pro Minute und Organisation | 500 |
Beispiel-Leseanfragen für Abfragesätze pro Minute und Projekt | 100 |
Beispiel-Schreibanfragen für Abfragesätze pro Minute und Organisation | 500 |
Beispiel für Schreibanfragen pro Minute und Projekt | 100 |
Beispielhafte Schreibanfragen für Abfragen pro Minute und Organisation | 1000 |
Beispielhafte Schreibanfragen für Abfragen pro Minute und Projekt | 200 |
Schemaleseanfragen pro Minute und Projekt | 100 |
Schemaleseanfragen pro Minute und Organisation | 500 |
Schemaschreibanfragen pro Minute und Projekt | 100 |
Schemaschreibanfragen pro Minute und Organisation | 500 |
Suchanfragen pro Minute und Projekt | 300 |
Suchanfragen pro Minute und Organisation | Unbegrenzt |
Batchanfragen von Nutzerereignissen (z. B. Import und Löschung) pro Minute und Projekt | 100 |
Batchanfragen für Nutzerereignisse (z. B. Import und Löschen) pro Minute und Organisation | 500 |
Anfragen zum Erfassen von Nutzerereignissen pro Minute, Projekt und Nutzer | 240 |
Anfragen zum Erfassen von Nutzerereignissen pro Minute, Organisation und Nutzer | 1.200 |
Schreibanfragen für Nutzerereignisse pro Minute und Projekt | 60.000 |
Schreibanfragen für Nutzerereignisse pro Minute und Organisation | 300.000 |
Kontingent für die Indexierung von Webseiten
Wenn Sie einen Datenspeicher mit Erweiterte Website aktiviert ist, können Sie dies auf jeder Webseite, die Sie indexieren, wird auf die „Anzahl der Dokumente pro Projekt“ angerechnet in der Spalte Allocation Kontingentliste. Die Anzahl der Seiten in Ihrem Projekt und das Seitenkontingent für dieses Projekt finden Sie im Feld Projektseiten im Vergleich zum Kontingent auf der Seite Daten für einen Datenspeicher.
Wenn Sie Websites zu einem Datenspeicher in einem Projekt hinzufügen, und die Webseiten in diesen Websites dazu führen, dass das Kontingent für das Projekt überschritten wird, werden die Websites nicht indexiert. Wenn sich in Ihrem Datenspeicher bereits indexierte Websites befinden, werden diese wie bisher indexiert. Sie können jederzeit ein Upgrade Ihres Kontingents beantragen.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung beantragen.