In diesem Dokument sind die Kontingente und Limits für Vertex AI Agent Builder aufgeführt.
- Kontingente geben an, wie viel einer zählbaren, freigegebenen Ressource Sie verwenden können. Kontingente werden von Google Cloud Diensten wie Vertex AI Agent Builder definiert.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um Fairness zu gewährleisten und Spitzen bei Ressourcennutzung und -verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einerGoogle Cloud Ressource Ihr Google Cloud Projekt nutzen darf. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Die Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community derGoogle Cloud -Nutzer schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Google Cloud Ressourcen.
Das Cloud-Kontingentsystem ermöglicht Folgendes:
- Verbrauch von Google Cloud Produkten und Diensten überwachen
- Ihren Verbrauch dieser Ressourcen einschränken
- Eine Möglichkeit bieten, Änderungen am Kontingentwert anzufordern
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie ausführen möchten, schlägt fehl.
Kontingente gelten in der Regel auf Google Cloud-Projektebene. Ihre Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf Ihr verfügbares Kontingent in einem anderen Projekt. Innerhalb eines Google Cloud-Projekts werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für Vertex AI Agent Builder-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Zuteilungskontingente
Die folgenden Kontingente werden im Laufe der Zeit nicht zurückgesetzt und stattdessen freigegeben, wenn Sie die Ressource freigeben. Wenn das Standardkontingent nicht ausreicht, können Sie eine Kontingenterhöhung beantragen.
Kontingente | Wert |
---|---|
Anzahl der Dokumente pro Projekt | 1.000.000 |
Anzahl der Datenspeicher pro Projekt | 100* |
Anzahl der Engines pro Projekt | 100† |
Anzahl der ausstehenden lang andauernden Importvorgänge pro Projekt | 300 |
Anzahl der ausstehenden lang andauernden Vorgänge zum Löschen von Dokumenten pro Projekt | 100 |
Anzahl der Bereitstellungssteuerungen pro Projekt | 1.000 |
Anzahl der Steuerelemente für die optimierte Auslieferung pro Bereitstellungskonfiguration | 100 |
Anzahl der Filterbereitstellungssteuerungen pro Bereitstellungskonfiguration | 100 |
Anzahl der Steuerelemente für die Weiterleitungsbereitstellung pro Bereitstellungskonfiguration | 100 |
Anzahl der Steuerelemente für die Bereitstellung von Synonyme pro Bereitstellungskonfiguration | 100 |
Anzahl der Nutzerereignisse pro Projekt | 40.000.000.000 |
* Aufgrund einer technischen Einschränkung beträgt das maximale Kontingent für Datenspeicher 500 pro Projekt. Wenn Sie mehr Datenspeicher benötigen, verwenden Sie neue Projekte.
† Aufgrund einer technischen Einschränkung beträgt das maximale Kontingent für Engines 500 pro Projekt. Wenn Sie mehr Engines benötigen, verwenden Sie neue Projekte.
Anfragekontingente
Für Vertex AI Agent Builder API-Anfragen gelten die folgenden Kontingente. Wenn das Standardkontingent nicht ausreicht, können Sie eine Kontingenterhöhung beantragen.
Kontingente | Wert |
---|---|
Abgeschlossene Abfrageanfragen pro Minute und Projekt | 300 |
Leseanfragen pro Minute und Projekt für die Konversationssuche | 300 |
Schreibanfragen pro Minute und Projekt für die Konversationssuche | 300 |
Batchanfragen für Dokumente (z. B. Inline-Import und Löschen) pro Minute und Projekt | 100 |
Anfragen pro Minute und Projekt für den asynchronen Import von Dokumenten (Cloud Storage, BigQuery usw.) | 5 |
Anfragen zum Löschen von Dokumenten pro Minute und Projekt | 100 |
Leseanfragen pro Minute und Projekt | 300 |
Schreibanfragen pro Minute und Projekt | 12.000 |
Erstellungsanfragen für Bewertungen pro Tag und Projekt | 5 |
Leseanfragen für die Bewertung pro Minute und Projekt | 100 |
Schreibanfragen für die Bewertung pro Minute und Projekt | 100 |
LLM-Anfrageanfragen (Suchsummarisierung, mehrstufige Suche) pro Minute und Projekt | 60 |
Anzahl der ausstehenden FHIR- oder BigQuery-Streaming-Schreibvorgänge pro Minute | 6.000 |
Anzahl der Beispielabfragesätze pro Projekt | 100 |
Ranking von API-Anfragen pro Minute und Projekt | 500 |
Empfehlungen pro Minute und Projekt | 60.000 |
Beispiel für Leseanfragen pro Minute und Projekt | 200 |
Leseanfragen pro Minute und Projekt für Beispielabfragesätze | 100 |
Beispiel für Schreibanfragen pro Minute und Projekt | 100 |
Beispiel für Schreibanfragen pro Minute und Projekt | 200 |
Schemaleseanfragen pro Minute und Projekt | 100 |
Schemaschreibanfragen pro Minute und Projekt | 100 |
Suchanfragen pro Minute und Projekt | 300 |
Batchanfragen für Nutzerereignisse (z. B. Import und Löschen) pro Minute und Projekt | 100 |
Nutzerereignis – Anfragen zum Erfassen pro Minute, Projekt und Nutzer | 240 |
Schreibanfragen für Nutzerereignisse pro Minute und Projekt | 60.000 |
Kontingent für die Indexierung von Webseiten
Wenn für einen Datenspeicher die erweiterte Websiteindexierung aktiviert ist, wird jede von Ihnen indexierte Webseite auf das Kontingent „Anzahl der Dokumente pro Projekt“ in der Liste Zuweisungskontingente angerechnet. Die Anzahl der Seiten in Ihrem Projekt und das Seitenkontingent für dieses Projekt finden Sie im Feld Projektseiten im Vergleich zum Kontingent auf der Seite Daten für einen Datenspeicher.
Wenn Sie einem Datenspeicher in einem Projekt Websites hinzufügen und das Kontingent für das Projekt durch die Webseiten auf diesen Websites überschritten wird, werden die Websites nicht indexiert. Wenn sich in Ihrem Datenspeicher bereits indexierte Websites befinden, werden diese wie bisher indexiert. Sie können jederzeit ein Upgrade Ihres Kontingents beantragen.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung beantragen.