In diesem Dokument sind die Kontingente und Systemlimits für AI Applications aufgeführt.
- Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
- Systemlimits sind feste Werte, die nicht geändert werden können.
Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Ressource vonGoogle Cloud Ihr Projekt von Google Cloud nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Ressourcen von Google Cloud .
Das Cloud-Kontingentsystem tut Folgendes:
- Es überwacht Ihren Verbrauch von Produkten und Diensten von Google Cloud .
- Es schränkt Ihren Verbrauch dieser Ressourcen ein.
- Es bietet eine Möglichkeit, Änderungen am Kontingentwert zu beantragen und Kontingentanpassungen zu automatisieren.
Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.
Kontingente gelten in der Regel auf der Ebene des Projekts von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Projekts von Google Cloud werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.
Für AI Applications-Ressourcen gelten außerdem Systemlimits. Systemlimits können nicht geändert werden.
Zuteilungskontingente
In der folgenden Tabelle sind die Kontingente für die Discovery Engine API aufgeführt. Diese Kontingente werden im Laufe der Zeit nicht zurückgesetzt. Stattdessen werden sie freigegeben, wenn Sie die Ressource freigeben. Wenn das Standardkontingent nicht ausreicht, können Sie eine Kontingenterhöhung anfordern.
Kontingent | Wert |
---|---|
Gesamtzahl der Datenspeicher pro Projekt | 100* |
Gesamtzahl der Engines pro Projekt | 150† |
Anzahl der ausstehenden lang andauernden Importvorgänge pro Projekt | 300 |
Anzahl der ausstehenden lang andauernden Vorgänge zum Bereinigen von Dokumenten pro Projekt | 100 |
Anzahl der Bereitstellungssteuerungen pro Projekt | 1.000 |
Anzahl der Steuerelemente für die Boost-Bereitstellung pro Bereitstellungskonfiguration | 100 |
Anzahl der Filterbereitstellungssteuerungen pro Bereitstellungskonfiguration | 100 |
Anzahl der Weiterleitungssteuerungen pro Bereitstellungskonfiguration | 100 |
Anzahl der Synonym-Bereitstellungssteuerungen pro Bereitstellungskonfiguration | 100 |
Regionale Anzahl von Datenspeichern pro Projekt und Standort (Global, USA, EU) | 100 |
Regionale Anzahl der Dokumente pro Projekt und Standort (global, USA, EU) | 10.000.000 |
Regionale Anzahl von Engines pro Projekt und Standort (global, USA, EU) | 150 |
Regionale Anzahl der Nutzerereignisse pro Projekt und Standort (Global, USA, EU) | 40.000.000.000 |
* Aufgrund einer technischen Einschränkung beträgt das maximale Kontingent für Datenspeicher 500 pro Projekt. Wenn Sie weitere Datenspeicher benötigen, verwenden Sie neue Projekte.
† Aus technischen Gründen beträgt das maximale Kontingent für Engines 500 pro Projekt. Wenn Sie mehr Engines benötigen, verwenden Sie neue Projekte.
Ratenkontingente
Für Discovery Engine API-Anfragen gelten die folgenden Kontingente. Wenn das Standardkontingent nicht ausreicht, können Sie eine Kontingenterhöhung anfordern.
Kontingent | Wert |
---|---|
Vollständige Anfragen pro Minute und Projekt | 300 |
Leseanfragen für die konversationelle Suche pro Minute und Projekt | 300 |
Schreibanfragen für die konversationelle Suche pro Minute und Projekt | 300 |
Dokument-Batchanfragen (z. B. Inline-Import und Bereinigung) pro Minute und Projekt | 100 |
Dokumentieren Sie asynchrone Importanfragen (Cloud Storage, BigQuery usw.) pro Minute und Projekt. | 5 |
Anfragen zum Löschen von Dokumenten pro Minute und Projekt | 100 |
Dokumentleseanfragen pro Minute und Projekt | 300 |
Dokument-Schreibanfragen pro Minute und Projekt | 12.000 |
Erstellungsanfragen für Bewertungen pro Tag und Projekt | 5 |
Leseanfragen für die Bewertung pro Minute und Projekt | 100 |
Bewertungsschreibanfragen pro Minute und Projekt | 100 |
Anfragen zum Überprüfen der Fundierung von generierten Inhalten pro Minute und Projekt | 300 |
LLM-Anfragen (Zusammenfassung der Suche, Suche mit mehreren Anfragen) pro Minute und Projekt | 60 |
Anzahl der ausstehenden FHIR- oder BigQuery-Streaming-Schreibvorgänge pro Minute | 6.000 |
Anzahl der Beispielabfragesätze pro Projekt | 100 |
Ranking API-Anfragen pro Minute und Projekt | 500 |
Empfehlungsanfragen pro Minute und Projekt | 60.000 |
Leseanfragen für Beispielabfragen pro Minute und Projekt | 200 |
Leseanfragen für Beispielanfragesätze pro Minute und Projekt | 100 |
Schreibanfragen für Beispielanfragesätze pro Minute und Projekt | 100 |
Beispiel für Schreibanfragen pro Minute und Projekt | 200 |
Schemaleseanfragen pro Minute und Projekt | 100 |
Schema-Schreibanfragen pro Minute und Projekt | 100 |
Regionale Suchanfragen pro Minute und Projekt und Standort (Global, USA, EU) | 300 |
Batchanfragen für Nutzerereignisse (z. B. Import und Bereinigung) pro Minute und Projekt | 100 |
Anfragen zum Erfassen von Nutzerereignissen pro Minute, Projekt und Nutzer | 240 |
Schreibanfragen für Nutzerereignisse pro Minute und Projekt | 60.000 |
Kontingent für die Indexierung von Webseiten
Wenn Sie einen Datenspeicher mit aktivierter erweiterter Website-Indexierung haben, wird jede von Ihnen indexierte Webseite auf das Kontingent „Anzahl der Dokumente pro Projekt“ in der Liste Zuweisungskontingente angerechnet. Die Anzahl der Seiten in Ihrem Projekt und das Seitenkontingent für dieses Projekt finden Sie auch auf der Seite Daten eines Datenspeichers im Feld Projektseiten im Vergleich zum Kontingent.
Wenn Sie einem Datenspeicher in einem Projekt Websites hinzufügen und die Webseiten auf diesen Websites das Kontingent des Projekts überschreiten, werden die Websites nicht indexiert. Wenn in Ihrem Datenspeicher Websites vorhanden sind, die bereits indexiert sind, werden diese weiterhin wie bisher indexiert. Sie können jederzeit ein Upgrade für Ihr Kontingent anfordern.
Kontingenterhöhung anfordern
Verwenden Sie die Google Cloud Console, um die meisten Kontingente anzupassen. Weitere Informationen finden Sie unter Kontingentanpassung anfordern.