Kontingente

In diesem Dokument sind die Kontingente und Systemlimits für Document AI aufgeführt.

  • Kontingente haben Standardwerte, aber Sie können in der Regel Anpassungen anfordern.
  • Systemlimits sind feste Werte, die nicht geändert werden können.

Google Cloud nutzt Kontingente, um für Fairness zu sorgen und Spitzen bei der Ressourcennutzung und ‑verfügbarkeit zu reduzieren. Ein Kontingent schränkt ein, wie viel von einer Ressource vonGoogle Cloud Ihr Projekt von Google Cloud nutzen kann. Kontingente gelten für eine Reihe von Ressourcentypen, einschließlich Hardware, Software und Netzwerkkomponenten. Mit Kontingenten können Sie beispielsweise die Anzahl der API-Aufrufe an einen Dienst, die Anzahl der von Ihrem Projekt gleichzeitig verwendeten Load Balancer oder die Anzahl der Projekte begrenzen, die Sie erstellen können. Kontingente sollen eine Überlastung von Diensten verhindern und dadurch die Community der Nutzer vonGoogle Cloud schützen. Sie helfen Ihnen auch bei der Verwaltung Ihrer eigenen Ressourcen von Google Cloud .

Das Cloud-Kontingentsystem tut Folgendes:

Wenn Sie versuchen, mehr von einer Ressource zu verbrauchen, als das Kontingent zulässt, blockiert das System in den meisten Fällen den Zugriff auf die Ressource. Die Aufgabe, die Sie auszuführen versuchen, schlägt dann fehl.

Kontingente gelten in der Regel auf der Ebene des Projekts von Google Cloud . Die Nutzung einer Ressource in einem Projekt hat keinen Einfluss auf das verfügbare Kontingent in einem anderen Projekt. Innerhalb eines Projekts von Google Cloud werden die Kontingente für alle Anwendungen und IP-Adressen gemeinsam genutzt.

In diesem Dokument sind die Kontingente für Document AI aufgeführt.

Dienststufen

Document AI unterstützt zwei Service-Stufen und die zugehörigen Kontingente für Online-Verarbeitungsanfragen an auf generativer KI basierende Prozessorversionen: die Stufen „Bereitgestellt“ und „Best Effort“.

Das Kontingent für die bereitgestellte Stufe umfasst 120 Seiten pro Minute für Basisprozessorversionen wie benutzerdefinierter Extraktor v1.4 und v1.5 sowie 30 Seiten pro Minute für Basisprozessorversionen wie benutzerdefinierter Extraktor v1.5 Pro.

Das Best-Effort-Kontingent umfasst 120 für Basisprozessorversionen wie den benutzerdefinierten Extraktor v1.4 und v1.5 sowie 60 für Pro-Prozessorversionen wie den benutzerdefinierten Extraktor v1.5 Pro. Es wird erst verwendet, wenn das bereitgestellte Kontingent aufgebraucht ist. Dies gilt für Kontingente BestEffortOnlineProcessDocumentPagesPerMinutePerProjectUS (Messwert best_effort_online_process_document_pages_us) und BestEffortOnlineProcessDocumentPagesPerMinutePerProjectEU (Messwert best_effort_online_process_document_pages_eu) in der Console.

Hinweise Benutzerdefinierter Extrahierer v1.4 (basierend auf Gemini 2.0 Flash) Benutzerdefinierter Extraktor v1.5 (basierend auf Gemini 2.5 Flash) Benutzerdefinierter Extraktor v1.5 Pro (basierend auf Gemini 2.5 Pro)
Aktiv 120 120 30
Beste Leistung 120 120 60
Auf Organisationsebene bereitgestellt 240 240 60

Wenn Sie mehr als die in den Best-Effort-Kontingenten aufgeführten Kontingente benötigen, können Sie eine Anfrage zur Kontingenterhöhung stellen. Wenden Sie sich dazu an Ihren Vertriebsmitarbeiter.

Für die Best-Effort-Stufe gibt es kein Service Level Agreement.

Liste der Kontingente

Für Document AI gelten die folgenden Kontingente. Die Kontingente gelten für alle Google Cloud Console-Projekte sowie für alle Anwendungen und IP-Adressen, die dieses Projekt verwenden, gemeinsam.

Wenn Sie mehr Anfragen verarbeiten möchten, senden Sie uns in der Google Cloud -Konsole eine Document AI-Kontingentanfrage zu Ihrem Projekt.

Geben Sie in der Anfrage Informationen zu Ihren spezifischen Anforderungen und Ihrem Anwendungsfall an.

Anfragekontingent Standardwert Hinweise
Anfragen pro Minute 1.800 pro Nutzer Kontingent in der Google Cloud Console ansehen
Anfragen für Onlineprozesse pro Minute (nur v1beta2) 600 pro Projekt Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute (USA) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute (EU) 120 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.4 mit Gemini 2.0 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (USA) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten für die Onlineverarbeitung von Dokumenten (EU) pro Minute und Prozessortyp und Modellversion (nur Custom Extractor v1.5 mit Gemini 2.5 Flash) 120 Seiten pro Minute* Kontingent in der Google Cloud Console ansehen
Onlineanfragen pro Minute verarbeiten (einzelne Region) 6 pro Projekt und Prozessortyp Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Projekt und Region (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Projekt und Region (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Batchprozessanfragen pro Prozessor (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Anzahl der Seiten in aktiver Verarbeitung (nur v1beta2) 10.000 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für das Training von Prozessorversionen (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für das Training von Prozessorversionen (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Trainingsanfragen für Prozessorversionen (einzelne Region) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (USA) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (EU) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte benutzerdefinierte Prozessorversionen (einzelne Region) 5 pro Projekt Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (USA) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (EU) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Bereitgestellte generative Prozessorversionen (Einzelregion) 100 pro Projekt und benutzerdefiniertem Extraktionsprozessor Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Importdokumente (USA) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Importdokumente (EU) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen zum Importieren von Dokumenten (einzelne Region) 3 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für Exportdokumente (USA) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für den Export von Dokumenten (EU) 1 pro Projekt Kontingent in der Google Cloud Console ansehen
Gleichzeitige Anfragen für den Export von Dokumenten (einzelne Region) 1 pro Projekt Kontingent in der Google Cloud Console ansehen

* Anfragen zur Kontingentanpassung werden für diese Version noch nicht unterstützt.

 Wird in australia-southeast1 mit einer Anfrage zur Kontingentanpassung unterstützt.