Kontingente

Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Abfragen pro Sekunde (Queries per Second, QPS) für jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.

Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Seite zu den Kontingenten. Wenn Sie Ihren Antrag eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihr Antrag genehmigt oder abgelehnt wurde.

Projekttypen

In den folgenden Kontingenttabellen werden zwei Arten von Projekten aufgeführt: Nutzer- und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte.

CCAI-Transkription

Für diese Funktion wird entweder die Telefonie- oder die gRPC-Integration verwendet, die jeweils unterschiedliche API-Kontingente haben.

Telefonieintegration

Informationen zu den Kontingenten für die APIs, die für die Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.

gRPC-Integration

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
AnalyzeContentOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt AnalyzeContent-/StreamingAnalyzeContent-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 gleichzeitige Anfragen Regional (globaler Traffic wird in der Region us-central1 gezählt) Nutzerprojekt (Ressourcenprojekt für die SipRec-Integration für Telefonie) Gleichzeitige bidirektionale Streaming-Sitzungen pro Region

Sentimentanalyse

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
AnalyzeSentimentOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt Anfragen zur Sentimentanalyse über AnalyzeContent oder StreamingAnalyzeContent
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 Anfragen/Min. Global Nutzerprojekt AnalyzeSentiment- und StreamingAnalyzeSentiment-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.

Eigene Assistenten erstellen

Für diese Funktion werden die folgenden KI-Modelle verwendet:

  • text-bison@001 (Standardlimit 0)
  • (text-bison@002)
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
GeneratorSuggestionOperationsPerMinutePerModelType 10 Anfragen/Min. Global Nutzerprojekt Vorgänge für Generatorvorschläge nach Modelltyp
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 Anfragen/Min. Regional Nutzerprojekt Vorgänge für Generatorvorschläge nach Modelltyp und Region

Zusammenfassung

Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

In der folgenden Tabelle sehen Sie den Kontingenttyp und das Modell, das für die einzelnen Versionen der Zusammenfassung verwendet wird.


Version der Zusammenfassung

Kontingenttyp

Backend-Modell

Generator 4.0

Generatorbasiert

Vortrainiertes Gemini‑2.0-Flash-001

Generator 3.1

Generatorbasiert

Lora-tuned gemini-1.5-flash-001

Generator 3.0

Generatorbasiert

Lora-tuned gemini-1.0-pro-002

Generator 2.1

Generatorbasiert

Lora-tuned text-bison-32k@002

Generator 2.0

Generatorbasiert

Lora-tuned text-bison-32k@002

Generator 1.0

Generatorbasiert

Lora-tuned text-bison@001

Baseline v2

Baseline v2-Modell

text-bison

Baseline v1

Nicht auf Generator basierend

LongT5-Modell

Benutzerdefiniert 2.0

Nicht auf Generator basierend

LongT5-Modell

Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs, die für die Zusammenfassung verwendet werden, berücksichtigt.


Kontingenttyp

Name des Kontingentlimits

Standardwert

Region

Abrechnungsressource/Verbraucherprojekt

Beschreibung

Generatorbasiert

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 Anfragen/Min.

Regional

Nutzerprojekt

Vorgänge für Generatorvorschläge nach Modelltyp und Region

Generatorbasiert

GeneratorSuggestionOperationsPerMinutePerModelType

10 Anfragen/Min.

Global

Nutzerprojekt

Vorgänge für Generatorvorschläge nach Modelltyp

Generatorbasiert

SuggestConversationSummaryOperationsPerMinutePerProject

60 Anfragen/Min.

Global

Ressourcenprojekt

Vorgeschlagene Zusammenfassungen von Unterhaltungen

Nicht auf Generator basierend

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0–2 Anfragen/Min.

Regional

Ressourcenprojekt

Vorgänge zum Zusammenfassen von Unterhaltungen in jeder Region vorschlagen

Baseline v2-Modell

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 Anfragen/Min.

Global

Ressourcenprojekt

V2-Baseline-Polling-Anfragen für Zusammenfassungsvorschläge für Unterhaltungen

Baseline v2-Modell

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 Anfragen/Min.

Regional

Ressourcenprojekt

Baseline-Polling-Anfragen für die Funktion „Zusammenfassung von Unterhaltungen“ V2 in jeder Region

Automatische Bewertung der Zusammenfassung

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
ConcurrentSummarizationEvaluationsPerProject 1 Anfrage pro Projekt Nutzerprojekt Anfragen zur automatischen Bewertung

Wenn Sie zusätzliche Kontingente für gleichzeitige Vorgänge benötigen, stellen Sie einen Antrag über die Google Cloud Console. Dieses Feature kann bis zu vier gleichzeitige Kontingente pro Projekt unterstützen.

Unterstützung durch generative KI

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
SearchKnowledgeOperationsPerMinutePerProject 60 Anfragen/Min. Global Nutzerprojekt SearchKnowledge-Anfragen

Proaktive Unterstützung durch generative KI

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 Anfragen/Min. Global Ressourcenprojekt KnowledgeAssist-Anfragen über AnalyzeContent oder SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 Anfragen/Min. Regional Ressourcenprojekt KnowledgeAssist-Anfragen über AnalyzeContent oder SuggestKnowledgeAssist in jeder Region

Weitere API-Kontingente

Name des Kontingentlimits Standardwert Region Abrechnungsressource/Verbraucherprojekt Beschreibung
ConversationOperationsPerMinutePerProject 300 Anfragen/Min. Global Nutzerprojekt Andere Unterhaltungsanfragen als AnalyzeContent und StreamingAnalyzeContent, z. B. CreateConversation und CompleteConversation. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
MessagePollingOperationsPerMinutePerProject 1.200 Anfragen / Min. Global Nutzerprojekt ListMessages-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
AnswerRecordOperationsPerMinutePerProject 300 Anfragen / Min. Global Nutzerprojekt AnswerRecord-Anfragen