Diese Seite wurde von der Cloud Translation API übersetzt.

Kontingente

Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Abfragen pro Sekunde (Queries per Second, QPS) für jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.

Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Seite zu den Kontingenten. Wenn Sie Ihren Antrag eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihr Antrag genehmigt oder abgelehnt wurde.

Projekttypen

In den folgenden Kontingenttabellen werden zwei Arten von Projekten aufgeführt: Nutzer- und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte.

CCAI-Transkription

Für diese Funktion wird entweder die Telefonie- oder die gRPC-Integration verwendet, die jeweils unterschiedliche API-Kontingente haben.

Telefonieintegration

Informationen zu den Kontingenten für die APIs, die für die Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.

gRPC-Integration

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
AnalyzeContentOperationsPerMinutePerProject	300 Anfragen/Min.	Global	Nutzerprojekt	AnalyzeContent-/StreamingAnalyzeContent-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 gleichzeitige Anfragen	Regional (globaler Traffic wird in der Region `us-central1` gezählt)	Nutzerprojekt (Ressourcenprojekt für die SipRec-Integration für Telefonie)	Gleichzeitige bidirektionale Streaming-Sitzungen pro Region

Sentimentanalyse

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
AnalyzeSentimentOperationsPerMinutePerProject	300 Anfragen/Min.	Global	Nutzerprojekt	Anfragen zur Sentimentanalyse über AnalyzeContent oder StreamingAnalyzeContent
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 Anfragen/Min.	Global	Nutzerprojekt	AnalyzeSentiment- und StreamingAnalyzeSentiment-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.

Eigene Assistenten erstellen

Für diese Funktion werden die folgenden KI-Modelle verwendet:

text-bison@001 (Standardlimit 0)
(text-bison@002)
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
GeneratorSuggestionOperationsPerMinutePerModelType	10 Anfragen/Min.	Global	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 Anfragen/Min.	Regional	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp und Region

Zusammenfassung

Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0

In der folgenden Tabelle sehen Sie den Kontingenttyp und das Modell, das für die einzelnen Versionen der Zusammenfassung verwendet wird.

Version der Zusammenfassung	Kontingenttyp	Backend-Modell
Generator 4.0	Generatorbasiert	Vortrainiertes Gemini‑2.0-Flash-001
Generator 3.1	Generatorbasiert	Lora-tuned gemini-1.5-flash-001
Generator 3.0	Generatorbasiert	Lora-tuned gemini-1.0-pro-002
Generator 2.1	Generatorbasiert	Lora-tuned text-bison-32k@002
Generator 2.0	Generatorbasiert	Lora-tuned text-bison-32k@002
Generator 1.0	Generatorbasiert	Lora-tuned text-bison@001
Baseline v2	Baseline v2-Modell	text-bison
Baseline v1	Nicht auf Generator basierend	LongT5-Modell
Benutzerdefiniert 2.0	Nicht auf Generator basierend	LongT5-Modell

Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs, die für die Zusammenfassung verwendet werden, berücksichtigt.

Kontingenttyp	Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
Generatorbasiert	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 Anfragen/Min.	Regional	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp und Region
Generatorbasiert	GeneratorSuggestionOperationsPerMinutePerModelType	10 Anfragen/Min.	Global	Nutzerprojekt	Vorgänge für Generatorvorschläge nach Modelltyp
Generatorbasiert	SuggestConversationSummaryOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Ressourcenprojekt	Vorgeschlagene Zusammenfassungen von Unterhaltungen
Nicht auf Generator basierend	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0–2 Anfragen/Min.	Regional	Ressourcenprojekt	Vorgänge zum Zusammenfassen von Unterhaltungen in jeder Region vorschlagen
Baseline v2-Modell	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 Anfragen/Min.	Global	Ressourcenprojekt	V2-Baseline-Polling-Anfragen für Zusammenfassungsvorschläge für Unterhaltungen
Baseline v2-Modell	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 Anfragen/Min.	Regional	Ressourcenprojekt	Baseline-Polling-Anfragen für die Funktion „Zusammenfassung von Unterhaltungen“ V2 in jeder Region

Automatische Bewertung der Zusammenfassung

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
ConcurrentSummarizationEvaluationsPerProject	1 Anfrage pro Projekt	Nutzerprojekt	Anfragen zur automatischen Bewertung

Wenn Sie zusätzliche Kontingente für gleichzeitige Vorgänge benötigen, stellen Sie einen Antrag über die Google Cloud Console. Dieses Feature kann bis zu vier gleichzeitige Kontingente pro Projekt unterstützen.

Unterstützung durch generative KI

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
SearchKnowledgeOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Nutzerprojekt	SearchKnowledge-Anfragen

Proaktive Unterstützung durch generative KI

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 Anfragen/Min.	Global	Ressourcenprojekt	KnowledgeAssist-Anfragen über AnalyzeContent oder SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 Anfragen/Min.	Regional	Ressourcenprojekt	KnowledgeAssist-Anfragen über AnalyzeContent oder SuggestKnowledgeAssist in jeder Region

Weitere API-Kontingente

Name des Kontingentlimits	Standardwert	Region	Abrechnungsressource/Verbraucherprojekt	Beschreibung
ConversationOperationsPerMinutePerProject	300 Anfragen/Min.	Global	Nutzerprojekt	Andere Unterhaltungsanfragen als AnalyzeContent und StreamingAnalyzeContent, z. B. CreateConversation und CompleteConversation. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
MessagePollingOperationsPerMinutePerProject	1.200 Anfragen / Min.	Global	Nutzerprojekt	ListMessages-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt.
AnswerRecordOperationsPerMinutePerProject	300 Anfragen / Min.	Global	Nutzerprojekt	AnswerRecord-Anfragen

Kontingente Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.