Eine genaue Kontingentschätzung basiert auf der Anzahl Ihrer Abfragen pro Sekunde (Queries per Second, QPS) für jede API. In den folgenden Abschnitten werden die Kontingente für APIs beschrieben, die mit den einzelnen Agent Assist-Funktionen verwendet werden.
Weitere Informationen zum Anfordern einer Kontingenterhöhung finden Sie auf der Seite zu den Kontingenten. Wenn Sie Ihren Antrag eingereicht haben, bittet Google Sie möglicherweise um weitere Informationen und teilt Ihnen mit, ob Ihr Antrag genehmigt oder abgelehnt wurde.
Projekttypen
In den folgenden Kontingenttabellen werden zwei Arten von Projekten aufgeführt: Nutzer- und Ressourcenprojekte. Definitionen dieser beiden Projekttypen finden Sie in der Dokumentation zur Verwendung mehrerer Projekte.
CCAI-Transkription
Für diese Funktion wird entweder die Telefonie- oder die gRPC-Integration verwendet, die jeweils unterschiedliche API-Kontingente haben.
Telefonieintegration
Informationen zu den Kontingenten für die APIs, die für die Telefonieintegration verwendet werden, finden Sie unter Dialogflow-Kontingente.
gRPC-Integration
Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Verbraucherprojekt | Beschreibung |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 300 Anfragen/Min. | Global | Nutzerprojekt | AnalyzeContent-/StreamingAnalyzeContent-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 gleichzeitige Anfragen | Regional (globaler Traffic wird in der Region us-central1 gezählt) |
Nutzerprojekt (Ressourcenprojekt für die SipRec-Integration für Telefonie) | Gleichzeitige bidirektionale Streaming-Sitzungen pro Region |
Sentimentanalyse
Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Verbraucherprojekt | Beschreibung |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 300 Anfragen/Min. | Global | Nutzerprojekt | Anfragen zur Sentimentanalyse über AnalyzeContent oder StreamingAnalyzeContent |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 Anfragen/Min. | Global | Nutzerprojekt | AnalyzeSentiment- und StreamingAnalyzeSentiment-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt. |
Eigene Assistenten erstellen
Für diese Funktion werden die folgenden KI-Modelle verwendet:
- text-bison@001 (Standardlimit 0)
- (text-bison@002)
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Verbraucherprojekt | Beschreibung |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 10 Anfragen/Min. | Global | Nutzerprojekt | Vorgänge für Generatorvorschläge nach Modelltyp |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 Anfragen/Min. | Regional | Nutzerprojekt | Vorgänge für Generatorvorschläge nach Modelltyp und Region |
Zusammenfassung
Für die KI-generierte Zusammenfassung werden die folgenden Modelle verwendet:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
In der folgenden Tabelle sehen Sie den Kontingenttyp und das Modell, das für die einzelnen Versionen der Zusammenfassung verwendet wird.
Version der Zusammenfassung |
Kontingenttyp |
Backend-Modell |
---|---|---|
Generator 4.0 |
Generatorbasiert |
Vortrainiertes Gemini‑2.0-Flash-001 |
Generator 3.1 |
Generatorbasiert |
Lora-tuned gemini-1.5-flash-001 |
Generator 3.0 |
Generatorbasiert |
Lora-tuned gemini-1.0-pro-002 |
Generator 2.1 |
Generatorbasiert |
Lora-tuned text-bison-32k@002 |
Generator 2.0 |
Generatorbasiert |
Lora-tuned text-bison-32k@002 |
Generator 1.0 |
Generatorbasiert |
Lora-tuned text-bison@001 |
Baseline v2 |
Baseline v2-Modell |
text-bison |
Baseline v1 |
Nicht auf Generator basierend |
LongT5-Modell |
Benutzerdefiniert 2.0 |
Nicht auf Generator basierend |
LongT5-Modell |
Die Kontingenttypen in der vorherigen Tabelle werden in der folgenden Kontingentliste für APIs, die für die Zusammenfassung verwendet werden, berücksichtigt.
Kontingenttyp |
Name des Kontingentlimits |
Standardwert |
Region |
Abrechnungsressource/Verbraucherprojekt |
Beschreibung |
---|---|---|---|---|---|
Generatorbasiert |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 Anfragen/Min. |
Regional |
Nutzerprojekt |
Vorgänge für Generatorvorschläge nach Modelltyp und Region |
Generatorbasiert |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 Anfragen/Min. |
Global |
Nutzerprojekt |
Vorgänge für Generatorvorschläge nach Modelltyp |
Generatorbasiert |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 Anfragen/Min. |
Global |
Ressourcenprojekt |
Vorgeschlagene Zusammenfassungen von Unterhaltungen |
Nicht auf Generator basierend |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0–2 Anfragen/Min. |
Regional |
Ressourcenprojekt |
Vorgänge zum Zusammenfassen von Unterhaltungen in jeder Region vorschlagen |
Baseline v2-Modell |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 Anfragen/Min. |
Global |
Ressourcenprojekt |
V2-Baseline-Polling-Anfragen für Zusammenfassungsvorschläge für Unterhaltungen |
Baseline v2-Modell |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 Anfragen/Min. |
Regional |
Ressourcenprojekt |
Baseline-Polling-Anfragen für die Funktion „Zusammenfassung von Unterhaltungen“ V2 in jeder Region |
Automatische Bewertung der Zusammenfassung
Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Verbraucherprojekt | Beschreibung |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 1 Anfrage pro Projekt | Nutzerprojekt | Anfragen zur automatischen Bewertung |
Wenn Sie zusätzliche Kontingente für gleichzeitige Vorgänge benötigen, stellen Sie einen Antrag über die Google Cloud Console. Dieses Feature kann bis zu vier gleichzeitige Kontingente pro Projekt unterstützen.
Unterstützung durch generative KI
Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Verbraucherprojekt | Beschreibung |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 60 Anfragen/Min. | Global | Nutzerprojekt | SearchKnowledge-Anfragen |
Proaktive Unterstützung durch generative KI
Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Verbraucherprojekt | Beschreibung |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 Anfragen/Min. | Global | Ressourcenprojekt | KnowledgeAssist-Anfragen über AnalyzeContent oder SuggestKnowledgeAssist |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 Anfragen/Min. | Regional | Ressourcenprojekt | KnowledgeAssist-Anfragen über AnalyzeContent oder SuggestKnowledgeAssist in jeder Region |
Weitere API-Kontingente
Name des Kontingentlimits | Standardwert | Region | Abrechnungsressource/Verbraucherprojekt | Beschreibung |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 300 Anfragen/Min. | Global | Nutzerprojekt | Andere Unterhaltungsanfragen als AnalyzeContent und StreamingAnalyzeContent, z. B. CreateConversation und CompleteConversation. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt. |
MessagePollingOperationsPerMinutePerProject | 1.200 Anfragen / Min. | Global | Nutzerprojekt | ListMessages-Anfragen. Das Kontingent wird zwischen Dialogflow und Agent Assist geteilt. |
AnswerRecordOperationsPerMinutePerProject | 300 Anfragen / Min. | Global | Nutzerprojekt | AnswerRecord-Anfragen |