Pour estimer précisément le quota, vous devez indiquer le nombre de requêtes par seconde (RPS) que vous envoyez à chaque API. Les sections suivantes décrivent les quotas pour les API utilisées avec chaque fonctionnalité d'Assistance de l'agent.
Pour savoir comment demander une augmentation de quota, consultez la page relative aux quotas. Une fois votre demande envoyée, Google pourra vous contacter pour obtenir des informations supplémentaires et vous informer de son approbation ou de son refus.
Types de projets
Les tableaux de quotas suivants listent deux types de projets : les projets consommateurs et les projets ressources. Pour obtenir les définitions de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.
Transcription CCAI
Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.
Intégration de la téléphonie
Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.
Intégration de gRPC
Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet du client | Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 requêtes simultanées | Régional (le trafic mondial est comptabilisé dans la région us-central1 ) |
Projet client (projet de ressources pour l'intégration SipRec de la téléphonie) | Sessions de streaming bidirectionnel simultanées par région |
Analyse des sentiments
Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet du client | Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 requêtes/minute | Monde | Projet du client | Requêtes AnalyzeSentiment et StreamingAnalyzeSentiment. Le quota est partagé entre Dialogflow et Agent Assist. |
Créer votre propre assistance
Cette fonctionnalité utilise les modèles d'IA suivants :
- text-bison@001 (limite par défaut : 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 10 requêtes/minute | Monde | Projet du client | Opérations de suggestions de générateur par type de modèle |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 requêtes/minute | Régional | Projet du client | Opérations de suggestions du générateur par type de modèle et par région |
Synthèse
La synthèse générée par l'IA utilise les modèles suivants :
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
Le tableau suivant indique le type de quota et le modèle utilisés pour chaque version de la fonctionnalité de synthèse.
Version de la synthèse |
Type de quota |
Modèle de backend |
---|---|---|
Generator 4.0 |
Basé sur un générateur |
Gemini-2.0-flash-001 préentraîné |
Générateur 3.1 |
Basé sur un générateur |
gemini-1.5-flash-001 ajusté avec Lora |
Generator 3.0 |
Basé sur un générateur |
gemini-1.0-pro-002 affiné avec Lora |
Generator 2.1 |
Basé sur un générateur |
Lora-tuned text-bison-32k@002 |
Generator 2.0 |
Basé sur un générateur |
Lora-tuned text-bison-32k@002 |
Generator 1.0 |
Basé sur un générateur |
Lora-tuned text-bison@001 |
Baseline v2 |
Modèle de référence V2 |
text-bison |
Référence v1 |
Non basé sur un générateur |
Modèle LongT5
|
Personnalisé 2.0 |
Non basé sur un générateur |
Modèle LongT5
|
Les types de quotas du tableau précédent sont repris dans la liste des quotas suivante pour les API utilisées avec la synthèse.
Type de quota |
Nom de la limite de quota |
Valeur par défaut |
Région |
Ressource de recharge/Projet consommateur |
Description |
---|---|---|---|---|---|
Basé sur un générateur |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 requêtes/minute |
Régional |
Projet client |
Opérations de suggestions du générateur par type de modèle et par région |
Basé sur un générateur |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 requêtes/minute |
Monde |
Projet client |
Opérations de suggestions du générateur par type de modèle |
Basé sur un générateur |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 requêtes/min |
Monde |
Projet de ressources |
Suggérer des opérations de résumé de conversation |
Non basé sur un générateur |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 à 2 requêtes/min |
Régional |
Projet de ressources |
Suggérer des opérations de résumé de conversation dans chaque région |
Modèle de référence V2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 requêtes/minute |
Monde |
Projet de ressources |
Requêtes d'interrogation de référence V2 pour les suggestions de résumés de conversations |
Modèle de référence V2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 requêtes/min |
Régional |
Projet de ressources |
Demandes d'interrogation de référence V2 pour la suggestion de résumé de conversation dans chaque région |
Auto-évaluation de la synthèse
Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 1 requête par projet | Projet du client | Demandes d'auto-évaluation |
Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la console Google Cloud . Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.
Assistance pour la base de connaissances générative
Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet du client | Demandes SearchKnowledge |
Aide proactive basée sur les connaissances génératives
Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 requêtes/minute | Monde | Projet de ressources | Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 requêtes/minute | Régional | Projet de ressources | Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque région |
Autres quotas d'API
Nom de la limite de quota | Valeur par défaut | Région | Ressource de facturation/Projet consommateur | Description |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 300 requêtes/minute | Monde | Projet du client | Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent (par exemple, CreateConversation, CompleteConversation). Le quota est partagé entre Dialogflow et Agent Assist. |
MessagePollingOperationsPerMinutePerProject | 1 200 requêtes / min | Monde | Projet du client | Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist. |
AnswerRecordOperationsPerMinutePerProject | 300 requêtes / min | Monde | Projet du client | Requêtes AnswerRecord |