Cette page a été traduite par l'API Cloud Translation.

Quotas

Pour estimer précisément le quota, vous devez indiquer le nombre de requêtes par seconde (RPS) que vous envoyez à chaque API. Les sections suivantes décrivent les quotas pour les API utilisées avec chaque fonctionnalité d'Assistance de l'agent.

Pour savoir comment demander une augmentation de quota, consultez la page relative aux quotas. Une fois votre demande envoyée, Google pourra vous contacter pour obtenir des informations supplémentaires et vous informer de son approbation ou de son refus.

Types de projets

Les tableaux de quotas suivants listent deux types de projets : les projets consommateurs et les projets ressources. Pour obtenir les définitions de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.

Transcription CCAI

Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.

Intégration de la téléphonie

Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.

Intégration de gRPC

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
AnalyzeContentOperationsPerMinutePerProject	300 requêtes/minute	Monde	Projet du client	Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 requêtes simultanées	Régional (le trafic mondial est comptabilisé dans la région `us-central1`)	Projet client (projet de ressources pour l'intégration SipRec de la téléphonie)	Sessions de streaming bidirectionnel simultanées par région

Analyse des sentiments

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
AnalyzeSentimentOperationsPerMinutePerProject	300 requêtes/minute	Monde	Projet du client	Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 requêtes/minute	Monde	Projet du client	Requêtes AnalyzeSentiment et StreamingAnalyzeSentiment. Le quota est partagé entre Dialogflow et Agent Assist.

Créer votre propre assistance

Cette fonctionnalité utilise les modèles d'IA suivants :

text-bison@001 (limite par défaut : 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
GeneratorSuggestionOperationsPerMinutePerModelType	10 requêtes/minute	Monde	Projet du client	Opérations de suggestions de générateur par type de modèle
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 requêtes/minute	Régional	Projet du client	Opérations de suggestions du générateur par type de modèle et par région

Synthèse

La synthèse générée par l'IA utilise les modèles suivants :

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0

Le tableau suivant indique le type de quota et le modèle utilisés pour chaque version de la fonctionnalité de synthèse.

Version de la synthèse	Type de quota	Modèle de backend
Generator 4.0	Basé sur un générateur	Gemini-2.0-flash-001 préentraîné
Générateur 3.1	Basé sur un générateur	gemini-1.5-flash-001 ajusté avec Lora
Generator 3.0	Basé sur un générateur	gemini-1.0-pro-002 affiné avec Lora
Generator 2.1	Basé sur un générateur	Lora-tuned text-bison-32k@002
Generator 2.0	Basé sur un générateur	Lora-tuned text-bison-32k@002
Generator 1.0	Basé sur un générateur	Lora-tuned text-bison@001
Baseline v2	Modèle de référence V2	text-bison
Référence v1	Non basé sur un générateur	Modèle LongT5
Personnalisé 2.0	Non basé sur un générateur	Modèle LongT5

Les types de quotas du tableau précédent sont repris dans la liste des quotas suivante pour les API utilisées avec la synthèse.

Type de quota	Nom de la limite de quota	Valeur par défaut	Région	Ressource de recharge/Projet consommateur	Description
Basé sur un générateur	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 requêtes/minute	Régional	Projet client	Opérations de suggestions du générateur par type de modèle et par région
Basé sur un générateur	GeneratorSuggestionOperationsPerMinutePerModelType	10 requêtes/minute	Monde	Projet client	Opérations de suggestions du générateur par type de modèle
Basé sur un générateur	SuggestConversationSummaryOperationsPerMinutePerProject	60 requêtes/min	Monde	Projet de ressources	Suggérer des opérations de résumé de conversation
Non basé sur un générateur	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0 à 2 requêtes/min	Régional	Projet de ressources	Suggérer des opérations de résumé de conversation dans chaque région
Modèle de référence V2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 requêtes/minute	Monde	Projet de ressources	Requêtes d'interrogation de référence V2 pour les suggestions de résumés de conversations
Modèle de référence V2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 requêtes/min	Régional	Projet de ressources	Demandes d'interrogation de référence V2 pour la suggestion de résumé de conversation dans chaque région

Auto-évaluation de la synthèse

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
ConcurrentSummarizationEvaluationsPerProject	1 requête par projet	Projet du client	Demandes d'auto-évaluation

Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la console Google Cloud . Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.

Assistance pour la base de connaissances générative

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
SearchKnowledgeOperationsPerMinutePerProject	60 requêtes/minute	Monde	Projet du client	Demandes SearchKnowledge

Aide proactive basée sur les connaissances génératives

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 requêtes/minute	Monde	Projet de ressources	Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 requêtes/minute	Régional	Projet de ressources	Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque région

Autres quotas d'API

Nom de la limite de quota	Valeur par défaut	Région	Ressource de facturation/Projet consommateur	Description
ConversationOperationsPerMinutePerProject	300 requêtes/minute	Monde	Projet du client	Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent (par exemple, CreateConversation, CompleteConversation). Le quota est partagé entre Dialogflow et Agent Assist.
MessagePollingOperationsPerMinutePerProject	1 200 requêtes / min	Monde	Projet du client	Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist.
AnswerRecordOperationsPerMinutePerProject	300 requêtes / min	Monde	Projet du client	Requêtes AnswerRecord

Quotas Restez organisé à l'aide des collections Enregistrez et classez les contenus selon vos préférences.