Quotas

Pour estimer précisément le quota, vous devez indiquer le nombre de requêtes par seconde (RPS) que vous envoyez à chaque API. Les sections suivantes décrivent les quotas pour les API utilisées avec chaque fonctionnalité d'Assistance de l'agent.

Pour savoir comment demander une augmentation de quota, consultez la page relative aux quotas. Une fois votre demande envoyée, Google pourra vous contacter pour obtenir des informations supplémentaires et vous informer de son approbation ou de son refus.

Types de projets

Les tableaux de quotas suivants listent deux types de projets : les projets consommateurs et les projets ressources. Pour obtenir les définitions de ces deux types de projets, consultez la documentation sur l'utilisation de plusieurs projets.

Transcription CCAI

Cette fonctionnalité utilise l'intégration de la téléphonie ou de gRPC, qui ont chacune des quotas d'API différents.

Intégration de la téléphonie

Consultez les quotas Dialogflow pour les API utilisées avec l'intégration de la téléphonie.

Intégration de gRPC

Nom de la limite de quota Valeur par défaut Région Ressource de facturation/Projet consommateur Description
AnalyzeContentOperationsPerMinutePerProject 300 requêtes/minute Monde Projet du client Requêtes AnalyzeContent/StreamingAnalyzeContent. Le quota est partagé entre Dialogflow et Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 requêtes simultanées Régional (le trafic mondial est comptabilisé dans la région us-central1) Projet client (projet de ressources pour l'intégration SipRec de la téléphonie) Sessions de streaming bidirectionnel simultanées par région

Analyse des sentiments

Nom de la limite de quota Valeur par défaut Région Ressource de facturation/Projet consommateur Description
AnalyzeSentimentOperationsPerMinutePerProject 300 requêtes/minute Monde Projet du client Requêtes d'analyse des sentiments via AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 requêtes/minute Monde Projet du client Requêtes AnalyzeSentiment et StreamingAnalyzeSentiment. Le quota est partagé entre Dialogflow et Agent Assist.

Créer votre propre assistance

Cette fonctionnalité utilise les modèles d'IA suivants :

  • text-bison@001 (limite par défaut : 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nom de la limite de quota Valeur par défaut Région Ressource de facturation/Projet consommateur Description
GeneratorSuggestionOperationsPerMinutePerModelType 10 requêtes/minute Monde Projet du client Opérations de suggestions de générateur par type de modèle
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 requêtes/minute Régional Projet du client Opérations de suggestions du générateur par type de modèle et par région

Synthèse

La synthèse générée par l'IA utilise les modèles suivants :

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

Le tableau suivant indique le type de quota et le modèle utilisés pour chaque version de la fonctionnalité de synthèse.


Version de la synthèse

Type de quota

Modèle de backend

Generator 4.0

Basé sur un générateur

Gemini-2.0-flash-001 préentraîné

Générateur 3.1

Basé sur un générateur

gemini-1.5-flash-001 ajusté avec Lora

Generator 3.0

Basé sur un générateur

gemini-1.0-pro-002 affiné avec Lora

Generator 2.1

Basé sur un générateur

Lora-tuned text-bison-32k@002

Generator 2.0

Basé sur un générateur

Lora-tuned text-bison-32k@002

Generator 1.0

Basé sur un générateur

Lora-tuned text-bison@001

Baseline v2

Modèle de référence V2

text-bison

Référence v1

Non basé sur un générateur
Modèle LongT5

Personnalisé 2.0

Non basé sur un générateur
Modèle LongT5

Les types de quotas du tableau précédent sont repris dans la liste des quotas suivante pour les API utilisées avec la synthèse.


Type de quota

Nom de la limite de quota

Valeur par défaut

Région

Ressource de recharge/Projet consommateur

Description

Basé sur un générateur

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 requêtes/minute

Régional

Projet client

Opérations de suggestions du générateur par type de modèle et par région

Basé sur un générateur

GeneratorSuggestionOperationsPerMinutePerModelType

10 requêtes/minute

Monde

Projet client

Opérations de suggestions du générateur par type de modèle

Basé sur un générateur

SuggestConversationSummaryOperationsPerMinutePerProject

60 requêtes/min

Monde

Projet de ressources

Suggérer des opérations de résumé de conversation

Non basé sur un générateur

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 à 2 requêtes/min

Régional

Projet de ressources

Suggérer des opérations de résumé de conversation dans chaque région

Modèle de référence V2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 requêtes/minute

Monde

Projet de ressources

Requêtes d'interrogation de référence V2 pour les suggestions de résumés de conversations

Modèle de référence V2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 requêtes/min

Régional

Projet de ressources

Demandes d'interrogation de référence V2 pour la suggestion de résumé de conversation dans chaque région

Auto-évaluation de la synthèse

Nom de la limite de quota Valeur par défaut Région Ressource de facturation/Projet consommateur Description
ConcurrentSummarizationEvaluationsPerProject 1 requête par projet Projet du client Demandes d'auto-évaluation

Si vous avez besoin de quotas simultanés supplémentaires, envoyez une demande via la console Google Cloud . Cette fonctionnalité peut accepter jusqu'à quatre quotas simultanés par projet.

Assistance pour la base de connaissances générative

Nom de la limite de quota Valeur par défaut Région Ressource de facturation/Projet consommateur Description
SearchKnowledgeOperationsPerMinutePerProject 60 requêtes/minute Monde Projet du client Demandes SearchKnowledge

Aide proactive basée sur les connaissances génératives

Nom de la limite de quota Valeur par défaut Région Ressource de facturation/Projet consommateur Description
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 requêtes/minute Monde Projet de ressources Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 requêtes/minute Régional Projet de ressources Requêtes KnowledgeAssist via AnalyzeContent ou SuggestKnowledgeAssist dans chaque région

Autres quotas d'API

Nom de la limite de quota Valeur par défaut Région Ressource de facturation/Projet consommateur Description
ConversationOperationsPerMinutePerProject 300 requêtes/minute Monde Projet du client Autres requêtes de conversation, à l'exception d'AnalyzeContent et de StreamingAnalyzeContent (par exemple, CreateConversation, CompleteConversation). Le quota est partagé entre Dialogflow et Agent Assist.
MessagePollingOperationsPerMinutePerProject 1 200 requêtes / min Monde Projet du client Requêtes ListMessages. Le quota est partagé entre Dialogflow et Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 requêtes / min Monde Projet du client Requêtes AnswerRecord