Cotas

A estimativa precisa de cota se baseia no número de consultas por segundo (QPS) para cada API. As seções a seguir descrevem as cotas das APIs usadas com cada recurso da Assistente de agente.

Consulte a página de cotas para mais informações sobre como solicitar um aumento de cota. Após enviar sua solicitação, o Google pode entrar em contato com você para mais informações e comunicar se ela foi aprovada ou negada.

Tipos de projeto

As tabelas de cota a seguir listam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre como usar vários projetos para ver as definições desses dois tipos de projetos.

Transcrição da CCAI

Esse recurso usa a integração de telefonia ou gRPC, que têm cotas de API diferentes.

Integração de telefonia

Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.

Integração do gRPC

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
AnalyzeContentOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Solicitações AnalyzeContent/StreamingAnalyzeContent. A cota é compartilhada entre o Dialogflow e o Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 solicitações simultâneas Regional (o tráfego global é contado na região us-central1) Projeto do consumidor (projeto de recurso para integração de telefonia SipRec) Sessões de streaming bidirecional simultâneas por região

Análise de sentimento

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
AnalyzeSentimentOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 solicitações/min Global Projeto do consumidor Solicitações de AnalyzeSentiment e StreamingAnalyzeSentiment. A cota é compartilhada entre o Dialogflow e o Agent Assist.

Crie sua própria assistência

Esse recurso usa os seguintes modelos de IA:

  • text-bison@001 (limite padrão 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
GeneratorSuggestionOperationsPerMinutePerModelType 10 solicitações/min Global Projeto do consumidor Operações de sugestão do gerador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 solicitações/min Regional Projeto do consumidor Operações de sugestão do gerador por tipo de modelo e região

Resumo

O resumo gerado com IA usa os seguintes modelos:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

A tabela a seguir mostra o tipo de cota e o modelo usado para cada versão do resumo.


Versão do resumo

Tipo de cota

Modelo de back-end

Gerador 4.0

Com base em gerador

Gemini-2.0-flash-001 pré-treinado

Gerador 3.1

Com base em gerador

Lora-tuned gemini-1.5-flash-001

Gerador 3.0

Com base em gerador

Lora-tuned gemini-1.0-pro-002

Gerador 2.1

Com base em gerador

text-bison-32k@002 ajustado com Lora

Generator 2.0

Com base em gerador

text-bison-32k@002 ajustado com Lora

Generator 1.0

Com base em gerador

text-bison@001 ajustado com Lora

Valor de referência v2

Modelo de referência v2

text-bison

Valor de referência v1

Não baseado em gerador
Modelo
LongT5

Personalizado 2.0

Não baseado em gerador
Modelo
LongT5

Os tipos de cota na tabela anterior são refletidos na lista de cotas a seguir para APIs usadas com resumo.


Tipo de cota

Nome do limite de cota

Valor padrão

Região

Recurso de cobrança/projeto do consumidor

Descrição

Com base em gerador

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 solicitações/min

Regional

Projeto do consumidor

Operações de sugestão do gerador por tipo de modelo e região

Com base em gerador

GeneratorSuggestionOperationsPerMinutePerModelType

10 solicitações/min

Global

Projeto do consumidor

Operações de sugestão do gerador por tipo de modelo

Com base em gerador

SuggestConversationSummaryOperationsPerMinutePerProject

60 solicitações/min

Global

Projeto de recursos

Sugerir operações de resumo de conversa

Não baseado em gerador

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 a 2 solicitações/min

Regional

Projeto de recursos

Sugerir operações de resumo de conversa em cada região

Modelo de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 solicitações/min

Global

Projeto de recursos

Solicitações de pesquisa de referência da sugestão de resumo da conversa V2

Modelo de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 solicitações/min

Regional

Projeto de recursos

Solicitações de pesquisa de referência da sugestão de resumo de conversa V2 em cada região

Autoavaliação de resumo

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
ConcurrentSummarizationEvaluationsPerProject 1 solicitação por projeto Projeto do consumidor Solicitações de autoavaliação

Se você precisar de mais cotas simultâneas, faça uma solicitação no console Google Cloud . Esse recurso aceita até quatro cotas simultâneas por projeto.

Assistência de conhecimento generativa

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SearchKnowledgeOperationsPerMinutePerProject 60 solicitações/min Global Projeto do consumidor SearchKnowledge requests

Assistência de Knowledge Assist proativo

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 solicitações/min Global Projeto de recursos Solicitações do KnowledgeAssist usando AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 solicitações/min Regional Projeto de recursos Solicitações do KnowledgeAssist usando AnalyzeContent ou SuggestKnowledgeAssist em cada região

Outras cotas de API

Nome do limite de cota Valor padrão Região Recurso de cobrança/projeto do consumidor Descrição
ConversationOperationsPerMinutePerProject 300 solicitações/min Global Projeto do consumidor Outras solicitações de conversa, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A cota é compartilhada entre o Dialogflow e o Agent Assist.
MessagePollingOperationsPerMinutePerProject 1.200 solicitações / min Global Projeto do consumidor Solicitações ListMessages. A cota é compartilhada entre o Dialogflow e o Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 solicitações / min Global Projeto do consumidor Solicitações de AnswerRecord