Quotas

A estimativa precisa da quota baseia-se no número de consultas por segundo (CPS) que faz a cada API. As secções seguintes descrevem as quotas para APIs usadas com cada funcionalidade do Agent Assist.

Consulte a página de quotas para mais informações sobre como pedir um aumento da quota. Depois de enviar o seu pedido, a Google pode entrar em contacto consigo para obter mais informações e informá-lo quando o seu pedido for aprovado ou recusado.

Tipos de projetos

As tabelas de quotas seguintes apresentam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre a utilização de vários projetos para ver as definições destes dois tipos de projetos.

Transcrição de CCAI

Esta funcionalidade usa a telefonia ou a integração de gRPC, que têm quotas de API diferentes.

Integração de telefonia

Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.

Integração do gRPC

Nome do limite de quota Valor predefinido Região Recurso de cobrança/projeto de consumidor Descrição
AnalyzeContentOperationsPerMinutePerProject 300 pedidos/min Global Projeto de consumo Pedidos AnalyzeContent/StreamingAnalyzeContent. A quota é partilhada entre o Dialogflow e o Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 pedidos simultâneos Regional (o tráfego global é contabilizado na região us-central1) Projeto de consumidor (projeto de recursos para integração de telefonia SipRec) Sessões de streaming bidirecionais simultâneas por região

Análise de sensação geral

Nome do limite de quota Valor predefinido Região Recurso de cobrança/projeto de consumidor Descrição
AnalyzeSentimentOperationsPerMinutePerProject 300 pedidos/min Global Projeto de consumo Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 pedidos/min Global Projeto de consumo Pedidos AnalyzeSentiment e StreamingAnalyzeSentiment. A quota é partilhada entre o Dialogflow e o Agent Assist.

Crie a sua própria assistência

Esta funcionalidade usa os seguintes modelos de IA:

  • text-bison@001 (limite predefinido 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nome do limite de quota Valor predefinido Região Recurso de cobrança/projeto de consumidor Descrição
GeneratorSuggestionOperationsPerMinutePerModelType 10 pedidos/min Global Projeto de consumo Operações de sugestões do gerador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 pedidos/min Regional Projeto de consumo Operações de sugestões do gerador por tipo de modelo e região

Resumo

O resumo gerado pela IA usa os seguintes modelos:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

A tabela seguinte mostra o tipo de quota e o modelo usado para cada versão da geração de resumos.


Versão de resumo

Tipo de quota

Modelo de back-end

Gerador 4.0

Baseado no gerador

Gemini-2.0-flash-001 pré-treinado

Gerador 3.1

Baseado no gerador

gemini-1.5-flash-001 com ajuste fino de Lora

Gerador 3.0

Baseado no gerador

gemini-1.0-pro-002 com ajuste fino de Lora

Gerador 2.1

Baseado no gerador

Lora-tuned text-bison-32k@002

Gerador 2.0

Baseado no gerador

Lora-tuned text-bison-32k@002

Gerador 1.0

Baseado no gerador

Lora-tuned text-bison@001

Base v2

Modelo de valor de referência v2

text-bison

Base v1

Não baseado em gerador

Modelo LongT5

Personalizado 2.0

Não baseado em gerador

Modelo LongT5

Os tipos de quotas na tabela anterior refletem-se na seguinte lista de quotas para APIs usadas com a sumarização.


Tipo de quota

Nome do limite de quota

Valor predefinido

Região

Recurso de cobrança/projeto de consumo

Descrição

Baseado no gerador

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 pedidos/min

Regional

Projeto de consumo

Operações de sugestões do gerador por tipo de modelo e região

Baseado no gerador

GeneratorSuggestionOperationsPerMinutePerModelType

10 pedidos/min

Global

Projeto de consumo

Operações de sugestões do gerador por tipo de modelo

Baseado no gerador

SuggestConversationSummaryOperationsPerMinutePerProject

60 pedidos/minuto

Global

Projeto de recursos

Sugira operações de resumo de conversas

Não baseado em gerador

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0 a 2 pedidos/min

Regional

Projeto de recursos

Sugira operações de resumo de conversas em cada região

Modelo de valor de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 pedidos/min

Global

Projeto de recursos

Pedidos de sondagem de base da sugestão de resumo da conversa V2

Modelo de valor de referência v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 pedidos/minuto

Regional

Projeto de recursos

Pedidos de sondagem de base da sugestão de resumo de conversas V2 em cada região

Avaliação automática de resumos

Nome do limite de quota Valor predefinido Região Recurso de cobrança/projeto de consumidor Descrição
ConcurrentSummarizationEvaluationsPerProject 1 pedido por projeto Projeto de consumo Solicitações de autoavaliação

Se precisar de quotas simultâneas adicionais, apresente um pedido através da Google Cloud consola. Esta funcionalidade pode suportar até quatro quotas simultâneas por projeto.

Assistência de conhecimentos generativa

Nome do limite de quota Valor predefinido Região Recurso de cobrança/projeto de consumidor Descrição
SearchKnowledgeOperationsPerMinutePerProject 60 pedidos/min Global Projeto de consumo Pedidos SearchKnowledge

Assistência proativa de conhecimentos generativos

Nome do limite de quota Valor predefinido Região Recurso de cobrança/projeto de consumidor Descrição
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 pedidos/min Global Projeto de recursos Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 pedidos/min Regional Projeto de recursos Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist em cada região

Outras quotas da API

Nome do limite de quota Valor predefinido Região Recurso de cobrança/projeto de consumidor Descrição
ConversationOperationsPerMinutePerProject 300 pedidos/min Global Projeto de consumo Outros pedidos de conversação, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A quota é partilhada entre o Dialogflow e o Agent Assist.
MessagePollingOperationsPerMinutePerProject 1200 pedidos / min Global Projeto de consumo Pedidos ListMessages. A quota é partilhada entre o Dialogflow e o Agent Assist.
AnswerRecordOperationsPerMinutePerProject 300 pedidos / min Global Projeto de consumo Pedidos AnswerRecord