Esta página foi traduzida pela API Cloud Translation.

Quotas

A estimativa precisa da quota baseia-se no número de consultas por segundo (CPS) que faz a cada API. As secções seguintes descrevem as quotas para APIs usadas com cada funcionalidade do Agent Assist.

Consulte a página de quotas para mais informações sobre como pedir um aumento da quota. Depois de enviar o seu pedido, a Google pode entrar em contacto consigo para obter mais informações e informá-lo quando o seu pedido for aprovado ou recusado.

Tipos de projetos

As tabelas de quotas seguintes apresentam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre a utilização de vários projetos para ver as definições destes dois tipos de projetos.

Transcrição de CCAI

Esta funcionalidade usa a telefonia ou a integração de gRPC, que têm quotas de API diferentes.

Integração de telefonia

Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.

Integração do gRPC

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
AnalyzeContentOperationsPerMinutePerProject	300 pedidos/min	Global	Projeto de consumo	Pedidos AnalyzeContent/StreamingAnalyzeContent. A quota é partilhada entre o Dialogflow e o Agent Assist.
ConcurrentBidiStreamingSessionsPerProjectPerRegion	50 pedidos simultâneos	Regional (o tráfego global é contabilizado na região `us-central1`)	Projeto de consumidor (projeto de recursos para integração de telefonia SipRec)	Sessões de streaming bidirecionais simultâneas por região

Análise de sensação geral

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
AnalyzeSentimentOperationsPerMinutePerProject	300 pedidos/min	Global	Projeto de consumo	Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion	300 pedidos/min	Global	Projeto de consumo	Pedidos AnalyzeSentiment e StreamingAnalyzeSentiment. A quota é partilhada entre o Dialogflow e o Agent Assist.

Crie a sua própria assistência

Esta funcionalidade usa os seguintes modelos de IA:

text-bison@001 (limite predefinido 0)
text-bison@002
text-bison-32k@002
gemini-1.0-pro
gemini-1.5-pro
gemini-1.5-pro-001
gemini-1.5-flash-001
gemini-1.5-flash-002
gemini-2.0-flash-001

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
GeneratorSuggestionOperationsPerMinutePerModelType	10 pedidos/min	Global	Projeto de consumo	Operações de sugestões do gerador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 pedidos/min	Regional	Projeto de consumo	Operações de sugestões do gerador por tipo de modelo e região

Resumo

O resumo gerado pela IA usa os seguintes modelos:

summarization-1.0
summarization-2.0
summarization-2.1
summarization-3.0
summarization-3.1
summarization-4.0

A tabela seguinte mostra o tipo de quota e o modelo usado para cada versão da geração de resumos.

Versão de resumo	Tipo de quota	Modelo de back-end
Gerador 4.0	Baseado no gerador	Gemini-2.0-flash-001 pré-treinado
Gerador 3.1	Baseado no gerador	gemini-1.5-flash-001 com ajuste fino de Lora
Gerador 3.0	Baseado no gerador	gemini-1.0-pro-002 com ajuste fino de Lora
Gerador 2.1	Baseado no gerador	Lora-tuned text-bison-32k@002
Gerador 2.0	Baseado no gerador	Lora-tuned text-bison-32k@002
Gerador 1.0	Baseado no gerador	Lora-tuned text-bison@001
Base v2	Modelo de valor de referência v2	text-bison
Base v1	Não baseado em gerador	Modelo LongT5
Personalizado 2.0	Não baseado em gerador	Modelo LongT5

Os tipos de quotas na tabela anterior refletem-se na seguinte lista de quotas para APIs usadas com a sumarização.

Tipo de quota	Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumo	Descrição
Baseado no gerador	GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion	10 pedidos/min	Regional	Projeto de consumo	Operações de sugestões do gerador por tipo de modelo e região
Baseado no gerador	GeneratorSuggestionOperationsPerMinutePerModelType	10 pedidos/min	Global	Projeto de consumo	Operações de sugestões do gerador por tipo de modelo
Baseado no gerador	SuggestConversationSummaryOperationsPerMinutePerProject	60 pedidos/minuto	Global	Projeto de recursos	Sugira operações de resumo de conversas
Não baseado em gerador	SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion	0 a 2 pedidos/min	Regional	Projeto de recursos	Sugira operações de resumo de conversas em cada região
Modelo de valor de referência v2	SuggestSummaryV2BaselineOperationsPerMinutePerProject	120 pedidos/min	Global	Projeto de recursos	Pedidos de sondagem de base da sugestão de resumo da conversa V2
Modelo de valor de referência v2	SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion	60 pedidos/minuto	Regional	Projeto de recursos	Pedidos de sondagem de base da sugestão de resumo de conversas V2 em cada região

Avaliação automática de resumos

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
ConcurrentSummarizationEvaluationsPerProject	1 pedido por projeto	Projeto de consumo	Solicitações de autoavaliação

Se precisar de quotas simultâneas adicionais, apresente um pedido através da Google Cloud consola. Esta funcionalidade pode suportar até quatro quotas simultâneas por projeto.

Assistência de conhecimentos generativa

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
SearchKnowledgeOperationsPerMinutePerProject	60 pedidos/min	Global	Projeto de consumo	Pedidos SearchKnowledge

Assistência proativa de conhecimentos generativos

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
SuggestKnowledgeAssistOperationsPerMinutePerProject	60 pedidos/min	Global	Projeto de recursos	Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion	30 pedidos/min	Regional	Projeto de recursos	Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist em cada região

Outras quotas da API

Nome do limite de quota	Valor predefinido	Região	Recurso de cobrança/projeto de consumidor	Descrição
ConversationOperationsPerMinutePerProject	300 pedidos/min	Global	Projeto de consumo	Outros pedidos de conversação, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A quota é partilhada entre o Dialogflow e o Agent Assist.
MessagePollingOperationsPerMinutePerProject	1200 pedidos / min	Global	Projeto de consumo	Pedidos ListMessages. A quota é partilhada entre o Dialogflow e o Agent Assist.
AnswerRecordOperationsPerMinutePerProject	300 pedidos / min	Global	Projeto de consumo	Pedidos AnswerRecord

Quotas Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.