A estimativa precisa da quota baseia-se no número de consultas por segundo (CPS) que faz a cada API. As secções seguintes descrevem as quotas para APIs usadas com cada funcionalidade do Agent Assist.
Consulte a página de quotas para mais informações sobre como pedir um aumento da quota. Depois de enviar o seu pedido, a Google pode entrar em contacto consigo para obter mais informações e informá-lo quando o seu pedido for aprovado ou recusado.
Tipos de projetos
As tabelas de quotas seguintes apresentam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre a utilização de vários projetos para ver as definições destes dois tipos de projetos.
Transcrição de CCAI
Esta funcionalidade usa a telefonia ou a integração de gRPC, que têm quotas de API diferentes.
Integração de telefonia
Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.
Integração do gRPC
Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 300 pedidos/min | Global | Projeto de consumo | Pedidos AnalyzeContent/StreamingAnalyzeContent. A quota é partilhada entre o Dialogflow e o Agent Assist. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 pedidos simultâneos | Regional (o tráfego global é contabilizado na região us-central1 ) |
Projeto de consumidor (projeto de recursos para integração de telefonia SipRec) | Sessões de streaming bidirecionais simultâneas por região |
Análise de sensação geral
Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 300 pedidos/min | Global | Projeto de consumo | Pedidos de análise de sensação geral através de AnalyzeContent ou StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 pedidos/min | Global | Projeto de consumo | Pedidos AnalyzeSentiment e StreamingAnalyzeSentiment. A quota é partilhada entre o Dialogflow e o Agent Assist. |
Crie a sua própria assistência
Esta funcionalidade usa os seguintes modelos de IA:
- text-bison@001 (limite predefinido 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 10 pedidos/min | Global | Projeto de consumo | Operações de sugestões do gerador por tipo de modelo |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 pedidos/min | Regional | Projeto de consumo | Operações de sugestões do gerador por tipo de modelo e região |
Resumo
O resumo gerado pela IA usa os seguintes modelos:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
A tabela seguinte mostra o tipo de quota e o modelo usado para cada versão da geração de resumos.
Versão de resumo |
Tipo de quota |
Modelo de back-end |
---|---|---|
Gerador 4.0 |
Baseado no gerador |
Gemini-2.0-flash-001 pré-treinado |
Gerador 3.1 |
Baseado no gerador |
gemini-1.5-flash-001 com ajuste fino de Lora |
Gerador 3.0 |
Baseado no gerador |
gemini-1.0-pro-002 com ajuste fino de Lora |
Gerador 2.1 |
Baseado no gerador |
Lora-tuned text-bison-32k@002 |
Gerador 2.0 |
Baseado no gerador |
Lora-tuned text-bison-32k@002 |
Gerador 1.0 |
Baseado no gerador |
Lora-tuned text-bison@001 |
Base v2 |
Modelo de valor de referência v2 |
text-bison |
Base v1 |
Não baseado em gerador |
Modelo LongT5 |
Personalizado 2.0 |
Não baseado em gerador |
Modelo LongT5 |
Os tipos de quotas na tabela anterior refletem-se na seguinte lista de quotas para APIs usadas com a sumarização.
Tipo de quota |
Nome do limite de quota |
Valor predefinido |
Região |
Recurso de cobrança/projeto de consumo |
Descrição |
---|---|---|---|---|---|
Baseado no gerador |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 pedidos/min |
Regional |
Projeto de consumo |
Operações de sugestões do gerador por tipo de modelo e região |
Baseado no gerador |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 pedidos/min |
Global |
Projeto de consumo |
Operações de sugestões do gerador por tipo de modelo |
Baseado no gerador |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 pedidos/minuto |
Global |
Projeto de recursos |
Sugira operações de resumo de conversas |
Não baseado em gerador |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 a 2 pedidos/min |
Regional |
Projeto de recursos |
Sugira operações de resumo de conversas em cada região |
Modelo de valor de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 pedidos/min |
Global |
Projeto de recursos |
Pedidos de sondagem de base da sugestão de resumo da conversa V2 |
Modelo de valor de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 pedidos/minuto |
Regional |
Projeto de recursos |
Pedidos de sondagem de base da sugestão de resumo de conversas V2 em cada região |
Avaliação automática de resumos
Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 1 pedido por projeto | Projeto de consumo | Solicitações de autoavaliação |
Se precisar de quotas simultâneas adicionais, apresente um pedido através da Google Cloud consola. Esta funcionalidade pode suportar até quatro quotas simultâneas por projeto.
Assistência de conhecimentos generativa
Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 60 pedidos/min | Global | Projeto de consumo | Pedidos SearchKnowledge |
Assistência proativa de conhecimentos generativos
Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 pedidos/min | Global | Projeto de recursos | Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 pedidos/min | Regional | Projeto de recursos | Pedidos do KnowledgeAssist através de AnalyzeContent ou SuggestKnowledgeAssist em cada região |
Outras quotas da API
Nome do limite de quota | Valor predefinido | Região | Recurso de cobrança/projeto de consumidor | Descrição |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 300 pedidos/min | Global | Projeto de consumo | Outros pedidos de conversação, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A quota é partilhada entre o Dialogflow e o Agent Assist. |
MessagePollingOperationsPerMinutePerProject | 1200 pedidos / min | Global | Projeto de consumo | Pedidos ListMessages. A quota é partilhada entre o Dialogflow e o Agent Assist. |
AnswerRecordOperationsPerMinutePerProject | 300 pedidos / min | Global | Projeto de consumo | Pedidos AnswerRecord |