A estimativa precisa de cota se baseia no número de consultas por segundo (QPS) para cada API. As seções a seguir descrevem as cotas das APIs usadas com cada recurso da Assistente de agente.
Consulte a página de cotas para mais informações sobre como solicitar um aumento de cota. Após enviar sua solicitação, o Google pode entrar em contato com você para mais informações e comunicar se ela foi aprovada ou negada.
Tipos de projeto
As tabelas de cota a seguir listam dois tipos de projetos: consumidor e recurso. Consulte a documentação sobre como usar vários projetos para ver as definições desses dois tipos de projetos.
Transcrição da CCAI
Esse recurso usa a integração de telefonia ou gRPC, que têm cotas de API diferentes.
Integração de telefonia
Consulte as cotas do Dialogflow para as APIs usadas com a integração de telefonia.
Integração do gRPC
Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
---|---|---|---|---|
AnalyzeContentOperationsPerMinutePerProject | 300 solicitações/min | Global | Projeto do consumidor | Solicitações AnalyzeContent/StreamingAnalyzeContent. A cota é compartilhada entre o Dialogflow e o Agent Assist. |
ConcurrentBidiStreamingSessionsPerProjectPerRegion | 50 solicitações simultâneas | Regional (o tráfego global é contado na região us-central1 ) |
Projeto do consumidor (projeto de recurso para integração de telefonia SipRec) | Sessões de streaming bidirecional simultâneas por região |
Análise de sentimento
Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
---|---|---|---|---|
AnalyzeSentimentOperationsPerMinutePerProject | 300 solicitações/min | Global | Projeto do consumidor | Solicitações de análise de sentimento usando AnalyzeContent ou StreamingAnalyzeContent. |
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion | 300 solicitações/min | Global | Projeto do consumidor | Solicitações de AnalyzeSentiment e StreamingAnalyzeSentiment. A cota é compartilhada entre o Dialogflow e o Agent Assist. |
Crie sua própria assistência
Esse recurso usa os seguintes modelos de IA:
- text-bison@001 (limite padrão 0)
- text-bison@002
- text-bison-32k@002
- gemini-1.0-pro
- gemini-1.5-pro
- gemini-1.5-pro-001
- gemini-1.5-flash-001
- gemini-1.5-flash-002
- gemini-2.0-flash-001
Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
---|---|---|---|---|
GeneratorSuggestionOperationsPerMinutePerModelType | 10 solicitações/min | Global | Projeto do consumidor | Operações de sugestão do gerador por tipo de modelo |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion | 10 solicitações/min | Regional | Projeto do consumidor | Operações de sugestão do gerador por tipo de modelo e região |
Resumo
O resumo gerado com IA usa os seguintes modelos:
- summarization-1.0
- summarization-2.0
- summarization-2.1
- summarization-3.0
- summarization-3.1
- summarization-4.0
A tabela a seguir mostra o tipo de cota e o modelo usado para cada versão do resumo.
Versão do resumo |
Tipo de cota |
Modelo de back-end |
---|---|---|
Gerador 4.0 |
Com base em gerador |
Gemini-2.0-flash-001 pré-treinado |
Gerador 3.1 |
Com base em gerador |
Lora-tuned gemini-1.5-flash-001 |
Gerador 3.0 |
Com base em gerador |
Lora-tuned gemini-1.0-pro-002 |
Gerador 2.1 |
Com base em gerador |
text-bison-32k@002 ajustado com Lora |
Generator 2.0 |
Com base em gerador |
text-bison-32k@002 ajustado com Lora |
Generator 1.0 |
Com base em gerador |
text-bison@001 ajustado com Lora |
Valor de referência v2 |
Modelo de referência v2 |
text-bison |
Valor de referência v1 |
Não baseado em gerador |
Modelo LongT5 |
Personalizado 2.0 |
Não baseado em gerador |
Modelo LongT5 |
Os tipos de cota na tabela anterior são refletidos na lista de cotas a seguir para APIs usadas com resumo.
Tipo de cota |
Nome do limite de cota |
Valor padrão |
Região |
Recurso de cobrança/projeto do consumidor |
Descrição |
---|---|---|---|---|---|
Com base em gerador |
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion |
10 solicitações/min |
Regional |
Projeto do consumidor |
Operações de sugestão do gerador por tipo de modelo e região |
Com base em gerador |
GeneratorSuggestionOperationsPerMinutePerModelType |
10 solicitações/min |
Global |
Projeto do consumidor |
Operações de sugestão do gerador por tipo de modelo |
Com base em gerador |
SuggestConversationSummaryOperationsPerMinutePerProject |
60 solicitações/min |
Global |
Projeto de recursos |
Sugerir operações de resumo de conversa |
Não baseado em gerador |
SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion |
0 a 2 solicitações/min |
Regional |
Projeto de recursos |
Sugerir operações de resumo de conversa em cada região |
Modelo de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProject |
120 solicitações/min |
Global |
Projeto de recursos |
Solicitações de pesquisa de referência da sugestão de resumo da conversa V2 |
Modelo de referência v2 |
SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion |
60 solicitações/min |
Regional |
Projeto de recursos |
Solicitações de pesquisa de referência da sugestão de resumo de conversa V2 em cada região |
Autoavaliação de resumo
Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
---|---|---|---|---|
ConcurrentSummarizationEvaluationsPerProject | 1 solicitação por projeto | Projeto do consumidor | Solicitações de autoavaliação |
Se você precisar de mais cotas simultâneas, faça uma solicitação no console Google Cloud . Esse recurso aceita até quatro cotas simultâneas por projeto.
Assistência de conhecimento generativa
Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
---|---|---|---|---|
SearchKnowledgeOperationsPerMinutePerProject | 60 solicitações/min | Global | Projeto do consumidor | SearchKnowledge requests |
Assistência de Knowledge Assist proativo
Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
---|---|---|---|---|
SuggestKnowledgeAssistOperationsPerMinutePerProject | 60 solicitações/min | Global | Projeto de recursos | Solicitações do KnowledgeAssist usando AnalyzeContent ou SuggestKnowledgeAssist |
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion | 30 solicitações/min | Regional | Projeto de recursos | Solicitações do KnowledgeAssist usando AnalyzeContent ou SuggestKnowledgeAssist em cada região |
Outras cotas de API
Nome do limite de cota | Valor padrão | Região | Recurso de cobrança/projeto do consumidor | Descrição |
---|---|---|---|---|
ConversationOperationsPerMinutePerProject | 300 solicitações/min | Global | Projeto do consumidor | Outras solicitações de conversa, exceto AnalyzeContent e StreamingAnalyzeContent, por exemplo, CreateConversation e CompleteConversation. A cota é compartilhada entre o Dialogflow e o Agent Assist. |
MessagePollingOperationsPerMinutePerProject | 1.200 solicitações / min | Global | Projeto do consumidor | Solicitações ListMessages. A cota é compartilhada entre o Dialogflow e o Agent Assist. |
AnswerRecordOperationsPerMinutePerProject | 300 solicitações / min | Global | Projeto do consumidor | Solicitações de AnswerRecord |