Cuotas

Para estimar la cuota con precisión, se tiene en cuenta el número de consultas por segundo (CPS) que envías a cada API. En las siguientes secciones se describen las cuotas de las APIs que se usan con cada función de Asistente.

Consulta la página de cuotas para obtener más información sobre cómo solicitar un aumento de la cuota. Después de enviar tu solicitud, es posible que nos pongamos en contacto contigo para pedirte más información y comunicarte si la aprobamos o no.

Tipos de proyectos

En las siguientes tablas de cuotas se indican dos tipos de proyectos: de consumidor y de recurso. Consulta la documentación sobre cómo usar varios proyectos para ver las definiciones de estos dos tipos de proyectos.

Transcripción de CCAI

Esta función usa la integración de telefonía o gRPC, y cada una tiene cuotas de API diferentes.

Integración de telefonía

Consulta las cuotas de Dialogflow de las APIs que se usan con la integración de telefonía.

Integración de gRPC

Nombre del límite de cuota Valor predeterminado Region Recurso de facturación o proyecto de consumidor Descripción
AnalyzeContentOperationsPerMinutePerProject 300 solicitudes por minuto Global Proyecto de consumidor Solicitudes AnalyzeContent o StreamingAnalyzeContent. La cuota se comparte entre Dialogflow y Asistente para agentes.
ConcurrentBidiStreamingSessionsPerProjectPerRegion 50 solicitudes simultáneas Regional (el tráfico global se contabiliza en la región us-central1) Proyecto de consumidor (proyecto de recursos para la integración de SipRec de telefonía) Sesiones de streaming bidireccionales simultáneas por región

Análisis de sentimiento

Nombre del límite de cuota Valor predeterminado Region Recurso de facturación o proyecto de consumidor Descripción
AnalyzeSentimentOperationsPerMinutePerProject 300 solicitudes por minuto Global Proyecto de consumidor Solicitudes de análisis de sentimiento a través de AnalyzeContent o StreamingAnalyzeContent.
AnalyzeSentimentOperationsPerMinutePerProjectPerRegion 300 solicitudes por minuto Global Proyecto de consumidor Solicitudes AnalyzeSentiment y StreamingAnalyzeSentiment. La cuota se comparte entre Dialogflow y Asistente para agentes.

Crear tu propia asistencia

Esta función usa los siguientes modelos de IA:

  • text-bison@001 (límite predeterminado: 0)
  • text-bison@002
  • text-bison-32k@002
  • gemini-1.0-pro
  • gemini-1.5-pro
  • gemini-1.5-pro-001
  • gemini-1.5-flash-001
  • gemini-1.5-flash-002
  • gemini-2.0-flash-001
Nombre del límite de cuota Valor predeterminado Region Recurso de facturación o proyecto de consumidor Descripción
GeneratorSuggestionOperationsPerMinutePerModelType 10 solicitudes por minuto Global Proyecto de consumidor Operaciones de sugerencias de generador por tipo de modelo
GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion 10 solicitudes por minuto Regional Proyecto de consumidor Operaciones de sugerencias de generador por tipo de modelo y región

Creación de resúmenes

La función de resumen generada por IA usa los siguientes modelos:

  • summarization-1.0
  • summarization-2.0
  • summarization-2.1
  • summarization-3.0
  • summarization-3.1
  • summarization-4.0

En la siguiente tabla se muestra el tipo de cuota y el modelo que se usa en cada versión de la función de resumen.


Versión de la creación de resúmenes

Tipo de cuota

Modelo de backend

Generador 4.0

Basado en generadores

Gemini-2.0-flash-001 preentrenado

Generador 3.1

Basado en generadores

gemini-1.5-flash-001 ajustado con Lora

Generador 3.0

Basado en generadores

gemini-1.0-pro-002 ajustado con Lora

Generador 2.1

Basado en generadores

text-bison-32k@002 ajustado con Lora

Generador 2.0

Basado en generadores

text-bison-32k@002 ajustado con Lora

Generator 1.0

Basado en generadores

text-bison@001 ajustado con Lora

Versión 2 de la referencia

Modelo de referencia v2

text-bison

Valor de referencia (versión 1)

No se basa en un generador

Modelo LongT5

Custom 2.0

No se basa en un generador

Modelo LongT5

Los tipos de cuota de la tabla anterior se reflejan en la siguiente lista de cuotas de las APIs que se usan con la función de resumen.


Tipo de cuota

Nombre del límite de cuota

Valor predeterminado

Región

Recurso de carga o proyecto de consumidor

Descripción

Basado en generadores

GeneratorSuggestionOperationsPerMinutePerModelTypePerRegion

10 solicitudes por minuto

Regional

Proyecto de consumidor

Operaciones de sugerencias generadas por tipo de modelo y región

Basado en generadores

GeneratorSuggestionOperationsPerMinutePerModelType

10 solicitudes por minuto

Global

Proyecto de consumidor

Operaciones de sugerencias de generador por tipo de modelo

Basado en generadores

SuggestConversationSummaryOperationsPerMinutePerProject

60 solicitudes/min

Global

Proyecto de recurso

Sugerir operaciones de resumen de conversaciones

No se basa en un generador

SuggestConversationSummaryOperationsPerMinutePerProjectPerRegion

0-2 solicitudes/min

Regional

Proyecto de recurso

Sugerir operaciones de resumen de conversaciones en cada región

Modelo de referencia v2

SuggestSummaryV2BaselineOperationsPerMinutePerProject

120 solicitudes/min

Global

Proyecto de recurso

Solicitudes de sondeo de la versión 2 de la línea de base de sugerencias de resumen de conversaciones

Modelo de referencia v2

SuggestSummaryV2BaselineOperationsPerMinutePerProjectPerRegion

60 solicitudes/min

Regional

Proyecto de recurso

Solicitudes de sondeo de la versión 2 de la línea de base de sugerencias de resumen de conversaciones en cada región

Autoevaluación de resúmenes

Nombre del límite de cuota Valor predeterminado Region Recurso de facturación o proyecto de consumidor Descripción
ConcurrentSummarizationEvaluationsPerProject 1 solicitud por proyecto Proyecto de consumidor Solicitudes de autoevaluación

Si necesitas cuotas simultáneas adicionales, envía una solicitud a través de la Google Cloud consola. Esta función puede admitir hasta cuatro cuotas simultáneas por proyecto.

Asistencia de conocimientos generativa

Nombre del límite de cuota Valor predeterminado Region Recurso de facturación o proyecto de consumidor Descripción
SearchKnowledgeOperationsPerMinutePerProject 60 solicitudes por minuto Global Proyecto de consumidor Solicitudes de SearchKnowledge

Asistencia proactiva con conocimientos generativos

Nombre del límite de cuota Valor predeterminado Region Recurso de facturación o proyecto de consumidor Descripción
SuggestKnowledgeAssistOperationsPerMinutePerProject 60 solicitudes por minuto Global Proyecto de recursos Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist
SuggestKnowledgeAssistOperationsPerMinutePerProjectPerRegion 30 solicitudes por minuto Regional Proyecto de recursos Solicitudes de KnowledgeAssist a través de AnalyzeContent o SuggestKnowledgeAssist en cada región

Otras cuotas de API

Nombre del límite de cuota Valor predeterminado Region Recurso de facturación o proyecto de consumidor Descripción
ConversationOperationsPerMinutePerProject 300 solicitudes por minuto Global Proyecto de consumidor Otras solicitudes de conversación, excepto AnalyzeContent y StreamingAnalyzeContent. Por ejemplo, CreateConversation y CompleteConversation. La cuota se comparte entre Dialogflow y Asistente para agentes.
MessagePollingOperationsPerMinutePerProject 1200 solicitudes por minuto Global Proyecto de consumidor Solicitudes de ListMessages. La cuota se comparte entre Dialogflow y Asistente para agentes.
AnswerRecordOperationsPerMinutePerProject 300 solicitudes por minuto Global Proyecto de consumidor Solicitudes de AnswerRecord