Quote e limiti

Questo documento contiene le quote e i limiti più comuni per l'utilizzo di Dialogflow. Di seguito sono riportate informazioni su come trovare un elenco completo di quote e limiti. Ci riserviamo il diritto di modificare questi vincoli e aggiorneremo la presente pagina ogniqualvolta effettueremo tali modifiche.

Quote

Le quote sono vincoli predefiniti applicati al tuo progetto. Quando utilizzi funzionalità generative, ogni combinazione di modello e regione ha una propria quota generativa. Se utilizzi un'edizione a pagamento, puoi richiedere un aumento della quota. Le quote hanno lo scopo di limitare il carico di servizio per cliente, evitando di sovraccaricare i singoli servizi e di addebitare al cliente un utilizzo di risorse imprevisto.

Le quote di Dialogflow variano a seconda dell'edizione dell'agente. Le quote si applicano ai singoli progetti e vengono condivise fra tutti gli indirizzi IP e le applicazioni che utilizzano un progetto.

Dettagli sui limiti di tempo delle quote:

  • Le quote mensili vengono reintegrate il primo giorno di ogni mese alle ore 00:00 del fuso orario del Pacifico.
  • Le quote giornaliere vengono reintegrate giornalmente alle ore 00:00 del fuso orario del Pacifico. Quando il passaggio all'ora legale nel fuso orario del Pacifico aumenta la durata di un giorno, verrà concesso un bonus di quota proporzionale. Tuttavia, non è prevista alcuna deduzione equivalente nel caso di un giorno più breve dovuto al passaggio all'ora legale.
  • Le quote al minuto vengono aggiornate ogni 60 secondi allo scoccare del minuto.

Le quote elencate nella tabella delle quote sono quelle più comuni. Per esaminare tutte le quote, visita la pagina relativa alle quote di Dialogflow nella console Google Cloud.

Quote generative

Quando l'agente utilizza le funzionalità di generazione di Conversational Agents (Dialogflow CX), ogni combinazione di modello e regione ha quote univoche.

Identificatore quota

La quota ConversationalAgentLlmTokenConsumption è una quota regionale che monitora l'utilizzo dei token per i modelli linguistici di grandi dimensioni (LLM) negli agenti conversazionali (Dialogflow CX). Questa quota viene misurata su diversi modelli di base LLM e attualmente supporta i seguenti modelli:

  • text-bison-002
  • gemini-1.0-pro-001
  • gemini-1.5-pro
  • gemini-1.5-pro-002
  • gemini-1.5-flash
  • gemini-1.5-flash-002 La quota ConversationalAgentLlmTokenConsumption monitora l'utilizzo dei token LLM nelle seguenti funzionalità di Conversational Agents (Dialogflow CX):

  • Generatori

  • Generative Fallback

  • Playbook

  • Datastore

Il limite predefinito per la quota ConversationalAgentLlmTokenConsumpiton è 600.000 token al minuto.

Richiesta di aumento della quota per più regioni

Se devi richiedere un aumento della quota per più regioni, invia la richiesta per una delle seguenti regioni specifiche:

  • Per gli agenti nelle regioni multiple Stati Uniti e Globale, utilizza us-central1.
  • Per gli agenti nella multi-regione UE, utilizza europe-west4.

Visualizzare l'utilizzo dei token per regione e modello

Per ottenere informazioni sul consumo di token LLM in regioni e modelli diversi, segui questi passaggi utilizzando Metrics Explorer:

  1. Accedi a Esplora metriche: apri Esplora metriche.
  2. Seleziona la metrica:scegli Conversational Agent LLM tokens quota usage come metrica da analizzare.
  3. Configura aggregazione e allineamento:
    • Imposta la funzione di aggregazione su Sum per ottenere l'utilizzo totale dei token.
    • Fai clic su Configure Aligner per attivare il calcolo delle variazioni tra punti dati consecutivi nella serie temporale. In questo modo puoi comprendere le tendenze di utilizzo nel tempo.
  4. Definisci le dimensioni di aggregazione:per suddividere l'utilizzo dei token, seleziona location e base_model come dimensioni per l'aggregazione. In questo modo potrai vedere come varia il consumo di token in regioni e modelli diversi.
  5. Imposta la funzione di allineamento:scegli Sum come funzione di allineamento per calcolare la variazione totale dell'utilizzo dei token tra punti dati consecutivi.

Richiesta di aumento della quota

Se necessario, puoi richiedere un aumento della quota.

Se utilizzi progetti diversi per gli agenti Dialogflow e per l'autenticazione con gli account di servizio, richiedi un aumento della quota per il progetto consumer. Per ulteriori informazioni, consulta la pagina relativa all'utilizzo di più progetti per Dialogflow ES o all'utilizzo di più progetti per gli agenti conversazionali (Dialogflow CX).

Per gli agenti Dialogflow ES, assicurati di eseguire l'upgrade dell'agente alla versione Dialogflow Essentials prima di richiedere un aumento della quota.

Tabella delle quote

I seguenti termini vengono utilizzati per descrivere prezzi e quote:

  • Richiesta: per richiesta si intende qualsiasi chiamata API al servizio Dialogflow, effettuata sia direttamente tramite API che indirettamente tramite integrazione o console. A seconda dell'attività e della struttura dell'agente, il numero delle richieste necessarie a un utente finale per eseguire un'attività con un agente Dialogflow può variare notevolmente.
  • Sessione: una sessione è una conversazione tra un utente finale e un agente Dialogflow. Una sessione rimane attiva e i suoi dati archiviati per 30 minuti dopo l'invio dell'ultima richiesta per la sessione. Può essere una sessione di chat o una sessione vocale.
    • Sessione di chat: una sessione di chat utilizza solo testo sia per le richieste sia per le risposte.
    • Sessione vocale: una sessione vocale utilizza l'audio per richieste, risposte o entrambe.
  • Progetti consumer e progetti di risorse: se utilizzi più progetti, è possibile che il progetto associato all'autenticazione della richiesta (progetto consumer) non coincida con quello associato all'agente nella richiesta (progetto di risorsa). In questo caso, il progetto consumer viene utilizzato per determinare i prezzi e le quote. Per ulteriori informazioni, consulta la pagina relativa all'utilizzo di più progetti per Dialogflow ES o all'utilizzo di più progetti per gli agenti conversazionali (Dialogflow CX).

Le seguenti tabelle permettono di confrontare le quote delle edizioni in base al tipo di agente. A meno che una funzionalità non sia indicata come inclusa, le quote sono cumulative per tutte le funzionalità utilizzate da una richiesta.

Agente Conversational Agents (Dialogflow CX)

Funzionalità Versione Conversational Agents (Dialogflow CX)
Testo
(include tutte le richieste DetectIntent, StreamingDetectIntent e FulfillIntent che non contengono audio)
1200 richieste al minuto
Input/output audio
(riconoscimento vocale, conversione della voce in testo, STT, sintesi vocale, conversione del testo in voce, TTS, telefonia)
600 richieste al minuto
Funzionalità generative
(playbook, datastore, generatori, fallback generativo)
600.000 token al minuto, consulta le quote per i modelli generativi
Gateway di telefonia Dialogflow CX
Include input e output audio.
100 minuti totali di conversazione telefonica al minuto‡
Richieste di scrittura in fase di progettazione
Ad esempio, chiamate per la creazione o l'aggiornamento di un agente.
60 richieste al minuto
Richieste di lettura in fase di progettazione
Ad esempio, chiamate per elencare o recuperare le risorse dell'agente.
200 richieste al minuto
Altre richieste di sessione
Ad esempio, impostazione o recupero di entità sessione.
100 richieste al minuto

Agente Dialogflow ES

Funzionalità Trial Edition Essentials Edition
Testo
(include tutte le richieste DetectIntent e StreamingDetectIntent che non contengono audio)
180 richieste al minuto ¶ 600 richieste al minuto ¶
Input audio
(anche denominato riconoscimento vocale, conversione della voce in testo, STT)
100 richieste al minuto †

1000 richieste al giorno †

15.000 richieste al mese †

Durata audio massima di 60 secondi per richiesta †
300 richieste al minuto †

Massimo 60 secondi di durata audio per richiesta †
Output audio
(anche denominato sintesi vocale, conversione del testo in voce, TTS)
Come per input audio Come per input audio
Connettori di conoscenza (beta) 10 MB di dimensione massima totale del documento

1000 richieste al mese

100 richieste al giorno
Nessun limite #
Analisi del sentiment Non disponibile Nessun limite #
Gateway di telefonia Dialogflow ES
Include input e output audio.
Numero verde: non disponibile

3 minuti totali di conversazione telefonica al minuto‡

30 minuti di telefono al giorno

500 minuti di telefono al mese

Numero di telefono riservato per 30 giorni
100 minuti totali di conversazione telefonica al minuto‡
Mega-agente 1000 richieste al giorno Nessun limite #
Richieste di scrittura in fase di progettazione
Ad esempio, chiamate per la creazione o l'aggiornamento di un agente.
60 richieste al minuto 60 richieste al minuto
Richieste di lettura in fase di progettazione
Ad esempio, chiamate per elencare o recuperare le risorse dell'agente.
60 richieste al minuto 60 richieste al minuto
Altre richieste di sessione
Ad esempio, impostazione o recupero di entità sessione o aggiornamento/interrogazione del contesto.
100 richieste al minuto 100 richieste al minuto

Agent Assist

Se utilizzi Agent Assist, si applicano anche le quote elencate nelle schede Agente Conversational Agents (Dialogflow CX) e Agente Dialogflow ES, a seconda del tipo di agente in uso.

Funzionalità Trial Edition Essentials Edition
Altre operazioni di conversazione tramite Agent Assist
Sono incluse tutte le richieste che gestiscono le conversazioni e i partecipanti.
Non disponibile 300 richieste al minuto
Operazioni di analisi testo/audio tramite Agent Assist
Sono incluse tutte le richieste AnalyzeContent o StreamingAnalyzeContent per ogni fase della conversazione. Sono incluse tutte le richieste che coinvolgono testo, sintesi vocale e/o riconoscimento vocale.
Non disponibile 300 richieste al minuto
Richieste di polling dei suggerimenti per il riassunto della conversazione di Agent Assist
Sono incluse tutte le richieste per ottenere i riepiloghi della conversazione.
Non disponibile 300 richieste al minuto

Limiti

I limiti sono vincoli fissi che non possono essere incrementati. Molti campi e risorse presentano limiti di numero, durata o lunghezza, che sono vincoli fissi per l'implementazione del servizio.

Nelle tabelle seguenti sono elencati i limiti più comuni. La documentazione specifica delle funzionalità e la documentazione di riferimento per le API possono specificare limiti aggiuntivi.

Limiti di numero

Agente Conversational Agents (Dialogflow CX)

Descrizione Limite
Numero massimo di agenti per Google Cloud progetto 1000
Numero massimo di numeri di telefono per progetto 5
Numero massimo di flussi per agente 50
Numero massimo di tipi di entità per agente 250
Numero massimo di webhook per agente 100
Numero massimo di ambienti per agente 20
Numero massimo di casi di test per agente 2000
Numero massimo di log delle modifiche per agente 20.000
Numero massimo di pagine per flusso 250
Numero massimo di gruppi di route per flusso 100
Numero massimo di versioni per flusso 20
Numero massimo di intent per agente 10.000
Numero massimo di intent di riferimento per flusso 2000
Numero massimo di frasi di addestramento per intent e per lingua (eccetto "intent negativo predefinito") 2000
Numero massimo di frasi di addestramento per flusso e per lingua 100.000
Numero massimo di parametri per intent 20
Numero massimo di voci di entità per intent 30.000
Numero massimo di sinonimi per voce di entità 200
Numero massimo di valori di riferimento e sinonimi di entità per agente e per lingua 1.000.000
Numero massimo di parametri per pagina 20
Numero massimo di route per pagina 2000
Numero massimo di gestori di eventi per pagina 100
Numero massimo di route per gruppo di route 2000
Numero massimo di playbook per agente 50
Numero massimo di invocazioni di playbook in un turno di conversazione 3
Numero massimo di chiamate LLM per chiamata di playbook nello stesso turno di conversazione 10
Numero massimo di esempi di playbook per agente Con la strategia di recupero degli esempi predefinita, il sistema limita automaticamente il numero di esempi in base al limite di token del modello in uso, in base alla pertinenza degli esempi al contesto della sessione.
Numero massimo di versioni per playbook 100
Numero massimo di strumenti per agente 100

Agente Dialogflow ES

Descrizione Limite
Numero massimo di agenti per regione e per progetto Google Cloud ¶ 1
Numero massimo di numeri di telefono per progetto 5
Numero massimo di intent 2000
Numero massimo di tipi di entità 250
Numero massimo di frasi di addestramento per intent e per lingua 2000
Numero massimo di frasi di addestramento per agente e per lingua 100.000
Numero massimo di voci di entità 30000
Numero massimo di sinonimi per voce di entità 200
Numero massimo di valori e sinonimi di riferimento entità per agente e per lingua 1.000.000
Numero massimo di parametri per intent 20
Numero massimo di contesti di input per intent 5
Numero massimo di contesti di output per intent 30
Numero massimo di risposte di testo per intent e per lingua 30
Numero massimo di prompt per parametro e per lingua 30
Numero massimo di ambienti per agente 10
Numero massimo di versioni per agente 1000

Agent Assist

Se utilizzi Agent Assist, i limiti elencati nelle schede Agente Conversational Agents (Dialogflow CX) e Dialogflow ES si applicano anche in base al tipo di agente in uso.

Descrizione Limite
Numero minimo di conversazioni necessarie per l'addestramento del modello 30.000
Numero massimo di modelli addestrati contemporaneamente per progetto 1
Numero massimo di numeri di telefono per progetto 5
Numero massimo di ore GPU del nodo di addestramento al mese 4200

Limiti di durata

Agente Conversational Agents (Dialogflow CX)

Descrizione Limite
Timeout massimo per webhook 30 secondi
Durata massima dell'input audio 120 secondi

Agente Dialogflow ES

Descrizione Limite
Timeout massimo del webhook 5 secondi
Durata massima per chiamate telefoniche 3,5 ore

Limiti di lunghezza

Agente Conversational Agents (Dialogflow CX)

Descrizione Limite
Lunghezza massima della frase di addestramento 768 caratteri
Lunghezza massima della risposta testuale 4000 caratteri
Lunghezza massima dell'input di testo per il rilevamento dell'intent corrispondente a intent non generativi o parametri 256 caratteri

Agente Dialogflow ES

Descrizione Limite
Lunghezza minima nome agente 1 carattere
Lunghezza massima nome agente 150 caratteri
Lunghezza massima descrizione agente 500 caratteri
Lunghezza massima del nome dell'intent 100 caratteri
Lunghezza massima del tipo di entità 30 caratteri
Lunghezza massima della frase di addestramento 768 caratteri
Lunghezza massima del nome dell'azione 250 caratteri
Lunghezza massima del nome del contesto 250 caratteri
Lunghezza massima del valore della voce 512 caratteri
Lunghezza massima del nome del parametro 30 caratteri
Lunghezza massima della risposta testuale 4000 caratteri
Lunghezza massima dell'input di testo per il rilevamento dell'intent* 256 caratteri
Lunghezza massima del nome evento 150 caratteri

Limiti di dimensioni

Agente Conversational Agents (Dialogflow CX)

Descrizione Limite
Dimensioni massime della richiesta di sintesi vocale Consulta i limiti dei contenuti dell'API TTS

Agente Dialogflow ES

Descrizione Limite

Dimensione massima dell'agente (contenuti non compressi) per l'importazione/ripristino dell'agente | 50 MB

Dimensione massima della richiesta di sintesi vocale | Consulta i limiti relativi ai contenuti dell'API TTS