Quote e limiti

Questo documento contiene le restrizioni e i limiti di utilizzo attuali per l'API Speech-to-Text. Questa pagina sarà aggiornata per riflettere eventuali modifiche a tali restrizioni e limiti di utilizzo. Ci riserviamo il diritto di modificare questi limiti.

Se necessario, puoi richiedere un aumento della quota. Consulta la pagina delle quote di Google Cloud per ulteriori informazioni su come visualizzare e gestire la quota.

Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e per comunicarti se è stata approvata o rifiutata.

Limiti per i contenuti

Richieste sincrone

Le richieste di riconoscimento sincrono (con il metodo Recognize) accettano dati audio incorporati nel campo content della richiesta o come URI Cloud Storage nel campo uri della richiesta. L'audio inviato a una richiesta sincrona è limitato a 10 MB o a 1 minuto di durata audio (a seconda dell'evento che si verifica per primo). Per ulteriori informazioni sul riconoscimento sincrono, consulta la panoramica del riconoscimento sincrono.

Richieste di streaming

Le richieste di riconoscimento streaming (con il metodo StreamingRecognize) accettano solo l'audio in linea nel campo audio della richiesta. Ogni richiesta nello stream è limitata a 25 kB di audio. Uno stream può rimanere aperto fino a un massimo di 5 minuti e l'audio deve essere inviato con una velocità simile a quella in tempo reale. Se devi eseguire lo streaming di contenuti per più di 5 minuti, consulta il tutorial per lo streaming senza fine. Per ulteriori informazioni sul riconoscimento dei flussi di dati, consulta la panoramica sul riconoscimento dei flussi di dati.

Richieste batch

Le richieste di riconoscimento batch (con il metodo BatchRecognize) accettano solo l'audio come URI Cloud Storage nel campo uri della richiesta. Ogni BatchRecognizeRequest può contenere fino a 15 files da trascrivere. Ogni file può avere una durata fino a 8 ore. Per ulteriori informazioni sul riconoscimento sincrono, consulta la panoramica del riconoscimento batch.

Riconoscimento di più lingue

Il riconoscimento di più lingue è disponibile solo negli endpoint Speech-to-Text globali, negli Stati Uniti e nell'UE.

Adattamento

In qualsiasi richiesta puoi anche fornire risorse PhraseSet e CustomClass. A queste risorse si applicano i limiti seguenti:

Limite di adattamento vocale Valore
Valore massimo consentito per il boost di frase 20
Frasi in un PhraseSet 1200
Frasi per richiesta 5000
Caratteri per frase 100
Caratteri totali per richiesta 100.000
Numero massimo di elementi in un CustomClass 500
Numero massimo di caratteri per elemento CustomClass 500
Numero massimo di phraseSet per SpeechAdaptation 20
Numero massimo di classi personalizzate per SpeechAdaptation 20

Limiti delle risorse

Di seguito sono riportati i limiti attuali delle risorse dell'API per Speech-to-Text (soggetti a modifica):

Tipo di limite Limite di utilizzo
Numero di riconoscimenti (per regione) 5000
Numero di classi personalizzate (per regione) 5000
Numero di serie di frasi (per regione) 5000

Limiti per le richieste

Di seguito sono riportati i limiti di utilizzo attuali (soggetti a modifica) relativi all'API Speech-to-Text:

Tipo di limite Limite di utilizzo
Richieste di risorse per 60 secondi (per regione) 100
Richieste di operazioni per 60 secondi (per regione) 150
Richieste di riconoscimento sincrono per 60 secondi (per regione) 300
Richieste di riconoscimento streaming per 60 secondi (per regione) * 3000
Sessioni di riconoscimento dello streaming ogni 5 minuti (per regione) * 300
Richieste di riconoscimento batch per 60 secondi (per regione) 150

* Il riconoscimento dei flussi di dati ha un limite di quota di 300 sessioni simultanee ogni 5 minuti e un limite di 3000 richieste al minuto, applicabile a tutte le sessioni simultanee. La richiesta di configurazione iniziale per una sessione non viene conteggiata nella quota di richieste.

Questi limiti vengono applicati a ogni progetto di sviluppatori Speech-to-Text e sono condivisi tra tutte le applicazioni e gli indirizzi IP che utilizzano un determinato progetto di sviluppatori.