Questo documento contiene le restrizioni e i limiti di utilizzo attuali per l'API Speech-to-Text. Questa pagina sarà aggiornata per riflettere eventuali modifiche a tali restrizioni e limiti di utilizzo. Ci riserviamo il diritto di modificare questi limiti.
Se necessario, puoi richiedere un aumento della quota. Consulta la pagina delle quote di Google Cloud per ulteriori informazioni su come visualizzare e gestire la quota.
Dopo aver inviato la richiesta, Google potrebbe contattarti per ulteriori informazioni e per comunicarti se è stata approvata o rifiutata.
Limiti per i contenuti
Richieste sincrone
Le richieste di riconoscimento sincrono (con il metodo Recognize
) accettano dati audio incorporati nel campo content
della richiesta o come URI Cloud Storage nel campo uri
della richiesta. L'audio inviato a una richiesta sincrona è limitato a 10 MB o a 1 minuto di durata audio (a seconda dell'evento che si verifica per primo). Per ulteriori informazioni sul riconoscimento sincrono, consulta la panoramica del riconoscimento sincrono.
Richieste di streaming
Le richieste di riconoscimento streaming (con il metodo StreamingRecognize
) accettano solo l'audio in linea nel campo audio
della richiesta. Ogni richiesta nello stream è limitata a 25 kB di audio. Uno stream può rimanere aperto fino a un massimo di 5 minuti e l'audio deve essere inviato con una velocità simile a quella in tempo reale. Se devi eseguire lo streaming di contenuti per più di 5 minuti,
consulta il
tutorial per lo streaming senza fine. Per ulteriori informazioni sul riconoscimento dei flussi di dati, consulta la panoramica sul riconoscimento dei flussi di dati.
Richieste batch
Le richieste di riconoscimento batch (con il metodo BatchRecognize
) accettano solo l'audio come URI Cloud Storage nel campo uri
della richiesta. Ogni
BatchRecognizeRequest
può contenere fino a 15
files
da trascrivere. Ogni file può avere una durata
fino a 8 ore. Per ulteriori informazioni sul riconoscimento sincrono, consulta la panoramica del riconoscimento batch.
Riconoscimento di più lingue
Il riconoscimento di più lingue è disponibile solo negli endpoint Speech-to-Text globali, negli Stati Uniti e nell'UE.
Adattamento
In qualsiasi richiesta puoi anche fornire risorse PhraseSet e CustomClass. A queste risorse si applicano i limiti seguenti:
Limite di adattamento vocale | Valore |
---|---|
Valore massimo consentito per il boost di frase | 20 |
Frasi in un PhraseSet | 1200 |
Frasi per richiesta | 5000 |
Caratteri per frase | 100 |
Caratteri totali per richiesta | 100.000 |
Numero massimo di elementi in un CustomClass | 500 |
Numero massimo di caratteri per elemento CustomClass | 500 |
Numero massimo di phraseSet per SpeechAdaptation | 20 |
Numero massimo di classi personalizzate per SpeechAdaptation | 20 |
Limiti delle risorse
Di seguito sono riportati i limiti attuali delle risorse dell'API per Speech-to-Text (soggetti a modifica):
Tipo di limite | Limite di utilizzo |
---|---|
Numero di riconoscimenti (per regione) | 5000 |
Numero di classi personalizzate (per regione) | 5000 |
Numero di serie di frasi (per regione) | 5000 |
Limiti per le richieste
Di seguito sono riportati i limiti di utilizzo attuali (soggetti a modifica) relativi all'API Speech-to-Text:
Tipo di limite | Limite di utilizzo |
---|---|
Richieste di risorse per 60 secondi (per regione) | 100 |
Richieste di operazioni per 60 secondi (per regione) | 150 |
Richieste di riconoscimento sincrono per 60 secondi (per regione) | 300 |
Richieste di riconoscimento streaming per 60 secondi (per regione) * | 3000 |
Sessioni di riconoscimento dello streaming ogni 5 minuti (per regione) * | 300 |
Richieste di riconoscimento batch per 60 secondi (per regione) | 150 |
* Il riconoscimento dei flussi di dati ha un limite di quota di 300 sessioni simultanee ogni 5 minuti e un limite di 3000 richieste al minuto, applicabile a tutte le sessioni simultanee. La richiesta di configurazione iniziale per una sessione non viene conteggiata nella quota di richieste.
Questi limiti vengono applicati a ogni progetto di sviluppatori Speech-to-Text e sono condivisi tra tutte le applicazioni e gli indirizzi IP che utilizzano un determinato progetto di sviluppatori.