Se necessário, é possível solicitar um aumento de cota. Consulte a Google Cloud página de cotas para mais informações sobre como ver e gerenciar sua cota.
Após o envio da sua solicitação, o Google poderá entrar em contato com você para mais informações e para comunicar se a solicitação foi aprovada ou negada.
Limites de conteúdo
Solicitações síncronas
Solicitações de reconhecimento síncrono (usando o método Recognize) aceitam dados de áudio inline no campo content da solicitação ou como um URI do Cloud Storage no campo uri da solicitação. O áudio enviado para uma solicitação síncrona é limitado a 10 MB ou 1 minuto de duração do áudio (o que for atingido primeiro). Para mais informações sobre reconhecimento síncrono, consulte a Visão geral do reconhecimento síncrono.
Solicitações de streaming
As solicitações de reconhecimento de streaming (usando o método StreamingRecognize) aceitam apenas áudio inline no campo audio da solicitação. Cada solicitação no stream é limitada a 25 KB de áudio. Um stream pode permanecer aberto por até 5 minutos, e o áudio precisa ser enviado a uma taxa que se aproxime do tempo real. Se você precisar fazer streaming de conteúdo por mais de 5 minutos, consulte o tutorial de streaming sem fim. Para mais informações sobre reconhecimento de streaming, consulte a Visão geral do reconhecimento de streaming.
Solicitações em lote
As solicitações de reconhecimento em lote (usando o método BatchRecognize) só aceitam áudio como um URI do Cloud Storage no campo uri da solicitação. Cada BatchRecognizeRequest pode conter até 15 files para transcrição.
Cada arquivo pode ter até 8 horas de duração. Para mais informações sobre o reconhecimento síncrono, consulte a Visão geral do reconhecimento em lote.
Reconhecimento de vários idiomas
O reconhecimento de vários idiomas só está disponível nestes endpoints da Cloud Speech-to-Text: global, Estados Unidos e União Europeia.
Adaptação
Em qualquer solicitação, você também pode fornecer os recursos PhraseSet e CustomClass. Os seguintes limites se aplicam a esses recursos:
| Limite de adaptação da fala | Valor |
|---|---|
| Valor máximo de otimização de frase permitido | 20 |
| Frases em um PhraseSet | 1.200 |
| Frases por solicitação | 5.000 |
| Caracteres por frase | 100 |
| Total de caracteres por solicitação | 100.000 |
| Número máximo de itens em uma CustomClass | 500 |
| Máximo de caracteres por item de CustomClass | 500 |
| Número máximo de PhraseSets por SpeechAdaptation | 20 |
| Número máximo de CustomClasses por SpeechAdaptation | 20 |
Limites de recurso
Estes são os limites de uso atuais da API Cloud Speech-to-Text (sujeitos a alterações):
| Tipo de limite | Limite de uso |
|---|---|
| Número de reconhecedores (por região) | 5.000 |
| Número de classes personalizadas (por região) | 5.000 |
| Número de conjuntos de frases (por região) | 5.000 |
Limites de solicitações
Estes são os limites de uso atuais para a API Cloud Speech-to-Text (sujeitos a alterações):
| Tipo de limite | Limite de uso |
|---|---|
| Solicitações de recursos a cada 60 segundos (por região) | 100 |
| Solicitações de operação a cada 60 segundos (por região) | 150 |
| Solicitações de reconhecimento síncrono a cada 60 segundos (por região) | 300 |
| Solicitações de reconhecimento de streaming a cada 60 segundos (por região) * | 1.000.000 |
| Sessões simultâneas de StreamingRecognize (por região) * | 300 |
| Solicitações de reconhecimento em lote a cada 60 segundos (por região) | 150 |
* O reconhecimento de streaming tem um limite de cota de 300 sessões simultâneas a cada 5 minutos e um limite de 3.000 solicitações por minuto, que se aplica a todas as sessões simultâneas ao mesmo tempo. A solicitação de configuração inicial para uma sessão não é contabilizada na cota de solicitações.
Esses limites se aplicam a cada projeto de desenvolvedor da Cloud Speech-to-Text e são compartilhados entre todos os aplicativos e endereços IP que usam um determinado projeto de desenvolvedor.