Cotas e limites

Este documento apresenta as restrições da API e os limites de uso atuais da Speech-to-Text. Esta página será atualizada para refletir mudanças com relação a esses limites e cotas. Reservamos o direito de alterar esses limites.

Se necessário, é possível solicitar um aumento de cota. Leia a página sobre cota do Google Cloud para mais informações sobre como ver e gerenciar sua cota.

Após enviar sua solicitação, o Google pode entrar em contato com você para mais informações e para comunicar se a solicitação foi aprovada ou negada.

Limites de conteúdo

Solicitações síncronas

Solicitações de reconhecimento síncrono (usando o método Recognize) aceitam dados de áudio inline no campo content da solicitação ou como um URI do Cloud Storage no campo uri da solicitação. O áudio enviado para uma solicitação síncrona é limitado a 10 MB ou 1 minuto de duração do áudio (o que for atingido primeiro). Para mais informações, consulte a visão geral do reconhecimento síncrono.

Solicitações de streaming

As solicitações de reconhecimento de streaming (usando o método StreamingRecognize) aceitam apenas áudio inline no campo audio da solicitação. Cada solicitação no stream é limitada a 25 KB de áudio. Um stream pode permanecer aberto por até 5 minutos, e o áudio precisa ser enviado a uma taxa que se aproxime do tempo real. Se você precisar fazer streaming de conteúdo por mais de 5 minutos, consulte o tutorial de streaming sem fim. Para mais informações sobre o reconhecimento de streaming, consulte a visão geral do reconhecimento de streaming.

Solicitações em lote

As solicitações de reconhecimento em lote (usando o método BatchRecognize) só aceitam áudio como um URI do Cloud Storage no campo uri da solicitação. Cada BatchRecognizeRequest pode conter até 15 files para transcrição. Cada arquivo pode ter até 8 horas de duração. Para mais informações sobre o reconhecimento síncrono, consulte a visão geral do reconhecimento em lote.

Reconhecimento de vários idiomas

O reconhecimento de vários idiomas só está disponível nestes endpoints da Speech-to-Text: global, Estados Unidos e União Europeia.

Adaptação

Em qualquer solicitação, você também pode fornecer recursos phraseSet e CustomClass. Os limites a seguir se aplicam a esses recursos:

Limite de adaptação de fala Valor
Valor máximo de otimização de frase permitido 20
Frases em um PhraseSet 1.200
Frases por solicitação 5.000
Caracteres por frase 100
Total de caracteres por solicitação 100.000
Número máximo de itens em uma CustomClass 500
Máximo de caracteres por item de CustomClass 500
Número máximo de conjuntos de frases por fala 20
Número máximo de CustomClasses por SpeechAdaptation 20

Limites de recursos

Estes são os limites de recurso atuais da API Speech-to-Text (sujeitos a alterações):

Tipo de limite Limite de uso
Número de reconhecedores (por região) 5.000
Número de classes personalizadas (por região) 5.000
Número de conjuntos de frases (por região) 5.000

Limites de solicitações

Estes são os limites de uso atuais da API Speech-to-Text (sujeitos a alterações):

Tipo de limite Limite de uso
Solicitações de recursos a cada 60 segundos (por região) 100
Solicitações de operação a cada 60 segundos (por região) 150
Solicitações de reconhecimento síncrono a cada 60 segundos (por região) 300
Solicitações de reconhecimento de streaming a cada 60 segundos (por região) * 3.000
Sessões de reconhecimento de streaming a cada 5 minutos (por região) * 300
Solicitações de reconhecimento em lote a cada 60 segundos (por região) 150

* O reconhecimento de streaming tem um limite de cota de 300 sessões simultâneas a cada 5 minutos e um limite de 3.000 solicitações por minuto, que se aplica a todas as sessões simultâneas ao mesmo tempo. A solicitação de configuração inicial para uma sessão não é contabilizada na cota de solicitações.

Esses limites se aplicam a cada projeto de desenvolvedor da API Speech-to-Text e são compartilhados entre todos os aplicativos e endereços IP que usam um determinado projeto de desenvolvedor.