Este documento apresenta as restrições da API e os limites de uso atuais da Speech-to-Text. Esta página será atualizada para refletir mudanças com relação a esses limites e cotas. Reservamos o direito de alterar esses limites.
Se necessário, é possível solicitar um aumento de cota. Leia a página sobre cota do Google Cloud para mais informações sobre como ver e gerenciar sua cota.
Após enviar sua solicitação, o Google pode entrar em contato com você para mais informações e para comunicar se a solicitação foi aprovada ou negada.
Limites de conteúdo
Solicitações síncronas
Solicitações de reconhecimento síncrono (usando o método Recognize
) aceitam dados de áudio inline no campo
content
da solicitação ou como um
URI do Cloud Storage no campo uri
da solicitação. O áudio enviado para uma solicitação síncrona é limitado a 10 MB ou 1 minuto de duração do áudio (o que for atingido primeiro). Para mais informações, consulte a visão geral do reconhecimento síncrono.
Solicitações de streaming
As solicitações de reconhecimento de streaming (usando o método StreamingRecognize
) aceitam apenas áudio inline no campo audio
da solicitação. Cada solicitação no stream é limitada a 25 KB de áudio. Um stream pode permanecer aberto por até 5 minutos, e o áudio precisa ser enviado a uma taxa que se aproxime do tempo real. Se você precisar fazer streaming de conteúdo por mais de 5 minutos,
consulte o
tutorial de streaming sem fim. Para mais informações sobre o reconhecimento de streaming, consulte a visão geral do reconhecimento de streaming.
Solicitações em lote
As solicitações de reconhecimento em lote (usando o método BatchRecognize
) só aceitam áudio como um URI do Cloud Storage no campo uri
da solicitação. Cada BatchRecognizeRequest
pode conter até 15 files
para transcrição. Cada arquivo pode ter até 8 horas de duração. Para mais informações sobre o reconhecimento síncrono, consulte a visão geral do reconhecimento em lote.
Reconhecimento de vários idiomas
O reconhecimento de vários idiomas só está disponível nestes endpoints da Speech-to-Text: global, Estados Unidos e União Europeia.
Adaptação
Em qualquer solicitação, você também pode fornecer recursos phraseSet e CustomClass. Os limites a seguir se aplicam a esses recursos:
Limite de adaptação de fala | Valor |
---|---|
Valor máximo de otimização de frase permitido | 20 |
Frases em um PhraseSet | 1.200 |
Frases por solicitação | 5.000 |
Caracteres por frase | 100 |
Total de caracteres por solicitação | 100.000 |
Número máximo de itens em uma CustomClass | 500 |
Máximo de caracteres por item de CustomClass | 500 |
Número máximo de conjuntos de frases por fala | 20 |
Número máximo de CustomClasses por SpeechAdaptation | 20 |
Limites de recursos
Estes são os limites de recurso atuais da API Speech-to-Text (sujeitos a alterações):
Tipo de limite | Limite de uso |
---|---|
Número de reconhecedores (por região) | 5.000 |
Número de classes personalizadas (por região) | 5.000 |
Número de conjuntos de frases (por região) | 5.000 |
Limites de solicitações
Estes são os limites de uso atuais da API Speech-to-Text (sujeitos a alterações):
Tipo de limite | Limite de uso |
---|---|
Solicitações de recursos a cada 60 segundos (por região) | 100 |
Solicitações de operação a cada 60 segundos (por região) | 150 |
Solicitações de reconhecimento síncrono a cada 60 segundos (por região) | 300 |
Solicitações de reconhecimento de streaming a cada 60 segundos (por região) * | 3.000 |
Sessões de reconhecimento de streaming a cada 5 minutos (por região) * | 300 |
Solicitações de reconhecimento em lote a cada 60 segundos (por região) | 150 |
* O reconhecimento de streaming tem um limite de cota de 300 sessões simultâneas a cada 5 minutos e um limite de 3.000 solicitações por minuto, que se aplica a todas as sessões simultâneas ao mesmo tempo. A solicitação de configuração inicial para uma sessão não é contabilizada na cota de solicitações.
Esses limites se aplicam a cada projeto de desenvolvedor da API Speech-to-Text e são compartilhados entre todos os aplicativos e endereços IP que usam um determinado projeto de desenvolvedor.