Cotas e limites

Neste documento, apresentamos as restrições da API e os limites de uso atuais do Speech-to-Text. Esta página será atualizada para refletir mudanças com relação a essas restrições e limites de uso. Reservamos o direito de alterar esses limites.

Se necessário, é possível solicitar um aumento de cota. Consulte a Google Cloud página de cotas para mais informações sobre como ver e gerenciar sua cota.

Após o envio da sua solicitação, o Google poderá entrar em contato com você para mais informações e para comunicar se a solicitação foi aprovada ou negada.

Limites de conteúdo

Solicitações síncronas

Solicitações de reconhecimento síncrono (usando o método Recognize) aceitam dados de áudio inline no campo content da solicitação ou como um URI do Cloud Storage no campo uri da solicitação. O áudio enviado para uma solicitação síncrona é limitado a 10 MB ou 1 minuto de duração do áudio (o que for atingido primeiro). Para mais informações sobre reconhecimento síncrono, consulte a Visão geral do reconhecimento síncrono.

Solicitações de streaming

As solicitações de reconhecimento de streaming (usando o método StreamingRecognize) aceitam apenas áudio inline no campo audio da solicitação. Cada solicitação no stream é limitada a 25 KB de áudio. Um stream pode permanecer aberto por até 5 minutos, e o áudio precisa ser enviado a uma taxa que se aproxime do tempo real. Se você precisar fazer streaming de conteúdo por mais de 5 minutos, consulte o tutorial de streaming sem fim. Para mais informações sobre reconhecimento de streaming, consulte a Visão geral do reconhecimento de streaming.

Solicitações em lote

As solicitações de reconhecimento em lote (usando o método BatchRecognize) só aceitam áudio como um URI do Cloud Storage no campo uri da solicitação. Cada BatchRecognizeRequest pode conter até 15 files para transcrição. Cada arquivo pode ter até 8 horas de duração. Para mais informações sobre o reconhecimento síncrono, consulte a Visão geral do reconhecimento em lote.

Reconhecimento de vários idiomas

O reconhecimento de vários idiomas só está disponível nestes endpoints do Speech-to-Text: global, Estados Unidos e União Europeia.

Adaptação

Em qualquer solicitação, você também pode fornecer recursos phraseSet e CustomClass. Os seguintes limites se aplicam a esses recursos:

Limite de adaptação da fala	Valor
Valor máximo de otimização de frase permitido	20
Frases em um PhraseSet	1.200
Frases por solicitação	5.000
Caracteres por frase	100
Total de caracteres por solicitação	100.000
Número máximo de itens em uma CustomClass	500
Máximo de caracteres por item de CustomClass	500
Número máximo de PhraseSets por SpeechAdaptation	20
Número máximo de CustomClasses por SpeechAdaptation	20

Limites de recurso

Estes são os limites de uso atuais da API Speech-to-Text (sujeitos a alterações):

Tipo de limite	Limite de uso
Número de reconhecedores (por região)	5.000
Número de classes personalizadas (por região)	5.000
Número de conjuntos de frases (por região)	5.000

Limites de solicitações