Cotas e limites

Mantenha tudo organizado com as coleções Salve e categorize o conteúdo com base nas suas preferências.

Este documento apresenta as restrições da API e os limites de uso atuais do Cloud Speech-to-Text. Esta página será atualizada para refletir as mudanças em relação a essas restrições e os limites de uso. Reservamos o direito de alterar esses limites.

Se necessário, é possível solicitar um aumento de cota. Leia a página sobre cota do Cloud para mais informações sobre como ver e gerenciar sua cota.

Após enviar sua solicitação, o Google pode entrar em contato com você para mais informações e para comunicar se a solicitação foi aprovada ou negada.

Limites de conteúdo

O conteúdo do Speech-to-Text é fornecido como um arquivo de áudio, seja diretamente no campo content da solicitação ou como referência em um URI do Google Cloud Storage no campo uri da solicitação. Há um limite de 10 MB em todas as solicitações únicas enviadas à API usando arquivos locais. No caso dos métodos Recognize e LongRunningRecognize, esse limite se aplica ao tamanho da solicitação enviada. No caso do método StreamingRecognize, o limite de 10 MB se aplica à solicitação inicial StreamingRecognize e ao tamanho de cada mensagem individual no fluxo. Exceder esse limite causará um erro. Não há limite de tamanho para solicitações enviadas usando dados de áudio armazenados em um bucket do Google Cloud Storage.

A API contém os limites detalhados abaixo para o tamanho do conteúdo desse tipo (sujeitos a alterações).

Limite de conteúdo Duração do áudio
Solicitações síncronas Aproximadamente 1 minuto
Solicitações assíncronas Aproximadamente 480 minutos*
Solicitações de streaming Aproximadamente 5 minutos**

* Todo áudio com cerca de um minuto ou mais precisa usar o campo uri para referenciar um arquivo de áudio no Google Cloud Storage.
** Se você precisar fazer streaming de conteúdo por mais de cinco minutos, consulte o tutorial de streaming sem fim (em inglês).

Para solicitações StreamingRecognize, o áudio precisa ser enviado a uma taxa que se aproxime do tempo real.

A tentativa de processar conteúdo que ultrapasse esses limites produzirá um erro. Para mais informações, consulte Mensagens de erro e Solução de problemas.

Em qualquer solicitação, também é possível fornecer um PhaseSet que contém uma lista de frases específicas para a solicitação. Nesse contexto, uma única palavra conta como uma frase. Os seguintes limites se aplicam a esse contexto:

Limite de adaptação de fala Valor
Frases por solicitação 5.000
Total de caracteres por solicitação 100.000
Caracteres por frase 100

Limites de solicitação

Estes são os limites de uso atuais da API Speech-to-Text (sujeitos a alterações):

Tipo de limite Limite de uso
Solicitações de reconhecimento a cada 60 segundos* 900
Solicitações de recursos de adaptação a cada 60 segundos* 10
Processamento por dia 480 horas de áudio

* Cada sessão StreamingRecognize é considerada uma única solicitação, mesmo que inclua vários frames do áudio StreamingRecognizeRequest no stream.

As solicitações e/ou tentativas de processar áudio que ultrapassem esses limites produzirão um erro. Para mais informações, consulte Mensagens de erro e Solução de problemas.

Esses limites se aplicam a cada projeto de desenvolvedor da API Speech-to-Text e são compartilhados entre todos os aplicativos e endereços IP que usam um determinado projeto de desenvolvedor.