Este documento apresenta as restrições da API e os limites de uso atuais do Cloud Speech-to-Text. Esta página será atualizada para refletir as mudanças em relação a essas restrições e os limites de uso. Reservamos o direito de alterar esses limites.
Se necessário, é possível solicitar um aumento de cota. Leia a página sobre cota do Cloud para mais informações sobre como ver e gerenciar sua cota.
Após enviar sua solicitação, o Google pode entrar em contato com você para mais informações e para comunicar se a solicitação foi aprovada ou negada.
Limites de conteúdo
O conteúdo do Speech-to-Text é fornecido como um arquivo de áudio, seja diretamente no
campo content
da solicitação ou como referência em um URI do Google Cloud Storage
no campo uri
da solicitação. Há um limite de 10 MB em todas as
solicitações únicas enviadas à API usando arquivos locais. No caso dos métodos
Recognize
e
LongRunningRecognize
,
esse limite se aplica ao tamanho da solicitação enviada. No caso do método
StreamingRecognize
,
o limite de 10 MB se aplica à solicitação inicial StreamingRecognize
e ao tamanho de cada mensagem individual no fluxo. Exceder esse limite
causará um erro. Não há limite de tamanho para solicitações enviadas usando dados de áudio armazenados
em um bucket do Google Cloud Storage.
A API contém os limites detalhados abaixo para o tamanho do conteúdo desse tipo (sujeitos a alterações).
Limite de conteúdo | Duração do áudio |
---|---|
Solicitações síncronas | Aproximadamente 1 minuto |
Solicitações assíncronas | Aproximadamente 480 minutos* |
Solicitações de streaming | Aproximadamente 5 minutos** |
* Todo áudio com cerca de um minuto ou mais precisa
usar o campo uri
para referenciar
um arquivo de áudio no Google Cloud Storage.
** Se você precisar fazer streaming de conteúdo por mais de cinco minutos, consulte o
tutorial de streaming sem fim (em inglês).
Para solicitações StreamingRecognize
, o áudio precisa ser enviado a uma taxa que
se aproxime do tempo real.
A tentativa de processar conteúdo que ultrapasse esses limites produzirá um erro. Para mais informações, consulte Mensagens de erro e Solução de problemas.
Em qualquer solicitação, também é possível fornecer um PhaseSet que contém uma lista de frases específicas para a solicitação. Nesse contexto, uma única palavra conta como uma frase. Os seguintes limites se aplicam a esse contexto:
Limite de adaptação de fala | Valor |
---|---|
Frases por solicitação | 5.000 |
Total de caracteres por solicitação | 100.000 |
Caracteres por frase | 100 |
Limites de solicitação
Estes são os limites de uso atuais da API Speech-to-Text (sujeitos a alterações):
Tipo de limite | Limite de uso |
---|---|
Solicitações de reconhecimento a cada 60 segundos* | 900 |
Solicitações de recursos de adaptação a cada 60 segundos* | 10 |
Processamento por dia | 480 horas de áudio |
* Cada sessão StreamingRecognize
é considerada uma única solicitação, mesmo que
inclua vários frames do áudio StreamingRecognizeRequest
no
stream.
As solicitações e/ou tentativas de processar áudio que ultrapassem esses limites produzirão um erro. Para mais informações, consulte Mensagens de erro e Solução de problemas.
Esses limites se aplicam a cada projeto de desenvolvedor da API Speech-to-Text e são compartilhados entre todos os aplicativos e endereços IP que usam um determinado projeto de desenvolvedor.