Cuotas y límites

En este documento se detallan las restricciones y los límites de uso actuales de la API de Cloud Speech‑to‑Text. Esta página se actualizará para reflejar los cambios que se realicen a estas restricciones y los límites de uso. Nos reservamos el derecho de modificar los límites.

Puedes solicitar un incremento de la cuota si es necesario. Consulta la página de cuotas de Cloud para obtener más información sobre cómo revisar y administrar tu cuota.

Después de enviar la solicitud, Google puede comunicarse contigo para pedirte más información y también informarte si se aprobó o rechazó.

Límites de contenido

El contenido que se envía a Speech‑to‑Text debe proporcionarse como datos de audio, ya sea directamente en el campo content de la solicitud o referenciado en un URI de Google Cloud Storage, en el campo uri de la solicitud. Existe un límite de 10 MB para cada solicitud enviada a la API mediante archivos locales. En el caso de los métodos Recognize y LongRunningRecognize, este límite se aplica al tamaño de la solicitud enviada. En el caso del método StreamingRecognize, el límite de 10 MB se aplica a la solicitud StreamingRecognize inicial y al tamaño de cada mensaje individual de la transmisión. Si se supera este límite, se arroja un error. No hay límite de tamaño para las solicitudes enviadas con datos de audio almacenados en un depósito de Google Cloud Storage.

La API contiene los siguientes límites de tamaño (sujetos a cambios) para este tipo de contenido:

Límite de contenido Duración de audio
Solicitudes síncronas Aproximadamente 1 minuto
Solicitudes asíncronas Aproximadamente 480 minutos*
Solicitudes de transmisión Aproximadamente 5 minutos**

* En el caso de un audio con una duración superior a aproximadamente 1 minuto, se debe usar el campo uri para hacer referencia a un archivo de audio almacenado en Google Cloud Storage.
** Si necesitas transmitir contenido durante más de 5 minutos, consulta el instructivo de transmisión ilimitada.

Para las solicitudes StreamingRecognize, el audio debe enviarse a una velocidad que se aproxime al tiempo real.

Si se intenta procesar contenido que exceda estos límites, se producirá un error.

En todas las solicitudes, también puedes proporcionar un recurso de SpeechContext que contenga una lista de frases específicas para la solicitud. En este contexto, una sola palabra cuenta como una frase. Se aplican los siguientes límites a ese contexto:

Límite de SpeechContext Valor
Frases por solicitud 5,000
Total de caracteres por solicitud 100,000
Caracteres por frase 100

Límites de solicitudes

Los límites de uso actuales de la API para Speech‑to‑Text son los siguientes (y están sujetos a cambios):

Tipo de límite Límite de uso
Solicitudes cada 60 segundos* 900
Procesamiento por día 480 horas de audio

* Cada sesión StreamingRecognize se considera una única solicitud, a pesar de que la transmisión puede contener varios marcos de audio StreamingRecognizeRequest.

Si envías solicitudes o intentas procesar audio por encima de estos límites, se producirá un error.

Los límites se aplican a cada proyecto de desarrollador de Speech‑to‑Text y se comparten en todas las aplicaciones y direcciones IP que usen un proyecto de desarrollador específico.