Cuotas y límites

En este documento, se describen las cuotas y los límites que se aplican a Speech-to-Text.

Una cuota restringe cuánto de un recurso compartido de Google Cloud en particular puede usar tu proyecto de Google Cloud, incluidos los componentes de red, hardware y software. Por lo tanto, las cuotas son parte de un sistema que hace las siguientes acciones:

Supervisa el uso o consumo de productos y servicios de Google Cloud.
Restringe el consumo de esos recursos por motivos que incluyen garantizar la equidad y reducir los aumentos repentinos de uso.
Mantiene los parámetros de configuración que aplican de forma automática las restricciones prescritas.
Proporciona un medio para solicitar o hacer cambios en la cuota.

En la mayoría de los casos, cuando se excede un límite de cuota, el sistema bloquea de inmediato el acceso al recurso de Google correspondiente, y la tarea que intentas hacer falla. En la mayoría de los casos, las cuotas se aplican a cada proyecto de Google Cloud y se comparten entre todas las aplicaciones y direcciones IP que usan ese proyecto.

Para aumentar o disminuir la mayoría de las cuotas, usa la consola de Google Cloud. Para obtener más información, consulta Solicita una cuota mayor.

También hay límites para los recursos de Speech-to-Text. Estos límites no están relacionados con el sistema de cuotas. Los límites no se pueden cambiar, a menos que se indique lo contrario.

En este documento se detallan las restricciones y los límites de uso actuales de la API de Cloud Speech‑to‑Text. Esta página se actualizará para reflejar los cambios que se realicen a estas restricciones y los límites de uso. Nos reservamos el derecho de modificar los límites.

Límites de contenido

El contenido que se envía a Speech‑to‑Text debe proporcionarse como datos de audio, ya sea directamente en el campo content de la solicitud o referenciado en un URI de Google Cloud Storage, en el campo uri de la solicitud. Existe un límite de 10 MB para cada solicitud enviada a la API mediante archivos locales. En el caso de los métodos Recognize y LongRunningRecognize, este límite se aplica al tamaño de la solicitud enviada. En el caso del método StreamingRecognize, el límite de 10 MB se aplica a la solicitud StreamingRecognize inicial y al tamaño de cada mensaje individual de la transmisión. Si se supera este límite, se arroja un error. No hay límite de tamaño para las solicitudes enviadas con datos de audio almacenados en un bucket de Google Cloud Storage.

La API contiene los siguientes límites de tamaño (sujetos a cambios) para este tipo de contenido:

Límite de contenido	Duración de audio
Solicitudes síncronas	Aproximadamente 1 minuto
Solicitudes asíncronas	Aproximadamente 480 minutos*
Solicitudes de transmisión	Aproximadamente 5 minutos**

* En el caso de un audio con una duración superior a aproximadamente 1 minuto, se debe usar el campo uri para hacer referencia a un archivo de audio almacenado en Google Cloud Storage.
** Si necesitas transmitir contenido durante más de 5 minutos, consulta el instructivo de transmisión ilimitada.

Para las solicitudes StreamingRecognize, el audio debe enviarse a una velocidad que se aproxime al tiempo real.

Si se intenta procesar contenido que exceda estos límites, se producirá un error. Si deseas obtener más información, consulta Mensajes de error y Solución de problemas.

En todas las solicitudes, también puedes proporcionar un recurso de PhraseSet que contenga una lista de frases específicas para la solicitud. En este contexto, una sola palabra cuenta como una frase. Se aplican los siguientes límites a ese contexto:

Límite de adaptación de voz	Valor
Frases por solicitud	5,000
Total de caracteres por solicitud	100,000
Caracteres por frase	100

Límites de solicitudes

Los límites de uso actuales de la API para Speech‑to‑Text son los siguientes (y están sujetos a cambios):

Tipo de límite	Límite de uso
Solicitudes de reconocimiento cada 60 segundos*	900
Solicitudes de recursos de adaptación por 60 segundos*	10
Procesamiento por día	480 horas de audio

* Cada sesión StreamingRecognize se considera una única solicitud, a pesar de que la transmisión puede contener varios marcos de audio StreamingRecognizeRequest.

Si envías solicitudes o intentas procesar audio por encima de estos límites, se producirá un error. Si deseas obtener más información, consulta Mensajes de error y Solución de problemas.

Los límites se aplican a cada proyecto de desarrollador de Speech‑to‑Text y se comparten en todas las aplicaciones y direcciones IP que usen un proyecto de desarrollador específico.