Precios de Speech-to-Text

Contactar con Ventas Ir a la consola

El precio de Speech-to-Text se determina en función de la cantidad de audio que procese correctamente el servicio cada mes y se mide en incrementos de un segundo. Si la API devuelve una respuesta, significa que el audio enviado en la solicitud se ha procesado correctamente. Se incluye una respuesta vacía, que indica que la API ha procesado el audio, pero no ha podido transcribirlo. Las solicitudes que causen un error de servidor no cuentan como procesadas correctamente y, por lo tanto, no tienen ningún coste.

Puedes ver el estado de tu facturación, incluidos el uso y la factura actual, en la consola de Google Cloud. Si quieres obtener más información sobre cómo gestionar tu cuenta, consulta la documentación de Facturación de Cloud o la página de asistencia para la facturación.

Versión 2 de la API Speech-to-Text

Los precios que figuran en la siguiente tabla se aplican a los minutos de audio procesados al mes en la API Speech-to-Text v2.

Modelos de reconocimiento estándar

Categoría	Modelo	De 0 a 500.000 minutos	De 500.000 minutos a 1.000.000 minutos	De 1.000.000 minutos a 2.000.000 minutos	2.000.000 minutos o más
Reconocimiento (sku:3099-B70F-0949)	Estándar	0,016 US$ / 1 minute, per 1 month / account	0,01 US$ / 1 minute, per 1 month / account	0,008 US$ / 1 minute, per 1 month / account	0,004 US$ / 1 minute, per 1 month / account
Reconocimiento (con registro) (sku:4292-8666-5DBB)	Estándar	0,012 US$ / 1 minute, per 1 month / account	0,0075 US$ / 1 minute, per 1 month / account	0,006 US$ / 1 minute, per 1 month / account	0,003 US$ / 1 minute, per 1 month / account

Categoría

Modelo

De 0 a 500.000 minutos

De 500.000 minutos a 1.000.000 minutos

De 1.000.000 minutos a 2.000.000 minutos

2.000.000 minutos o más

Reconocimiento

(sku:3099-B70F-0949)

Estándar

0,016 US$ / 1 minute, per 1 month / account

0,01 US$ / 1 minute, per 1 month / account

0,008 US$ / 1 minute, per 1 month / account

0,004 US$ / 1 minute, per 1 month / account

Reconocimiento (con registro)

(sku:4292-8666-5DBB)

Estándar

0,012 US$ / 1 minute, per 1 month / account

0,0075 US$ / 1 minute, per 1 month / account

0,006 US$ / 1 minute, per 1 month / account

0,003 US$ / 1 minute, per 1 month / account

Modelos médicos

Categoría	Modelo	Entre 0 y 60 minutos	60 minutos o más
Dictado médico (sku:6649-62EF-CB8F)	Médico²	0 US$ (Free) / 1 minute, per 1 month / account	0,078 US$ / 1 minute, per 1 month / account
Conversación médica (sku:7247-19E1-FB4D)	Médico²	0 US$ (Free) / 1 minute, per 1 month / account	0,078 US$ / 1 minute, per 1 month / account

Categoría

Modelo

Entre 0 y 60 minutos

60 minutos o más

Dictado médico

(sku:6649-62EF-CB8F)

Médico²

0 US$ (Free) / 1 minute, per 1 month / account

0,078 US$ / 1 minute, per 1 month / account

Conversación médica

(sku:7247-19E1-FB4D)

Médico²

0 US$ (Free) / 1 minute, per 1 month / account

0,078 US$ / 1 minute, per 1 month / account

Reconocimiento dinámico por lotes estándar

Categoría	Modelo	Por minuto
Reconocimiento dinámico por lotes (sku:7700-6778-EF8E)	Estándar¹	0,003 US$ / 1 minute, per 1 month / account
Reconocimiento dinámico por lotes (con registros) (sku:1315-DEF9-28A6)	Estándar¹	0,00225 US$ / 1 minute, per 1 month / account

Categoría

Modelo

Por minuto

Reconocimiento dinámico por lotes

(sku:7700-6778-EF8E)

Estándar¹

0,003 US$ / 1 minute, per 1 month / account

Reconocimiento dinámico por lotes (con registros)

(sku:1315-DEF9-28A6)

Estándar¹

0,00225 US$ / 1 minute, per 1 month / account

Los modelos estándar¹ incluyen: default, comando_and_search, last_short, latest_long, phone_call, video, chirp (solo Speech-to-Text V2).
Los modelos médicos² incluyen: medical_conversation, medical_dictation
Cada solicitud se redondea al siguiente incremento de 1 segundo.

Versión 1 de la API Speech-to-Text

Los precios que figuran en la siguiente tabla se aplican a los minutos de audio procesados al mes en la API Speech-to-Text v1.

Categoría	Modelo	Entre 0 y 60 minutos	60 minutos o más
Reconocimiento de voz (con almacenamiento de registros de datos) sku:67F5-A183-E319	Estándar¹	0 US$ (Free) / 1 minute, per 1 month / account	0,016 US$ / 1 minute, per 1 month / account
Reconocimiento de voz (sin almacenamiento de registros de datos) sku:FD95-66F5-3F5F	Estándar¹	0 US$ (Free) / 1 minute, per 1 month / account	0,024 US$ / 1 minute, per 1 month / account
Reconocimiento de voz (sin almacenamiento de registros de datos) sku:6649-62EF-CB8F	Médico²	0 US$ (Free) / 1 minute, per 1 month / account	0,078 US$ / 1 minute, per 1 month / account

Categoría

Modelo

Entre 0 y 60 minutos

60 minutos o más

Reconocimiento de voz (con almacenamiento de registros de datos)

sku:67F5-A183-E319

Estándar¹

0 US$ (Free) / 1 minute, per 1 month / account

0,016 US$ / 1 minute, per 1 month / account

Reconocimiento de voz (sin almacenamiento de registros de datos)

sku:FD95-66F5-3F5F

Estándar¹

0 US$ (Free) / 1 minute, per 1 month / account

0,024 US$ / 1 minute, per 1 month / account

Reconocimiento de voz (sin almacenamiento de registros de datos)

sku:6649-62EF-CB8F

Médico²

0 US$ (Free) / 1 minute, per 1 month / account

0,078 US$ / 1 minute, per 1 month / account

Los modelos estándar¹ incluyen: default, comando_and_search, last_short, latest_long, phone_call, video, chirp (solo Speech-to-Text V2).
Los modelos médicos² incluyen: medical_conversation, medical_dictation
Cada solicitud se redondea al siguiente incremento de 1 segundo.

Factores para determinar precios

El precio de uso de la API Speech-to-Text se determina mediante los siguientes factores:

El número de canales reconocidos en el audio
La duración y la cantidad de audios que envías.
El modelo de reconocimiento que estás usando
El método por lotes que estás usando
La versión de la API que utilizas.

Varios canales

Cada canal de audio se factura por separado. Si envías solicitudes con varios canales, se te facturará según la duración total del audio procesado de todos los canales. El tiempo se calcula de manera diferente de cómo se cuenta el límite de uso mensual. Los límites de uso no tienen en cuenta los diferentes canales y se determinan solamente por la duración del archivo de audio. Por ejemplo, si envías una solicitud con 30 segundos de audio y 4 canales, se te facturarán 120 segundos, pero solo se descontarán 30 segundos de tu cuota mensual. Consulta la página cuotas y límites para obtener más información.

Lote dinámico

La API Speech-to-Text V2 tiene la opción de utilizar el lote dinámico. El lote dinámico procesa el audio con un nivel de urgencia menor. Si habilitas el lote dinámico, se te cobrará una tarifa rebajada.

Cargas de trabajo de gran tamaño

En el caso de los clientes con cargas de trabajo muy voluminosas, es posible que se apliquen descuentos por volumen adicionales. Ponte en contacto con el equipo de Ventas para obtener más información.

Precios de Google Cloud

Si almacenas archivos de audio en Google Cloud Storage para su reconocimiento o si utilizas otros recursos de Google Cloud (como las instancias de Google App Engine) junto con la API Speech-to-Text, también se te cobrará por el uso de esos servicios. Consulta la calculadora de precios de Google Cloud para determinar otros costes según las tarifas actuales.

Siguientes pasos

Leer la documentación de Speech-to-Text
Empieza a utilizar Speech-to-Text
Prueba la calculadora de precios
Obtén información sobre las soluciones y los casos prácticos de Speech-to-Text

Solicitar un presupuesto personalizado

Gracias al modelo de pago por uso de Google Cloud, solo pagas por los servicios que utilizas. Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu empresa.

Contactar con Ventas Ir a la consola