Precios de Speech-to-Text

Speech-to-Text se cobra en función de la cantidad de audio que procesa correctamente el servicio cada mes y se mide en incrementos de un segundo. Si la API devuelve una respuesta, el audio enviado en la solicitud se procesó de forma correcta. Esto incluye una respuesta vacía, que indica que la API procesó el audio, pero no pudo transcribirlo. Las solicitudes que generan un error de servidor no cuentan como procesadas de forma correcta y, por lo tanto, no generan ningún costo.

Puedes ver el estado actual de la facturación, incluidos el uso y tu factura actual, en la consola de Google Cloud. Si quieres obtener más detalles para administrar tu cuenta, consulta la documentación de Facturación de Cloud o la asistencia para Facturación de Cloud.

API de Speech-to-Text v2

Los precios de la siguiente tabla se aplican a los minutos de audio procesados por mes para la API de Speech-to-Text v2.

Modelos de reconocimiento estándar

Categoría

Modelo

De 0 a 500,000 minutos

De 500,000 minutos a 1,000,000 minutos

De 1,000,000 minutos a 2,000,000 minutos

2,000,000 minutos o más

Reconocimiento

(sku:3099-B70F-0949)

Estándar

USD 0.016 / 1 minute, per 1 month / accountUSD 0.01 / 1 minute, per 1 month / accountUSD 0.008 / 1 minute, per 1 month / accountUSD 0.004 / 1 minute, per 1 month / account

Reconocimiento (registrado)

(sku:3099-B70F-0949)

Estándar

USD 0.012 / 1 minute, per 1 month / accountUSD 0.0075 / 1 minute, per 1 month / accountUSD 0.006 / 1 minute, per 1 month / accountUSD 0.003 / 1 minute, per 1 month / account

Modelos médicos

Categoría

Modelo

De 0 a 60 minutos

60 minutos o más

Dictado médico

(sku:6649-62EF-CB8F)

Medicina²

USD 0 (Free) / 1 minute, per 1 month / accountUSD 0.078 / 1 minute, per 1 month / account

Conversación médica

(sku:7247-19E1-FB4D)

Medicina²

USD 0 (Free) / 1 minute, per 1 month / accountUSD 0.078 / 1 minute, per 1 month / account

Reconocimiento por lotes dinámico estándar

Categoría

Modelo

Por minuto

Reconocimiento dinámico por lotes

(sku:7700-6778-EF8E)

Estándar¹

USD 0.003 / 1 minute, per 1 month / account

Reconocimiento dinámico por lotes (registrado)

(sku:1315-DEF9-28A6)


Estándar¹

USD 0.00225 / 1 minute, per 1 month / account
  • Los modelos estándar¹ incluyen: default, command_and_search, latest_short, latest_long, phone_call, video, chirp (solo Speech-to-Text V2)
  • Los modelos de médicos² incluyen: medical_conversation, medical_dictation
  • Cada solicitud se redondea al incremento de 1 segundo más cercano

API de Speech-to-Text v1

Los precios de la siguiente tabla se aplican a los minutos de audio procesados por mes para la API de Speech-to-Text v1.

Categoría

Modelo

De 0 a 60 minutos

60 minutos o más

Reconocimiento de voz (con registro de datos)

sku:67F5-A183-E319

Estándar¹

USD 0 (Free) / 1 minute, per 1 month / accountUSD 0.016 / 1 minute, per 1 month / account

Reconocimiento de voz (sin registro de datos)

sku:FD95-66F5-3F5F

Estándar¹

USD 0 (Free) / 1 minute, per 1 month / accountUSD 0.024 / 1 minute, per 1 month / account

Reconocimiento de voz (sin registro de datos)

sku:6649-62EF-CB8F

Medicina²

USD 0 (Free) / 1 minute, per 1 month / accountUSD 0.078 / 1 minute, per 1 month / account
  • Los modelos estándar¹ incluyen: default, command_and_search, latest_short, latest_long, phone_call, video, chirp (solo Speech-to-Text V2)
  • Los modelos de médicos² incluyen: medical_conversation, medical_dictation
  • Cada solicitud se redondea al incremento de 1 segundo más cercano

Factores que influyen en los precios

Los precios de Speech‑to‑Text se determinan en función de los siguientes factores:

  • La cantidad de canales que se reconocen en el audio
  • La duración y la cantidad de audio que envías
  • El modelo de reconocimiento que usas
  • El método por lotes que usas
  • La versión de API que usas

Varios canales

Cada canal de audio se factura por separado. Si envías solicitudes con varios canales, se te facturará según la duración total de la sumatoria del audio procesado para todos los canales. Esta contabilización de tiempo difiere de la forma de hacer el seguimiento a los límites de uso mensuales. Los límites de uso no tienen en cuenta varios canales y se determinan solo por la duración del archivo de audio. Por ejemplo, si envías una solicitud con 30 segundos de audio y 4 canales, se te facturarán 120 segundos, pero solo 30 segundos contarán para tu cuota mensual. Consulta la página Cuotas y límites para obtener más detalles.

Por lotes dinámicos

La API de Speech-to-Text v2 tiene la opción de usar lotes dinámicos. El procesamiento dinámico por lotes procesa el audio con un nivel de urgencia más bajo. Si habilitas los lotes dinámicos, se te facturará una tarifa con descuento.

Cargas de trabajo grandes

Para los clientes con cargas de trabajo muy grandes, es posible que haya descuentos por volumen adicionales disponibles. Comunícate con el equipo de Ventas para obtener más información.

Precios de Google Cloud

Si almacenas en Google Cloud Storage los archivos de audio que deben reconocerse o usas otros recursos de Google Cloud en conjunto con Speech‑to‑Text, como las instancias de Google App Engine, también se te facturará el uso de esos servicios. Consulta la calculadora de precios de Google Cloud para determinar otros costos según las tarifas actuales.

¿Qué sigue?

Solicita una cotización personalizada

Con los precios de pago por uso de Google Cloud, solo pagas por los servicios que usas. Comunícate con nuestro equipo de Ventas y obtén una cotización personalizada para tu organización.


Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
Consola
Google Cloud