Precios de Text-to-Speech

El precio de Text-to-Speech se determina en función de la cantidad de caracteres que se envían cada mes al servicio para que los convierta en audio. Debes habilitar la facturación para utilizar Text-to-Speech y se te cobrará automáticamente si tu uso supera el número de caracteres gratuitos que se permiten al mes. Para obtener información acerca de cómo monitorizar los caracteres totales, consulta la página sobre cómo monitorizar el uso de las API. El precio se calcula por carácter.

A efectos de facturación, se contabiliza el número total de caracteres de la cadena de entrada, con los espacios y los caracteres de salto de línea incluidos. Todas las etiquetas del lenguaje de marcas de síntesis de voz (SSML), excepto la etiqueta <mark>, también se incluyen en el recuento de caracteres.

Tabla de precios

Gemini-TTS

La última evolución de nuestra tecnología de conversión de texto a voz, que ofrece un control granular sobre el audio generado mediante peticiones basadas en texto.

Modelo

Límite de uso gratuito

Precio después de alcanzar el límite de uso gratuito

Gemini 2.5 Flash TTS

No disponible

Tokens de entrada: 0,50 USD por cada millón de tokens de texto

(sku: 242A-EA16-C1EC)

Tokens de salida: 10,00 USD por cada millón de tokens de audio*

(sku: 9228-79EF-B162)

Gemini 2.5 Pro TTS

No disponible

Tokens de entrada: 1,00 USD por cada millón de tokens de texto

(sku: 8FF1-7E5B-5BB7)

Tokens de salida: 20,00 USD por cada millón de tokens de audio*

(sku: DCF3-CB17-8262)


* Los tokens de audio corresponden a 25 tokens por segundo de audio.

Últimos modelos de TTS

Nuestros últimos modelos de TTS, basados en nuestros LLMs de vanguardia, ofrecen un nivel de realismo y resonancia emocional sin precedentes desde el primer momento en todos los casos prácticos.

Modelo


Límite de uso gratuito

Precio después de alcanzar el límite de uso gratuito

Voces Chirp 3: HD

(sku:F977-2280-6F1B)

Hasta 1 millón de caracteres

0,00003 USD por carácter (30 USD por cada millón de caracteres)

Voz personalizada instantánea

(sku:A247-37D7-C094)

No disponible

0,00006 USD por carácter (60 USD por cada millón de caracteres)


Modelos de TTS antiguos

Modelo

Límite de uso gratuito

Precio después de alcanzar el límite de uso gratuito

Voces de WaveNet

(sku:9D01-5995-B545)

Hasta 4 millones de caracteres

0,000004 USD por carácter (4 USD por cada millón de caracteres)

Voces de estudio

(sku:84AB-48C0-F9C3)

Hasta 1 millón de caracteres

0,00016 USD por carácter (160 USD por cada millón de caracteres)

Voces estándar

(sku:9D01-5995-B545)

Hasta 4 millones de caracteres

0,000004 USD por carácter (4 USD por cada millón de caracteres)

Voces de Neural2

(sku:FEBD-04B6-769B)

Hasta 1 millón de caracteres

0,000016 USD por carácter (16 USD por cada millón de caracteres)

Voces de Polyglot (versión preliminar)

(sku:FEBD-04B6-769B)

Hasta 1 millón de caracteres

0,000016 USD por carácter (16 USD por cada millón de caracteres)

Nota: En el caso de las voces estándar y de WaveNet, el número de caracteres será igual o inferior al número de bytes que representa el texto. Esto incluye caracteres alfanuméricos, signos de puntuación y espacios en blanco. Algunos conjuntos de caracteres usan más de 1 byte por carácter, como es el caso de los caracteres japoneses (ja-JP) en UTF-8. En ese tipo de situaciones, se te facturará por un carácter y no por varios bytes.

Precios de Google Cloud

Si utilizas otros recursos de Google Cloud (como instancias de Google App Engine) junto con Text-to-Speech, también se te cobrará por el uso de esos servicios. Consulta la calculadora de precios de Google Cloud para determinar otros costes según las tarifas actuales.

Siguientes pasos

Solicitar un presupuesto personalizado

Gracias al modelo de pago por uso de Google Cloud, solo pagas por los servicios que utilizas. Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu empresa.




Google Cloud