Coste de crear y desplegar modelos de IA en Vertex AI

Solo se te cobra por las solicitudes que devuelven un código de respuesta 200. Las solicitudes que devuelvan otros códigos de respuesta, como los códigos 4xx y 5xx, no se cobran por la entrada ni por la salida.

En esta página se indican los precios de la IA generativa en Vertex AI. Para consultar los precios de otros servicios de Vertex AI, como los de la plataforma de aprendizaje automático y los de MLOps, visita la página de precios de Vertex AI.

Modelos de Google

Gemini 3

Modelo	Tipo	Precio (por 1 M de tokens) <= 200.000 tokens de entrada	Precio (por 1 M de tokens) > 200.000 tokens de entrada	Precio (por 1 M de tokens) <= 200.000 tokens de entrada almacenados en caché	Precio (por 1 M de tokens) > 200.000 tokens de entrada almacenados en caché	Precio (por 1 M de tokens) <= 200.000 tokens de entrada con la API por lotes	Precio (por 1 M de tokens) > 200.000 tokens de entrada con la API por lotes
Versión preliminar de Gemini 3 Pro
	Entrada (texto, imagen, vídeo o audio)	2 USD	4 $	0,2 USD	0,4 USD	1 USD	2 USD
	Salida de texto (respuesta y razonamiento)	12 USD	18 $	N/A	N/A	6 $	9 USD
	Resultado de imagen**	120 $	N/A	N/A	N/A	60 USD	N/A
Gemini 3 Flash Preview
	Entrada (texto, imagen o vídeo)	0,5 USD	0,5 USD	0,05 USD	0,05 USD	0,25 USD	0,25 USD
	Entrada (audio)	1 USD	1 USD	0,1 USD	0,1 USD	0,5 USD	0,5 USD
	Salida de texto (respuesta y razonamiento)	3 USD	3 USD	N/A	N/A	1,5 USD	1,5 USD
Fundamentación con la Búsqueda de Google y fundamentación web para empresas	Incluye 5000 consultas de búsqueda al mes sin coste económico, agregadas en todos los modelos de Gemini 3. Las consultas de búsqueda que superen esos límites se facturarán a 14 USD por cada 1000 consultas de búsqueda. Una petición enviada por un cliente a Gemini puede dar lugar a una o varias consultas en la Búsqueda de Google (o en Web Grounding for Enterprise). Se te cobrará por cada consulta de búsqueda individual que se realice. La facturación empezará el 5 de enero del 2026. Los tokens de entrada proporcionados por Grounding with Google Search o Web Grounding for Enterprise no se cobran. Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de peticiones fundamentadas al día.
Fundamentación con Google Maps	Incluye 5000 consultas de búsqueda al mes sin coste económico, agregadas en todos los modelos de Gemini 3. Las consultas de Maps que superen esos límites se facturarán a 14 USD por cada 1000 consultas. Una petición enviada por un cliente a Gemini puede generar una o varias consultas a Google Maps. Se te cobrará por cada consulta individual que realices. La facturación empezará el 5 de enero del 2026 Los tokens de entrada proporcionados por Google Maps no se cobran.
Fundamentación con tus datos	2,50 USD por cada 1000 peticiones.

* Si el contexto de entrada de una consulta supera los 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
** Una imagen de salida de 1024x1024 o 2048x2048 consume 1120 tokens de salida de imagen, lo que equivale a 0,134 USD por imagen generada. Una imagen 4K (4096x4096) consume 2000 tokens de salida de imagen, lo que equivale a 0,24 USD por imagen generada.

Gemini 2.5

Modelo	Tipo	Precio (por 1 M de tokens) <= 200.000 tokens de entrada	Precio (por 1 M de tokens) > 200.000 tokens de entrada	Precio (por 1 M de tokens) <= 200.000 tokens de entrada almacenados en caché	Precio (por 1 M de tokens) > 200.000 tokens de entrada almacenados en caché	Precio (por 1 M de tokens) <= 200.000 tokens de entrada con la API por lotes	Precio (por 1 M de tokens) > 200.000 tokens de entrada con la API por lotes
Gemini 2.5 Pro
	Entrada (texto, imagen, vídeo o audio)	1,25 USD	2,5 USD	0,125 USD	0,250 USD	0,625 USD	1,25 USD
	Salida de texto (respuesta y razonamiento)	10 USD	15 USD	N/A	N/A	5 USD	7,5 USD
Gemini 2.5 Pro Computer Use-Preview
	Entrada (texto, imagen, vídeo o audio)	1,25 USD	2,5 USD	N/A	N/A	N/A	N/A
	Salida de texto (respuesta y razonamiento)	10,00 USD	15,00 €	N/A	N/A	N/A	N/A
Gemini 2.5 Flash
	Entrada (texto, imagen o vídeo)	0,30 USD	0,30 USD	0,03 USD	0,03 USD	0,15 USD	0,15 USD
	Entrada de audio	1 USD	1 USD	$0,100	$0,100	0,5 USD	0,5 USD
	Salida de texto (respuesta y razonamiento)	2,50 USD	2,50 USD	N/A	N/A	1,25 USD	1,25 USD
	Resultados de imagen***	30 USD	30 USD	N/A	N/A	15 USD	15 USD
API Live de Gemini 2.5 Flash
	1 millón de tokens de texto de entrada	0,5 USD	0,5 USD	N/A	N/A	N/A	N/A
	1 millón de tokens de audio de entrada	3 USD	3 USD	N/A	N/A	N/A	N/A
	1 millón de tokens de vídeo o imagen de entrada	3 USD	3 USD	N/A	N/A	N/A	N/A
	1 millón de tokens de texto de salida	2 USD	2 USD	N/A	N/A	N/A	N/A
	1 millón de tokens de audio de salida	12 USD	12 USD	N/A	N/A	N/A	N/A
Gemini 2.5 Flash Lite
	Entrada (texto, imagen o vídeo)	0,1 USD	0,1 USD	0,010 USD	0,010 USD	0,05 USD	0,05 USD
	Entrada de audio	0,3 $	0,3 $	0,03 USD	0,03 USD	0,15 USD	0,15 USD
	Salida de texto (respuesta y razonamiento)	0,4 USD	0,4 USD	N/A	N/A	0,2 USD	0,2 USD
Fundamentación con la Búsqueda de Google	Gemini 2.0 Flash, 2.5 Flash y 2.5 Flash-Lite incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional. Gemini 2.5 Pro incluye 10.000 peticiones fundamentadas al día sin coste adicional. Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud que se envía a Gemini y que hace una o más consultas a la Búsqueda de Google&ast;&ast;. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación web para empresas	45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a la fundamentación web para empresas**. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de peticiones fundamentadas al día.
Fundamentación con tus datos	2,5 USD por cada 1000 solicitudes.
Fundamentación con Google Maps	25 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace al menos una consulta a Google Maps.

* Si el contexto de entrada de una consulta supera los 200.000 tokens, todos los tokens (de entrada y de salida) se cobran según las tarifas de contexto largo.
** El uso de Grounding con la Búsqueda de Google y Web Grounding para empresas solo se factura cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de referencia de la Web). Las tarifas de uso de los modelos de Gemini se aplican por separado.
*** Una imagen de 1024x1024 consume 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.
**** La facturación del uso de Compute utiliza la SKU de Gemini 2.5 Pro. Para separar los costes del uso de Compute, aplica etiquetas de facturación. Más información

Explicación de la facturación de la ventana de contexto de las sesiones de LiveAPI: se le cobra por turno por todos los tokens presentes en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye nuevos tokens (turno actual) y todos los tokens acumulados de los turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto que hayas configurado. Un "turno" es una entrada del usuario y la respuesta del modelo.
Modo de audio proactivo: cuando está habilitado, se cobran los tokens de entrada mientras LiveAPI está escuchando. Los tokens de salida solo se cobran cuando la API responde.
Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran según la tarifa de salida de tokens de texto.

Gemini 2.0

Gemini 2.0 se factura por tokens. Para calcular el número de tokens de entrada de tu solicitud antes de enviarla, puedes usar el SDK tokenizer o la API countTokens. Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens utilizados.

Usa el botón de la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.

Precios basados en tokens

Modelo	Tipo	Precio	Precio con la API de Batch
Gemini 2.0 Flash
	1 millón de tokens de entrada	0,15 USD	0,075 USD
	1 millón de tokens de audio de entrada	1 USD	0,50 USD
	1 millón de tokens de texto de salida	0,60 USD	0,30 USD
	Ajuste con 1 millón de tokens de entrenamiento	3,00 USD
Generación de imágenes con Gemini 2.0 Flash
	1 millón de tokens de entrada	0,15 USD
	1 millón de tokens de audio de entrada	1 USD
	1 millón de tokens de vídeo de entrada	3 USD
	1 millón de tokens de texto de salida	0,60 USD
	1 millón de tokens de imagen de salida	30,00 USD
API de Gemini 2.0 Flash Live
	1 millón de tokens de texto de entrada	0,5 USD
	1 millón de tokens de audio de entrada	3 USD
	1 millón de tokens de vídeo o imagen de entrada	3 USD
	1 millón de tokens de texto de salida	2 USD
	1 millón de tokens de audio de salida	12 USD
Gemini 2.0 Flash Lite
	1 millón de tokens de entrada	0,075 USD	0,0375 USD
	1 millón de tokens de audio de entrada	0,075 USD	0,0375 USD
	1 millón de tokens de texto de salida	0,30 USD	0,15 USD
	Ajuste con 1 millón de tokens de entrenamiento	1 USD
Fundamentación con la Búsqueda de Google	Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional. Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación web para empresas	45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud que se envía a Gemini y que hace una o varias consultas a la fundamentación web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación con tus datos	2,5 USD por cada 1000 solicitudes a partir del 16 de junio del 2025.
Fundamentación con Google Maps	Los modelos de Gemini incluyen una serie de peticiones fundamentadas diarias sin coste adicional: Gemini Flash y Flash-Lite: 1500 peticiones fundamentadas combinadas al día. Gemini Pro: 10.000 peticiones fundamentadas al día. Las peticiones fundamentadas que superen esos límites se facturarán a 25 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace al menos una consulta a Google Maps. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.

Precios basados en la modalidad

Los precios de las modalidades que se indican a continuación se basan en casos prácticos medios y son solo de referencia. La facturación real solo se basará en los tokens:

4 caracteres equivalen aproximadamente a 1 token de texto, incluidos los espacios en blanco.

Para una imagen de 1024x1024, se consumen 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.

La entrada de vídeo consume 258 tokens por segundo a una tasa de muestreo de un fotograma por segundo. Los vídeos con audio se facturan tanto por los tokens de vídeo como por los de audio.

La entrada de audio consume 25 tokens por segundo sin marca de tiempo.

Modelo	Tipo	Precio	Precio con la API de Batch
Gemini 2.0 Flash
	Texto de entrada (USD por millón de caracteres)	0,0375 USD	0,01875 USD
	Imagen de entrada (USD por imagen)	0,0001935 USD	0,00009675 USD
	Vídeo de entrada ($/s)	0,0000387 USD	0,00001935 USD
	Audio de entrada ($/s)	0,000025 USD	0,0000125 USD
	Texto de salida (USD por millón de caracteres)	0,15 USD	0,075 USD
Generación de imágenes con Gemini 2.0 Flash
	Texto de entrada (USD por millón de caracteres)	0,0375 USD
	Imagen de entrada (USD por imagen)	0,0001935 USD
	Vídeo de entrada ($/s)	0,0000387 USD
	Audio de entrada ($/s)	0,000025 USD
	Texto de salida (USD por millón de caracteres)	0,15 USD
	Imagen generada ($/imagen)	0,04 USD
Gemini 2.0 Flash Lite
	Texto de entrada (USD por millón de caracteres)	0,01875 USD	0,009375 USD
	Imagen de entrada (USD por imagen)	0,00009675 USD	0,000048375 USD
	Vídeo de entrada ($/s)	0,00001935 USD	0,000009675 USD
	Audio de entrada ($/s)	0,000001875 USD	0,000000938 USD
	Texto de salida (USD por millón de caracteres)	0,075 USD	0,0375 USD
Fundamentación con la Búsqueda de Google	Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional. Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación web para empresas	45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud que se envía a Gemini y que hace una o varias consultas a la fundamentación web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.

* Los precios están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Los tokens de entrenamiento se calculan multiplicando el número total de tokens del conjunto de datos de entrenamiento por el número de épocas.
* Los PDFs se facturan como entradas de imagen, donde una página de PDF equivale a una imagen.
* El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* Grounding with Google Search and Web Grounding for enterprise is billed only when a prompt successfully returns web results (i.e., results containing at least one grounding support URL from the web). Las tarifas de uso de los modelos de Gemini se aplican por separado.
* API Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada o salida) y 258 tokens por segundo de vídeo (entrada). La fundamentación con la Búsqueda de Google sigue siendo sin coste económico mientras la API de Gemini 2.0 Flash Live esté en la versión preliminar.

Explicación de la facturación de la ventana de contexto de las sesiones de LiveAPI: se le cobra por turno por todos los tokens presentes en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye nuevos tokens (turno actual) y todos los tokens acumulados de los turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto que hayas configurado. Un "turno" es una entrada del usuario y la respuesta del modelo.
Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran según la tarifa de salida de tokens de texto.

Precios de Vertex AI Model Optimizer (experimental)*

Vertex AI Model Optimizer simplifica el uso de Gemini para los clientes empresariales, ya que proporciona un único metaendpoint para las peticiones de modelos de Gemini. Los clientes que usan este servicio no tienen que especificar si quieren usar Flash, Pro o una versión concreta. En lugar de eso, solo tienen que proporcionar un ajuste configurable (coste, calidad o equilibrio) para indicar sus preferencias, y Model Optimizer aplica el nivel de inteligencia adecuado para la tarea enviando cada consulta al modelo que mejor se adapte a ella.

Vertex AI Model Optimizer aplica precios dinámicos. Esto significa que el precio medio por token depende del nivel de inteligencia del modelo que se aplique para completar la tarea. Por este motivo, a continuación se ofrecen ejemplos de precios para ilustrar posibles situaciones en función de la configuración (consulta las tablas de abajo). Los SKUs de Model Optimizer cuestan 1 USD y funcionan como una unidad de compra que se aplica a tu facturación. Se te seguirá facturando en función del consumo después de usar los modelos.

Relación de E/S de 5:1	Ejemplo 1: chatbot	NOTA: Estos intervalos no son una garantía, ya que los resultados de cada cliente pueden variar.
Preferencia de los clientes	Tokens de entrada del cliente enviados al MO	Tokens de salida del cliente enviados al MO	Precio medio de entrada por millón de tokens (intervalo alto)	Precio medio de salida por millón de tokens (intervalo alto)	Precio medio de entrada por millón de tokens (intervalo inferior)	Precio medio de salida por millón de tokens (intervalo inferior)
Coste	10.000.000	2.000.000	0,63 USD	2,50 USD	0,16 USD	0,63 USD
Equilibrado	10.000.000	2.000.000	1,26 USD	5,00 USD	0,63 USD	2,50 USD
Calidad	10.000.000	2.000.000	1,89 USD	7,50 USD	1,26 USD	5,00 USD

Relación de E/S de 1:20	Ejemplo 2: Generación de contenido
Preferencia de los clientes	Tokens de entrada del cliente enviados al MO	Tokens de salida del cliente enviados al MO	Precio medio de entrada por millón de tokens (intervalo alto)	Precio medio de salida por millón de tokens (intervalo alto)	Precio medio de entrada por millón de tokens (intervalo inferior)	Precio medio de salida por millón de tokens (intervalo inferior)
Coste	1.000.000	20.000.000	0,63 USD	2,50 USD	0,16 USD	0,63 USD
Equilibrado	1.000.000	20.000.000	1,26 USD	5,00 USD	0,63 USD	2,50 USD
Calidad	1.000.000	20.000.000	1,89 USD	7,50 USD	1,26 USD	5,00 USD

* Model Optimizer es una oferta experimental de pago que puede dirigir las solicitudes a versiones experimentales de Gemini en Vertex.

Otros modelos de Gemini

Todos los modelos de Gemini que no sean Gemini 2.0 ni Gemini 2.5 se facturan en función de las modalidades, como los caracteres, las imágenes o los segundos de vídeo o audio. La entrada de texto se cobra por cada 1000 caracteres de entrada (petición) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco se excluyen del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo de dólar ($0,01) se redondean a un centavo. La entrada de contenido multimedia se cobra por imagen o por segundo (vídeo). Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens utilizados.

Modelo	Función	Tipo	Precio ( =< 128.000 tokens de entrada)	Precio ( > 128.000 tokens de entrada)
Gemini 1.5 Flash	Multimodal	Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio	0,00002 USD por imagen 0,00002 USD por segundo 0,00001875 USD por cada 1000 caracteres 0,000002 USD por segundo	0,00004 USD por imagen 0,00004 USD por segundo 0,0000375 USD por cada 1000 caracteres 0,000004 USD por segundo
		Salida de texto	0,000075 USD por cada 1000 caracteres	0,00015 USD por 1000 caracteres
	Tuneo*	Token de entrenamiento	8 USD por millón de tokens
Gemini 1.5 Pro	Multimodal	Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio	0,00032875 USD por imagen 0,00032875 USD por segundo 0,0003125 USD por cada 1000 caracteres 0,00003125 USD por segundo	0,0006575 USD por imagen 0,0006575 USD por segundo 0,000625 USD por cada 1000 caracteres 0,0000625 USD por segundo
		Salida de texto	0,00125 USD por 1000 caracteres	0,0025 USD por 1000 caracteres
	Tuneo*	Token de entrenamiento	80 USD por millón de tokens
Gemini 1.0 Pro	Multimodal	Entrada de imagen Entrada de vídeo Entrada de texto	0,0025 USD por imagen 0,002 USD por segundo 0,000125 USD por cada 1000 caracteres
Gemini 1.0 Pro		Salida de texto	0,000375 USD por 1000 caracteres
Fundamentación con la Búsqueda de Google	Texto	35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación web para empresas	Texto	45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a Web Grounding for enterprise*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación con tus datos	Texto	2,5 USD por cada 1000 solicitudes a partir del 16 de junio del 2025.

* Los precios están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Si el contexto de una consulta supera los 128.000 tokens, todos los tokens se cobran según las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite ventanas de contexto de hasta 32.000 tokens.
* Los PDFs se facturan como entradas de imagen, donde una página de PDF equivale a una imagen.
* El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La fundamentación con la Búsqueda de Google y la fundamentación web para empresas solo se facturan cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de fundamentación de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.

Imagen

Con Imagen en Vertex AI, puedes generar imágenes originales y editarlas a partir de peticiones de texto que proporciones, o editar solo partes de las imágenes usando un área de máscara que definas, además de otras muchas funciones.

Modelo	Función	Descripción	Entrada	Salida	Precio
Imagen 4 Ultra	Generación de imágenes	Generar una imagen	Petición de texto	Imagen	0,06 USD por imagen
Imagen 4	Upscaling	Aumenta la resolución de una imagen generada a 2K, 3K y 4K	Imagen	Imagen	0,06 USD por imagen
Imagen 4	Generación de imágenes	Generar una imagen	Petición de texto	Imagen	0,04 USD por imagen
Imagen 4 Fast	Generación de imágenes	Generar una imagen	Petición de texto	Imagen	0,02 USD por imagen
Imagen 3	Generación de imágenes	Generar una imagen Editar una imagen Personalizar una imagen	Petición de texto	Imagen	0,04 USD por imagen
Imagen 3 Fast	Generación de imágenes	Generar una imagen	Petición de texto	Imagen	0,02 USD por imagen
Imagen 2, Imagen 1	Generación de imágenes	Generar una imagen	Petición de texto	Imagen	0,020 USD por imagen
Imagen 2, Imagen 1	Edición de imágenes	Edita una imagen usando un enfoque con o sin máscara	Petición de imagen o texto	Imagen	0,020 USD por imagen
Imagen 1	Upscaling	Aumenta la resolución de una imagen generada a 2K y 4K	Imagen	Imagen	0,003 USD por imagen
Imagen 1	Afinamiento	Permitir que el usuario proporcione un "sujeto" para usarlo en las peticiones de Imagen (entrenamiento con pocos ejemplos)	Temas con identificador de texto y entre 4 y 8 imágenes por tema	Modelo perfeccionado (tras el entrenamiento con temas proporcionados por el usuario)	USD por hora de nodo (precios de entrenamiento personalizado de Vertex AI)
Imagen	Descripción Visual	Genera un título corto o largo para una imagen	Imagen	Título de texto	0,0015 USD por imagen
Imagen	Preguntas y respuestas visuales	Proporciona una respuesta basada en una pregunta que hace referencia a una imagen	Petición de imagen o texto	Respuesta de texto	0,0015 USD por imagen
Imagen	Recontextualización del producto	Reimagina los productos en una nueva escena	1-3 imágenes del mismo producto y una petición de texto que describa la escena deseada	Imagen	0,12 USD por imagen
	Vertex Virtual Try-On	Crea imágenes de personas con diferentes prendas de vestir	1 imagen de una persona y 1 imagen de ropa	Imagen	0,06 USD por imagen

Veo

Veo crea vídeos de una calidad increíble en una amplia variedad de temas y estilos, y ofrece una mejor comprensión de la física del mundo real y de los matices del movimiento y la expresión humanos.

Modelo	Función	Descripción	Entrada	Salida	Resolución de salida	Precio
Veo 3.1	Generación de vídeo y audio	Genera vídeos de alta calidad con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia	Petición de texto o imagen	Vídeo y audio	720p, 1080p	0,40 USD por segundo
	Generación de vídeo y audio	Genera vídeos de alta calidad con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia	Petición de texto o imagen	Vídeo y audio	4K	0,60 USD por segundo
	Generación de vídeos	Genera vídeos de alta calidad a partir de una petición de texto o una imagen de referencia	Petición de texto o imagen	Vídeo	720p, 1080p	0,20 USD por segundo
	Generación de vídeos	Genera vídeos de alta calidad a partir de una petición de texto o una imagen de referencia	Petición de texto o imagen	Vídeo	4K	0,40 USD por segundo
Veo 3.1 Fast	Generación de vídeo y audio	Genera vídeos con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia más rápido	Petición de texto o imagen	Vídeo y audio	720p, 1080p	0,15 USD por segundo
	Generación de vídeo y audio	Genera vídeos con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia más rápido	Petición de texto o imagen	Vídeo y audio	4K	0,35 USD por segundo
	Generación de vídeos	Genera vídeos a partir de una petición de texto o una imagen de referencia más rápido	Petición de texto o imagen	Vídeo	720p, 1080p	0,10 USD por segundo
	Generación de vídeos	Genera vídeos a partir de una petición de texto o una imagen de referencia más rápido	Petición de texto o imagen	Vídeo	4K	0,30 USD por segundo
Veo 3	Generación de vídeo y audio	Genera vídeos de alta calidad con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia	Petición de texto o imagen	Vídeo y audio	720p, 1080p	0,40 USD por segundo
Veo 3	Generación de vídeos	Genera vídeos de alta calidad a partir de una petición de texto o una imagen de referencia	Petición de texto o imagen	Vídeo	720p, 1080p	0,20 USD por segundo
Veo 3 Fast	Generación de vídeo y audio	Genera vídeos con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia más rápido	Petición de texto o imagen	Vídeo y audio	720p, 1080p	0,15 USD por segundo
Veo 3 Fast	Generación de vídeos	Genera vídeos a partir de una petición de texto o una imagen de referencia más rápido	Petición de texto o imagen	Vídeo	720p, 1080p	0,10 USD por segundo
Veo 2	Generación de vídeos	Genera vídeos a partir de una petición de texto o una imagen de referencia	Petición de texto o imagen	Vídeo	720p	0,50 USD por segundo
Veo 2	Controles avanzados	Genera vídeos interpolando fotogramas iniciales y finales, amplía los vídeos generados y aplica controles de cámara	Petición de texto, imagen o vídeo	Vídeo	720p	0,50 USD por segundo

Lyria

Lyria 2 ofrece una generación de música instrumental de alta calidad, ideal para composiciones sofisticadas y exploraciones creativas detalladas en las que es fundamental obtener resultados matizados.

Modelo	Función	Descripción	Entrada	Salida	Precio
Lyria 2	Generación de música	Genera música a partir de una petición de texto	Petición de texto	Música	0,06 USD por 30 segundos

Conoce los costes de las incrustaciones en tus aplicaciones de IA

Modelo	Tipo	Region	Precio por 1000 tokens de entrada
Gemini Embedding	Entrada	Global	Solicitudes online: 0,00015 USD Solicitudes por lotes: 0,00012 USD
Gemini Embedding	Salida	Global	Solicitudes online: sin coste económico Solicitudes por lotes: sin coste económico

Modelo	Tipo	Region	Precio por 1000 caracteres
Embeddings para texto (sin incluir Gemini Embedding)	Entrada	Global	Solicitudes online: 0,000025 USD Solicitudes por lotes: 0,00002 USD
Embeddings para texto (sin incluir Gemini Embedding)	Salida	Global	Solicitudes online: sin coste económico Solicitudes por lotes: sin coste económico

Modelo	Función	Descripción	Entrada	Salida	Precio
multimodalembedding	Embeddings for Multimodal: Text	Genera inserciones usando texto como entrada	Texto	Inserciones	0,0002 USD por cada 1000 caracteres de entrada
	Incrustaciones para multimodal: imagen	Genera inserciones usando una imagen como entrada	Imagen	Inserciones	0,0001 USD por imagen introducida
	Embeddings for Multimodal: Video Plus	Video Plus	Vídeo	Incrustaciones (hasta 15 incrustaciones por minuto de vídeo)	0,0020 USD por segundo de vídeo
	Embeddings for Multimodal: Video Standard	Video Standard	Vídeo	Incrustaciones (hasta 8 incrustaciones por minuto de vídeo)	0,0010 USD por segundo de vídeo
	Embeddings for Multimodal: Video Essential	Video Essential	Vídeo	Embeddings (hasta 4 embeddings por minuto de vídeo)	0,0005 USD por segundo de vídeo

Modelo de código abierto	Tipo	Precio por 1000 tokens de entrada
multilingual-e5-small	Entrada: Salida: Entrada por lotes: Salida por lotes:	Solicitudes online: 0,000015 USD Solicitudes online: sin coste económico Solicitudes por lotes: 0,0000075 USD Solicitudes por lotes: sin coste económico
multilingual-e5-large	Entrada: Salida: Entrada por lotes: Salida por lotes:	Solicitudes online: 0,000025 USD Solicitudes online: sin coste Solicitudes por lotes: 0,0000125 USD Solicitudes por lotes: sin coste

Precios de la función de finalización de código de Vertex AI

IA generativa en Vertex AI cobra por cada 1000 caracteres de entrada (petición) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco no se incluyen en el recuento. Durante la fase de vista previa, los cargos tienen un descuento del 100 %. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo de dólar ($0,01) se redondean a un centavo.

Modelo	Tipo	Region	Precio por 1000 caracteres
Codey para la finalización de código	Entrada	Global	Solicitudes online: 0,00025 USD
Codey para la finalización de código	Salida	Global	Solicitudes online: 0,0005 USD

Translation (Text)

Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones de los LLMs suelen ser más fluidas y naturales que las de los modelos de traducción clásicos, pero tienen una compatibilidad de idiomas más limitada (más información).

Modelo	Método	Uso	Precio por millón de caracteres
LLM	Text translation^*	Número de caracteres de entrada al mes	10 USD por millón de caracteres^*
	Text translation^*	Número de caracteres de salida al mes	10 USD por millón de caracteres^*

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
^*El precio se calcula por cada carácter procesado por el modelo. Para obtener más información sobre el recuento de caracteres, consulta Facturación de caracteres.

Precio del almacenamiento de la caché de contexto para el almacenamiento en caché explícito

Modelo	Función	Tipo	Precio (por 1 M de tokens) ≤ 200.000 tokens de entrada	Precio (por 1 M de tokens) > 200.000 tokens de entrada
Gemini 3 Pro	Almacenamiento en caché de contexto	Entrada (texto, imagen, vídeo o audio)	4,5 USD (por millón de tokens al mes)	4,5 USD (por millón de tokens al mes)
Gemini 2.5 Pro	Almacenamiento en caché de contexto	Entrada (texto, imagen, vídeo o audio)	4,5 USD (por millón de tokens al mes)	4,5 USD (por millón de tokens al mes)
Gemini 2.5 Flash	Almacenamiento en caché de contexto	Entrada (texto, imagen, vídeo o audio)	1 USD (por millón de tokens al mes)	1 USD (por millón de tokens al mes)
Gemini 2.5 Flash Lite	Almacenamiento en caché de contexto	Entrada (texto, imagen, vídeo o audio)	1 USD (por millón de tokens al mes)	1 USD (por millón de tokens al mes)

Modelos de Gemini 2.0

Precios basados en tokens

Modelo	Tipo	Almacenamiento (M tok-hora)	Precio
Gemini 2.0 Flash
	1 millón de tokens de entrada	1 USD	0,0375 USD
	1 millón de tokens de audio de entrada	1 USD	0,25 USD
	1 millón de tokens de texto de salida	N/A	N/A
Gemini 2.0 Flash Lite
	1 millón de tokens de entrada	1 USD	0,01875 USD
	1 millón de tokens de audio de entrada	1 USD	0,01875 USD
	1 millón de tokens de texto de salida	N/A	N/A

Precios basados en la modalidad

Los precios de las modalidades que se indican a continuación se basan en casos prácticos medios y son solo de referencia. La facturación real solo se basará en los tokens:

4 caracteres equivalen aproximadamente a 1 token de texto, incluidos los espacios en blanco.

La entrada de vídeo consume 258 tokens por segundo a una tasa de muestreo de un fotograma por segundo. Los vídeos con audio se facturan tanto por los tokens de vídeo como por los de audio.

La entrada de audio consume 25 tokens por segundo sin marca de tiempo.

Modelo	Tipo	Almacenamiento (modalidad-hora)	Precio
Gemini 2.0 Flash
	Texto de entrada (USD por millón de caracteres)	0,25 USD	0,009375 USD
	Imagen de entrada (USD por imagen)	0,00129 USD	0,000048375 USD
	Vídeo de entrada ($/s)	0,000258 USD	0,000009675 USD
	Audio de entrada ($/s)	0,000025 USD	0,00000625 USD
	Texto de salida (USD por millón de caracteres)	N/A	N/A
Gemini 2.0 Flash Lite
	Texto de entrada (USD por millón de caracteres)	0,25 USD	0,0046875 USD
	Imagen de entrada (USD por imagen)	0,00129 USD	0,0000241875 USD
	Vídeo de entrada ($/s)	0,000258 USD	0,000009675 USD
	Audio de entrada ($/s)	0,000258 USD	0,0000048375 USD
	Texto de salida (USD por millón de caracteres)	N/A	N/A
Fundamentación con la Búsqueda de Google	Gemini 2.0 Flash incluye hasta 1500 peticiones fundamentadas al día sin coste adicional. Las solicitudes fundamentadas que superen las 1500 al día se facturarán a 35 USD por cada 1000 solicitudes (hasta un máximo de 1 millón de solicitudes al día). Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de solicitudes al día.
Fundamentación web para empresas	45 USD por cada 1000 solicitudes (hasta 1 millón de solicitudes al día) a partir del 5 de mayo del 2025. Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de solicitudes al día.

* Los precios están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Los PDFs se facturan como entradas de imagen, donde una página de PDF equivale a una imagen.
* El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La fundamentación con la Búsqueda de Google solo se factura en las solicitudes que devuelven resultados que contienen al menos una URL de fundamentación de la Web. También se aplican las tarifas de uso del modelo de Gemini estándar.

Capacidad de procesamiento reservada

El rendimiento aprovisionado garantiza el rendimiento para tus necesidades de IA generativa y se transacciona mediante unidades de escalado de IA generativa o GSUs. Consulta más información sobre la cantidad de rendimiento que proporciona cada GSU aquí y usa nuestra herramienta de estimación online aquí.

Duración	Precio por GSU	Por
Compromiso de 1 semana	1200 $	Semana
Compromiso de 1 mes	2700 USD	Mes
Compromiso de 3 meses	2400 USD	Mes
Compromiso de 1 año	2000 USD	Mes

Ejemplo de cálculo de costes

Un usuario necesita asegurarse de que puede admitir 10 consultas por segundo (CPS) de una consulta con una entrada de 1000 tokens de texto y 500 tokens de audio,y recibir una salida de 300 tokens de texto usando gemini-2.0-flash.

Si consultamos la tabla de rendimiento y tasa de consumo, vemos que, en el caso de Gemini 2.0 Flash, la tasa de consumo de un token de texto de entrada es de 1 token, la de un token de audio de entrada es de 7 tokens y la de un token de texto de salida es de 4 tokens.

El total de tokens de entrada del usuario es 1000* (1 token por token de texto de entrada) + 500* (7 tokens por token de audio de entrada) = 4500 tokens de entrada ajustados para el consumo. El total de tokens de salida del usuario es 300* (4 tokens por token de texto de salida) = 1200 tokens de salida ajustados por reducción. Si los sumamos, obtenemos 4500 tokens de entrada ajustados por el consumo + 1200 tokens de salida ajustados por el consumo = 5700 tokens en total por consulta.

Si multiplicamos el número total de tokens por consulta por las CPS, obtenemos 5700 tokens totales por consulta × 10 CPS = 57.000 tokens totales por segundo.

Si dividimos esta cifra entre el rendimiento total por segundo por GSU,obtenemos 57.000 tokens totales por segundo ÷ 3360 de rendimiento por segundo por GSU = 16,96 GSUs. El incremento mínimo de GSUs que se pueden comprar para este modelo es 1, por lo que el usuario necesitaría 17 GSUs.

Si el usuario quisiera mantener ese rendimiento durante una semana, le costaría 1200 USD x 17 GSUs = 20.400 USD a la semana. Si quisiera mantener ese rendimiento durante un mes, tendría que pagar 2700 USD x 17 GSUs = 45.900 USD al mes. Si quisiera mantener ese rendimiento durante 3 meses, le costaría 2400 USD x 17 GSUs = 40.800 USD al mes. Por último, si quisieran mantener ese rendimiento durante un año, el coste sería de 2000 USD x 17 GSUs = 34.000 USD al mes.

Ajuste de modelos

El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y la eficiencia del modelo. El ajuste de modelos ofrece las siguientes ventajas:

Mayor calidad para tus tareas específicas
Mayor solidez de los modelos
Menor latencia y coste de inferencia gracias a las peticiones más cortas

El ajuste se cobra por millón de tokens de entrenamiento. Los tokens de entrenamiento se calculan multiplicando el número total de tokens de tu conjunto de datos de entrenamiento por el número de épocas. En cuanto a la inferencia de modelos, el endpoint del modelo ajustado de Gemini tiene el mismo precio de predicción que el modelo base.

Modelo	Tipo	Precio (por 1 M de tokens de entrenamiento)
Gemini 2.5 Pro	Afinamiento supervisado	25 USD
Gemini 2.5 Flash	Afinamiento supervisado Ajuste de preferencias	5 USD
Gemini 2.5 Flash Lite	Afinamiento supervisado Ajuste de preferencias	1,5 USD
Gemma 3 27B IT	Afinamiento supervisado	6,83 €
Llama 3.1 8B	Afinamiento supervisado	0,67 USD
Llama 3.2 1B	Afinamiento supervisado	0,28 $
Llama 3.2 3B	Afinamiento supervisado	0,61 USD
Llama 3.3 70B	Afinamiento supervisado	6,72 $
Llama 4 Scout 17B 16E	Afinamiento supervisado	5,77 USD
Qwen 3 32B	Afinamiento supervisado	6,57 USD

* Los tokens de entrenamiento se calculan multiplicando el número total de tokens del conjunto de datos de entrenamiento por el número de épocas.
* El precio de las predicciones de un endpoint de un modelo ajustado de Gemini es el mismo que el del modelo base.

Compara los precios de los modelos de partners en Vertex AI

Los modelos de partners son una lista seleccionada de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta la descripción general de los modelos de partners. En las siguientes secciones se indican los detalles de los precios de los modelos de partners de Google.

Modelos de AI21 Labs

Modelo	Precios
Jamba 1.5 Large (obsoleto)	Entrada: 2 USD por millón de tokens Salida: 8 USD por millón de tokens
Jamba 1.5 Mini (obsoleto)	Entrada: 0,20 USD por millón de tokens Salida: 0,40 USD por millón de tokens

Modelos Claude de Anthropic

Modelos con precios regionales

Global

Modelo	Precio (por 1 M de tokens) < 200.000 tokens de entrada	Precio (por 1 M de tokens) >= 200.000 tokens de entrada
Claude Opus 4.5	Entrada: 5,00 USD Salida: 25,00 USD Entrada por lotes: 2,50 USD Salida por lotes: 12,50 USD Escritura en caché de 5 min: 6,25 USD Escritura en caché de 1 h: 10,00 USD Acierto de caché: 0,50 USD Escritura en caché por lotes de 5 min: 3,125 USD Escritura en caché por lotes de 1 h: 5,00 USD Acierto de caché por lotes: 0,25 USD
Claude Sonnet 4.5	Entrada: 3,00 USD Salida: 15,00 USD Entrada por lotes: 1,50 USD Salida por lotes: 7,50 USD Escritura en caché de 5 min: 3,75 USD Escritura en caché de 1 h: 6,00 USD Acierto de caché: 0,30 USD Escritura en caché por lotes de 5 min: 1,88 USD Escritura en caché por lotes de 1 h: 3,00 USD Acierto de caché por lotes: 0,15 USD	Entrada: 6,00 USD Salida: 22,50 USD Escritura en caché de 5 min: 7,50 USD Escritura en caché de 1 h: 12,00 USD Acierto de caché: 0,60 USD
Claude Haiku 4.5	Entrada: 1,00 USD Salida: 5,00 USD Entrada por lotes: 0,50 USD Salida por lotes: 2,50 USD Escritura en caché de 5 min: 1,25 USD Escritura en caché de 1 h: 2,00 USD Acierto de caché: 0,10 USD Escritura en caché por lotes de 5 min: 0,625 USD Escritura en caché por lotes de 1 h: 1,00 USD Acierto de caché por lotes: 0,05 USD

us-east5

Modelo	Precio (por 1 M de tokens) < 200.000 tokens de entrada	Precio (por 1 M de tokens) >= 200.000 tokens de entrada
Claude Opus 4.5	Entrada: 5,50 USD Salida: 27,50 USD Entrada por lotes: 2,75 USD Salida por lotes: 13,75 USD Escritura en caché de 5 min: 6,875 USD Escritura en caché de 1 h: 11,00 USD Acierto de caché: 0,55 USD Escritura en caché por lotes de 5 min: 3,438 USD Escritura en caché por lotes de 1 h: 5,50 USD Acierto de caché por lotes: 0,275 USD
Claude Sonnet 4.5	Entrada: 3,30 USD Salida: 16,50 USD Entrada por lotes: 1,65 USD Salida por lotes: 8,25 USD Escritura en caché de 5 min: 4,13 USD Escritura en caché de 1 h: 6,60 USD Acierto de caché: 0,33 USD Escritura en caché por lotes de 5 min: 2,06 USD Escritura en caché por lotes de 1 h: 3,30 USD Acierto de caché por lotes: 0,17 USD	Entrada: 6,60 USD Salida: 24,75 USD Escritura en caché de 5 min: 8,25 USD Escritura en caché de 1 h: 13,20 USD Cache Hit: 0,66 USD
Claude Haiku 4.5	Entrada: 1,10 USD Salida: 5,50 USD Entrada por lotes: 0,55 USD Salida por lotes: 2,75 USD Escritura en caché de 5 minutos: 1,375 USD Escritura en caché de 1 hora: 2,20 USD Escritura en caché: 1,375 USD Acierto de caché: 0,11 USD Escritura en caché por lotes de 5 minutos: 0,688 USD Escritura en caché por lotes de 1 hora: 1,10 USD Acierto de caché por lotes: 0,055 USD

europe‑west1

Modelo	Precio (por 1 M de tokens) < 200.000 tokens de entrada	Precio (por 1 M de tokens) >= 200.000 tokens de entrada
Claude Opus 4.5	Entrada: 5,50 USD Salida: 27,50 USD Entrada por lotes: 2,75 USD Salida por lotes: 13,75 USD Escritura en caché de 5 min: 6,875 USD Escritura en caché de 1 h: 11,00 USD Acierto de caché: 0,55 USD Escritura en caché por lotes de 5 min: 3,438 USD Escritura en caché por lotes de 1 h: 5,50 USD Acierto de caché por lotes: 0,275 USD
Claude Sonnet 4.5	Entrada: 3,30 USD Salida: 16,50 USD Entrada por lotes: 1,65 USD Salida por lotes: 8,25 USD Escritura en caché de 5 min: 4,13 USD Escritura en caché de 1 h: 6,60 USD Acierto de caché: 0,33 USD Escritura en caché por lotes de 5 min: 2,06 USD Escritura en caché por lotes de 1 h: 3,30 USD Acierto de caché por lotes: 0,17 USD	Entrada: 6,60 USD Salida: 24,75 USD Escritura en caché de 5 min: 8,25 USD Escritura en caché de 1 h: 13,20 USD Cache Hit: 0,66 USD
Claude Haiku 4.5	Entrada: 1,10 USD Salida: 5,50 USD Entrada por lotes: 0,55 USD Salida por lotes: 2,75 USD Escritura en caché de 5 min: 1,375 USD Escritura en caché de 1 h: 2,20 USD Acierto de caché: 0,11 USD Escritura en caché por lotes de 5 min: 0,688 USD Escritura en caché por lotes de 1 h: 1,10 USD Acierto de caché por lotes: 0,055 USD

asia‑southeast1

Modelo	Precio (por 1 M de tokens) < 200.000 tokens de entrada	Precio (por 1 M de tokens) >= 200.000 tokens de entrada
Claude Opus 4.5	Entrada: 5,50 USD Salida: 27,50 USD Entrada por lotes: 2,75 USD Salida por lotes: 13,75 USD Escritura en caché de 5 min: 6,875 USD Escritura en caché de 1 h: 11,00 USD Acierto de caché: 0,55 USD Escritura en caché por lotes de 5 min: 3,438 USD Escritura en caché por lotes de 1 h: 5,50 USD Acierto de caché por lotes: 0,275 USD
Claude Sonnet 4.5	Entrada: 3,30 USD Salida: 16,50 USD Entrada por lotes: 1,65 USD Salida por lotes: 8,25 USD Escritura en caché de 5 min: 4,13 USD Escritura en caché de 1 h: 6,60 USD Acierto de caché: 0,33 USD Escritura en caché por lotes de 5 min: 2,06 USD Escritura en caché por lotes de 1 h: 3,30 USD Acierto de caché por lotes: 0,17 USD	Entrada: 6,60 USD Salida: 24,75 USD Escritura en caché de 5 min: 8,25 USD Escritura en caché de 1 h: 13,20 USD Cache Hit: 0,66 USD

asia‑east1

Modelo	Precio (por 1 M de tokens) < 200.000 tokens de entrada	Precio (por 1 M de tokens) >= 200.000 tokens de entrada
Claude Haiku 4.5	Entrada: 1,10 USD Salida: 5,50 USD Entrada por lotes: 0,55 USD Salida por lotes: 2,75 USD Escritura en caché de 5 min: 1,375 USD Escritura en caché de 1 h: 2,20 USD Acierto de caché: 0,11 USD Escritura en caché por lotes de 5 min: 0,688 USD Escritura en caché por lotes de 1 h: 1,10 USD Acierto de caché por lotes: 0,055 USD

* Si el contexto de entrada de una consulta tiene una longitud de 200.000 tokens o más, todos los tokens (de entrada y de salida) se cobran según las tarifas de contexto largo.

Modelos con precios uniformes en todas las regiones

Modelo	Precio (por 1 M de tokens) < 200.000 tokens de entrada	Precio (por 1 M de tokens) >= 200.000 tokens de entrada
Claude Opus 4.1	Entrada: 15 USD Salida: 75 USD Entrada por lotes: 7,50 USD Salida por lotes: 37,50 USD Escritura en caché de 5 min: 18,75 USD Escritura en caché de 1 h: 30 USD Acierto de caché: 1,50 USD Escritura en caché por lotes de 5 min: 9,375 USD Escritura en caché por lotes de 1 h: 15,00 USD Acierto de caché por lotes: 0,75 USD	N/A
Claude Opus 4	Entrada: 15 USD Salida: 75 USD Entrada por lotes: 7,50 USD Salida por lotes: 37,50 USD Escritura en caché de 5 min: 18,75 USD Escritura en caché de 1 h: 30 USD Acierto de caché: 1,50 USD Escritura en caché por lotes de 5 min: 9,375 USD Escritura en caché por lotes de 1 h: 15,00 USD Acierto de caché por lotes: 0,75 USD	N/A
Claude Sonnet 4	Entrada: 3 USD Salida: 15 USD Entrada por lotes: 1,50 USD Salida por lotes: 7,50 USD Escritura en caché de 5 min: 3,75 USD Escritura en caché de 1 h: 6,00 USD Acierto de caché: 0,30 USD Escritura en caché por lotes de 5 min: 1,875 USD Escritura en caché por lotes de 1 h: 3,00 USD Acierto de caché por lotes: 0,15 USD
Claude 3 Haiku	Entrada: 0,25 USD Salida: 1,25 USD Escritura en caché de 5 minutos: 0,30 USD Escritura en caché de 1 hora: 0,50 USD Cache Hit: 0,03 USD	N/A
Claude 3.5 Haiku (obsoleto)	Entrada: 0,80 USD Salida: 4 USD Entrada por lotes: 0,40 USD Salida por lotes: 2 USD Escritura en caché de 5 min: 1 USD Escritura en caché de 1 h: 1,60 USD Acierto de caché: 0,08 USD Escritura en caché por lotes: 0,50 USD Acierto de caché por lotes: 0,04 USD	N/A
Claude 3.7 Sonnet (obsoleto)	Entrada: 3 USD Salida: 15 USD Entrada por lotes: 1,50 USD Salida por lotes: 7,50 USD Escritura en caché: 3,75 USD Acierto de caché: 0,30 USD Escritura en caché por lotes: 1,875 USD Acierto de caché por lotes: 0,15 USD	N/A
Claude 3.5 Sonnet v2 (obsoleto)	Entrada: 3 USD Salida: 15 USD Entrada por lotes: 1,50 USD Salida por lotes: 7,50 USD Escritura en caché: 3,75 USD Acierto de caché: 0,30 USD Escritura en caché por lotes: 1,875 USD Acierto de caché por lotes: 0,15 USD	N/A
Claude 3.5 Sonnet (obsoleto)	Entrada: 3 $ Salida: 15 $ Escritura en caché: 3,75 $ Acierto de caché: 0,30 $	N/A
Claude 3 Opus (no disponible)	Entrada: 15 $ Salida: 75 $ Cache Write: 18,75 $ Cache Hit: 1,50 $	N/A

* Si el contexto de entrada de una consulta tiene una longitud de 200.000 tokens o más, todos los tokens (de entrada y de salida) se cobran según las tarifas de contexto largo.

Precios de las herramientas

Herramienta	Precio
Solicitud de búsqueda web	10 USD por cada 1000 búsquedas Modelos admitidos: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1 y Claude Opus 4.

* Si el contexto de entrada de una consulta tiene una longitud de 200.000 tokens o más, todos los tokens (de entrada y de salida) se cobran según las tarifas de contexto largo.

Modelos de Deepseek

Modelo	Precios
DeepSeek-V3.1	Entrada: 0,60 USD por millón de tokens Salida: 1,70 USD por millón de tokens Entrada por lotes: 0,30 USD por millón de tokens Salida por lotes: 0,85 USD por millón de tokens
DeepSeek-V3.2	Entrada: 0,56 USD por millón de tokens Salida: 1,68 USD por millón de tokens Entrada por lotes: 0,28 USD por millón de tokens Salida por lotes: 0,84 USD por millón de tokens
DeepSeek-R1 (0528)	Entrada: 1,35 USD por millón de tokens Salida: 5,40 USD por millón de tokens Entrada por lotes: 0,675 USD por millón de tokens Salida por lotes: 2,70 USD por millón de tokens
DeepSeek-OCR	Entrada: 0,30 USD por millón de tokens (o 0,0003 USD por página) Salida: 1,20 USD por millón de tokens (o 0,00012 USD por página)

Modelos de MiniMax

Modelo	Precios
MiniMax-M2	Entrada: 0,30 USD por millón de tokens Salida: 1,20 USD por millón de tokens

Modelos de Moonshot

Modelo	Precios
Kimi-K2-Thinking	Entrada: 0,60 USD por millón de tokens Salida: 2,50 USD por millón de tokens

Modelos de Qwen

Modelo	Precios
Qwen3-Next-80B-Thinking	Entrada: 0,15 USD por millón de tokens Salida: 1,20 USD por millón de tokens
Qwen3-Next-80B-Instruct	Entrada: 0,15 USD por millón de tokens Salida: 1,20 USD por millón de tokens
Qwen3-Coder-480B-A35B-Instruct	Entrada: 0,22 USD por millón de tokens Salida: 1,80 USD por millón de tokens Cache Hit: 0,022 USD por millón de tokens Batch Input: 0,11 USD por millón de tokens Batch Output: 0,90 USD por millón de tokens
Qwen3-235B-A22B-Instruct-2507	Entrada: 0,22 USD por millón de tokens Salida: 0,88 USD por millón de tokens Entrada por lotes: 0,11 USD por millón de tokens Salida por lotes: 0,44 USD por millón de tokens

Modelos de GLM

Modelo	Precios
GLM-4.7 *	Entrada: 0,60 USD por millón de tokens Salida: 2,20 USD por millón de tokens

* Disponible sin coste económico hasta el 28 de enero del 2026.

Modelos de OpenAI

Modelo	Precios
gpt-oss-120b	Entrada: 0,09 USD por millón de tokens Salida: 0,36 USD por millón de tokens Entrada por lotes: 0,045 USD por millón de tokens Salida por lotes: 0,18 USD por millón de tokens
gpt-oss-20b	Entrada: 0,07 USD por millón de tokens Salida: 0,25 USD por millón de tokens Entrada por lotes: 0,035 USD por millón de tokens Salida por lotes: 0,125 USD por millón de tokens

Modelos Llama de Meta

Modelo	Precios
Llama 3.1 405B	Entrada: 5,00 USD por millón de tokens Salida: 16,00 USD por millón de tokens
Llama 3.3 70B	Entrada: 0,72 USD por millón de tokens Salida: 0,72 USD por millón de tokens Entrada por lotes: 0,36 USD por millón de tokens Salida por lotes: 0,36 USD por millón de tokens
Llama 4 Scout	Entrada: 0,25 USD por millón de tokens Salida: 0,70 USD por millón de tokens Entrada por lotes: 0,125 USD por millón de tokens Salida por lotes: 0,35 USD por millón de tokens
Llama 4 Maverick	Entrada: 0,35 USD por millón de tokens Salida: 1,15 USD por millón de tokens Entrada por lotes: 0,175 USD por millón de tokens Salida por lotes: 0,575 USD por millón de tokens

Modelos de Mistral AI

Modelo	Precios
Mistral OCR (25.05)	Entrada: 0,0005 USD por millón de tokens (o 0,0005 USD por página) Salida: 0,0005 USD por millón de tokens (o 0,0005 USD por página)
Mistral Medium 3	Entrada: 0,40 USD por millón de tokens Salida: 2,00 USD por millón de tokens
Mistral Small 3.1 (25.03)	Entrada: 0,10 USD por millón de tokens Salida: 0,30 USD por millón de tokens
Mistral Large (24.11) (obsoleto)	Entrada: 2,00 USD por millón de tokens Salida: 6,00 USD por millón de tokens
Codestral 2	Entrada: 0,30 USD por millón de tokens Salida: 0,90 USD por millón de tokens
Codestral (25.01) (obsoleto)	Entrada: 0,30 USD por millón de tokens Salida: 0,90 USD por millón de tokens

Solicita un presupuesto personalizado

Gracias al modelo de pago por uso de Google Cloud, solo pagas por los servicios que usas. Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu empresa.

Contactar con Ventas