Coste de crear y desplegar modelos de IA en Vertex AI

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Solo se te cobra por las solicitudes que devuelven un código de respuesta 200. Las solicitudes que devuelvan otros códigos de respuesta, como los códigos 4xx y 5xx, no se cobran por la entrada ni por la salida.

En esta página se indican los precios de la IA generativa en Vertex AI. Para consultar los precios de otros servicios de Vertex AI, como los de la plataforma de aprendizaje automático y los de MLOps, visita la página de precios de Vertex AI.

Modelos de Google

Gemini 3

Modelo Tipo Precio (por 1 M de tokens) <= 200.000 tokens de entrada Precio (por 1 M de tokens) > 200.000 tokens de entrada Precio (por 1 M de tokens) <= 200.000 tokens de entrada almacenados en caché Precio (por 1 M de tokens) > 200.000 tokens de entrada almacenados en caché Precio (por 1 M de tokens) <= 200.000 tokens de entrada con la API por lotes Precio (por 1 M de tokens) > 200.000 tokens de entrada con la API por lotes
Versión preliminar de Gemini 3 Pro
Entrada (texto, imagen, vídeo o audio) 2 USD 4 $ 0,2 USD 0,4 USD 1 USD 2 USD
Salida de texto (respuesta y razonamiento) 12 USD 18 $ N/A N/A 6 $ 9 USD
Resultados de imagen** 120 $ N/A N/A N/A 60 USD N/A
Fundamentación con la Búsqueda de Google y fundamentación web para empresas Gemini 3 Pro incluye 5000 consultas de búsqueda al mes sin coste adicional.

Las consultas de búsqueda que superen esos límites se facturarán a 14 USD por cada 1000 consultas de búsqueda. Una petición enviada por un cliente a Gemini puede dar lugar a una o varias consultas en la Búsqueda de Google (o en Web Grounding for Enterprise). Se te cobrará cada consulta de búsqueda individual que realices. La facturación empezará el 5 de enero del 2026.

Los tokens de entrada proporcionados por Grounding with Google Search o Web Grounding for Enterprise no se cobran.

Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación con Google Maps Gemini 3 Pro incluye 5000 consultas de búsqueda al mes sin coste adicional.

Las consultas de Maps que superen esos límites se facturarán a 14 USD por cada 1000 consultas. Una petición enviada por un cliente a Gemini puede generar una o varias consultas a Google Maps. Se te cobrará cada consulta individual que realices. La facturación empezará el 5 de enero del 2026
Fundamentación con tus datos 2,5 USD por cada 1000 solicitudes.

* Si el contexto de entrada de una consulta supera los 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
** Una imagen de salida de 1024x1024 o 2048x2048 consume 1120 tokens de salida de imagen, lo que equivale a 0,134 USD por imagen generada. Una imagen 4K (4096x4096) consume 2000 tokens de salida de imagen, lo que equivale a 0,24 USD por imagen generada.

Gemini 2.5

Modelo Tipo Precio (por 1 M de tokens) <= 200.000 tokens de entrada Precio (por 1 M de tokens) > 200.000 tokens de entrada Precio (por 1 M de tokens) <= 200.000 tokens de entrada almacenados en caché Precio (por 1 M de tokens) > 200.000 tokens de entrada almacenados en caché Precio (por 1 M de tokens) <= 200.000 tokens de entrada con la API por lotes Precio (por 1 M de tokens) > 200.000 tokens de entrada con la API por lotes
Gemini 2.5 Pro
Entrada (texto, imagen, vídeo o audio) 1,25 USD 2,5 USD 0,125 USD 0,250 USD 0,625 USD 1,25 USD
Salida de texto (respuesta y razonamiento) 10 USD 15 USD N/A N/A 5 USD 7,5 USD
Gemini 2.5 Pro
Uso en ordenadores (versión preliminar)
Entrada (texto, imagen, vídeo o audio) 1,25 USD 2,5 USD N/A N/A N/A N/A
Salida de texto (respuesta y razonamiento) 10,00 USD 15,00 € N/A N/A N/A N/A


Gemini 2.5
Flash
Entrada (texto, imagen o vídeo) 0,30 USD 0,30 USD 0,03 USD 0,03 USD 0,15 USD 0,15 USD
Entrada de audio 1 USD 1 USD $0,100 $0,100 0,5 USD 0,5 USD
Salida de texto (respuesta y razonamiento) 2,50 USD 2,50 USD N/A N/A 1,25 USD 1,25 USD
Resultados de imagen*** 30 USD 30 USD N/A N/A 15 USD 15 USD




API Live de Gemini 2.5 Flash
1 millón de tokens de texto de entrada 0,5 USD 0,5 USD N/A N/A N/A N/A
1 millón de tokens de audio de entrada 3 USD 3 USD N/A N/A N/A N/A
1 millón de tokens de vídeo o imagen de entrada 3 USD 3 USD N/A N/A N/A N/A
1 millón de tokens de texto de salida 2 USD 2 USD N/A N/A N/A N/A
1 millón de tokens de audio de salida 12 USD 12 USD N/A N/A N/A N/A



Gemini 2.5 Flash Lite
Entrada (texto, imagen o vídeo) 0,1 USD 0,1 USD 0,010 USD 0,010 USD 0,05 USD 0,05 USD
Entrada de audio 0,3 $ 0,3 $ 0,03 USD 0,03 USD 0,15 USD 0,15 USD
Salida de texto (respuesta y razonamiento) 0,4 USD 0,4 USD N/A N/A 0,2 USD 0,2 USD


Fundamentación con la Búsqueda de Google
Gemini 2.0 Flash, 2.5 Flash y 2.5 Flash-Lite incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional. Gemini 2.5 Pro incluye 10.000 peticiones fundamentadas al día sin coste adicional.

Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas.

Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google&ast;&ast;. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.

Fundamentación web para empresas
45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a la fundamentación web para empresas**. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de peticiones fundamentadas al día.
Fundamentación con tus datos 2,5 USD por cada 1000 solicitudes.
Fundamentación con Google Maps 25 USD por cada 1000 peticiones fundamentadas.

Una petición fundamentada es una solicitud enviada a Gemini que hace al menos una consulta a Google Maps.

* Si el contexto de entrada de una consulta supera los 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
** El uso de Grounding con la Búsqueda de Google y Web Grounding para empresas se factura solo cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de referencia de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.
*** Una imagen de 1024x1024 consume 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.
**** La facturación del uso de Compute utiliza la SKU de Gemini 2.5 Pro. Para separar los costes del uso de Compute, aplica etiquetas de facturación. Más información

  • Explicación de la facturación de la ventana de contexto de las sesiones de LiveAPI: se le cobra por turno todos los tokens que haya en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye tokens nuevos (turno actual) y todos los tokens acumulados de los turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto que hayas configurado. Un "turno" es una entrada del usuario y la respuesta del modelo.
  • Modo de audio proactivo: cuando está habilitado, se cobran los tokens de entrada mientras LiveAPI está escuchando. Los tokens de salida solo se cobran cuando la API responde.
  • Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran según la tarifa de salida de tokens de texto.

Gemini 2.0

Gemini 2.0 se factura por tokens. Para calcular el número de tokens de entrada de tu solicitud antes de enviarla, puedes usar el tokenizador del SDK o la API countTokens. Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens utilizados.

Usa el botón de la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.

Precios basados en tokens

Modelo Tipo Precio Precio con la API de Batch




Gemini 2.0 Flash
1 millón de tokens de entrada 0,15 USD 0,075 USD
1 millón de tokens de audio de entrada 1 USD 0,50 USD
1 millón de tokens de texto de salida 0,60 USD 0,30 USD
Ajuste con 1 millón de tokens de entrenamiento 3,00 USD




Generación de imágenes con Gemini 2.0 Flash
1 millón de tokens de entrada 0,15 USD
1 millón de tokens de audio de entrada 1 USD
1 millón de tokens de vídeo de entrada 3 USD
1 millón de tokens de texto de salida 0,60 USD
1 millón de tokens de imagen de salida 30,00 USD




API Gemini 2.0 Flash Live
1 millón de tokens de texto de entrada 0,5 USD
1 millón de tokens de audio de entrada 3 USD
1 millón de tokens de vídeo o imagen de entrada 3 USD
1 millón de tokens de texto de salida 2 USD
1 millón de tokens de audio de salida 12 USD




Gemini 2.0 Flash Lite
1 millón de tokens de entrada 0,075 USD 0,0375 USD
1 millón de tokens de audio de entrada 0,075 USD 0,0375 USD
1 millón de tokens de texto de salida 0,30 USD 0,15 USD
Ajuste con 1 millón de tokens de entrenamiento 1 USD


Fundamentación con la Búsqueda de Google
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional.

Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas.

Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.

Fundamentación web para empresas
45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a Fundamentación Web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
Fundamentación con tus datos 2,5 USD por cada 1000 solicitudes a partir del 16 de junio del 2025.


Fundamentación con Google Maps
Los modelos de Gemini incluyen una serie de peticiones fundamentadas diarias sin coste adicional:
  • Gemini Flash y Flash-Lite: 1500 peticiones fundamentadas combinadas al día.
  • Gemini Pro: 10.000 peticiones fundamentadas al día.

  • Las peticiones fundamentadas que superen esos límites se facturarán a 25 USD por cada 1000 peticiones fundamentadas.

    Una petición fundamentada es una solicitud enviada a Gemini que hace al menos una consulta a Google Maps.

    Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.

    Precios basados en la modalidad

    Los precios de las modalidades que se indican a continuación se basan en casos prácticos de uso medio y son solo de referencia. La facturación real solo se basará en los tokens:

    • 4 caracteres equivalen aproximadamente a 1 token de texto, incluidos los espacios en blanco.
    • Para una imagen de 1024x1024, consume 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.
    • La entrada de vídeo consume 258 tokens por segundo a una tasa de muestreo de un fotograma por segundo. Los vídeos con audio se facturan tanto por los tokens de vídeo como por los de audio.
    • La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
    Modelo Tipo Precio Precio con la API de Batch




    Gemini 2.0 Flash
    Texto de entrada (USD/M de caracteres) 0,0375 USD 0,01875 USD
    Imagen de entrada (USD por imagen) 0,0001935 USD 0,00009675 USD
    Vídeo de entrada ($/s) 0,0000387 USD 0,00001935 USD
    Entrada de audio (USD/s) 0,000025 USD 0,0000125 USD
    Texto de salida (USD/M de caracteres) 0,15 USD 0,075 USD




    Generación de imágenes con Gemini 2.0 Flash
    Texto de entrada (USD/M de caracteres) 0,0375 USD
    Imagen de entrada (USD por imagen) 0,0001935 USD
    Vídeo de entrada ($/s) 0,0000387 USD
    Entrada de audio (USD/s) 0,000025 USD
    Texto de salida (USD/M de caracteres) 0,15 USD
    Imagen de salida ($/imagen) 0,04 USD





    Gemini 2.0 Flash Lite
    Texto de entrada (USD/M de caracteres) 0,01875 USD 0,009375 USD
    Imagen de entrada (USD por imagen) 0,00009675 USD 0,000048375 USD
    Vídeo de entrada ($/s) 0,00001935 USD 0,000009675 USD
    Entrada de audio (USD/s) 0,000001875 USD 0,000000938 USD
    Texto de salida (USD/M de caracteres) 0,075 USD 0,0375 USD


    Fundamentación con la Búsqueda de Google
    Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional.

    Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas.

    Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

    Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.

    Fundamentación web para empresas
    45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a Fundamentación Web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

    Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.

    * Los precios están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
    * Los tokens de entrenamiento se calculan multiplicando el número total de tokens del conjunto de datos de entrenamiento por el número de épocas.
    * Los PDFs se facturan como entradas de imagen, y una página de PDF equivale a una imagen.
    * El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
    * El uso de Grounding con la Búsqueda de Google y Web Grounding para empresas solo se factura cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de referencia de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.
    * API Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada o salida) y 258 tokens por segundo de vídeo (entrada). La fundamentación con la Búsqueda de Google sigue siendo gratuita mientras la API de Gemini 2.0 Flash Live esté en vista previa.

    • Explicación de la facturación de la ventana de contexto de las sesiones de LiveAPI: se le cobra por turno todos los tokens que haya en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye tokens nuevos (turno actual) y todos los tokens acumulados de los turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto que hayas configurado. Un "turno" es una entrada del usuario y la respuesta del modelo.
    • Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran según la tarifa de salida de tokens de texto.

    Precios de Vertex AI Model Optimizer (experimental)*

    Vertex AI Model Optimizer simplifica el uso de Gemini para los clientes empresariales, ya que proporciona un único metaendpoint para las peticiones de modelos de Gemini. Los clientes que usan este servicio no tienen que especificar si quieren usar Flash, Pro o una versión concreta. En lugar de eso, solo tienen que proporcionar un ajuste configurable (coste, calidad o equilibrio) para indicar sus preferencias, y Model Optimizer aplica el nivel de inteligencia adecuado para la tarea enviando cada consulta al modelo que mejor se adapte a ella.

    Vertex AI Model Optimizer aplica precios dinámicos. Esto significa que el precio medio por token depende del nivel de inteligencia del modelo que se aplique para completar la tarea. Por este motivo, a continuación se ofrecen ejemplos de precios para ilustrar posibles situaciones en función de la configuración (consulte las tablas que aparecen más abajo). Los SKUs de Model Optimizer cuestan 1 USD y funcionan como una unidad de compra que se aplica a tu facturación. Se te seguirá facturando en función del consumo después de usar los modelos.

    Relación de E/S de 5:1 Ejemplo 1:
    chatbot
    NOTA: Estos intervalos no son una garantía, los resultados de cada cliente pueden variar.
    Preferencia de los clientes Tokens de entrada de cliente enviados a MO Tokens de salida del cliente enviados a MO Precio medio de entrada por millón de tokens (intervalo alto) Precio medio de salida por millón de tokens (rango alto) Precio medio de entrada por millón de tokens (intervalo bajo) Precio medio de salida por millón de tokens (intervalo bajo)
    Coste 10.000.000 2.000.000 0,63 USD 2,50 USD 0,16 USD 0,63 USD
    Equilibrado 10.000.000 2.000.000 1,26 USD 5,00 USD 0,63 USD 2,50 USD
    Calidad 10.000.000 2.000.000 1,89 USD 7,50 USD 1,26 USD 5,00 USD
    Relación de E/S de 1:20 Ejemplo 2: Generación de contenido
    Preferencia de los clientes Tokens de entrada de cliente enviados a MO Tokens de salida del cliente enviados a MO Precio medio de entrada por millón de tokens (intervalo alto) Precio medio de salida por millón de tokens (rango alto) Precio medio de entrada por millón de tokens (intervalo bajo) Precio medio de salida por millón de tokens (intervalo bajo)
    Coste 1.000.000 20.000.000 0,63 USD 2,50 USD 0,16 USD 0,63 USD
    Equilibrado 1.000.000 20.000.000 1,26 USD 5,00 USD 0,63 USD 2,50 USD
    Calidad 1.000.000 20.000.000 1,89 USD 7,50 USD 1,26 USD 5,00 USD

    * Model Optimizer es una oferta experimental de pago que puede dirigir las peticiones a versiones experimentales de Gemini en Vertex.

    Otros modelos de Gemini

    Todos los modelos de Gemini, excepto Gemini 2.0 y Gemini 2.5, se facturan en función de las modalidades, como caracteres, imágenes o segundos de vídeo o audio. La entrada de texto se cobra por cada 1000 caracteres de entrada (petición) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco se excluyen del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo de dólar ($0,01) se redondean a un centavo. La entrada de contenido multimedia se cobra por imagen o por segundo (vídeo). Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens utilizados.

    Modelo Función Tipo Precio
    ( =< 128.000 tokens de entrada)
    Precio
    ( > 128.000 tokens de entrada)
    Gemini 1.5 Flash Multimodal Entrada de imagen
    Entrada de vídeo
    Entrada de texto
    Entrada de audio
    0,00002 USD por imagen
    0,00002 USD por segundo
    0,00001875 USD por cada 1000 caracteres
    0,000002 USD por segundo
    0,00004 USD por imagen
    0,00004 USD por segundo
    0,0000375 USD por cada 1000 caracteres
    0,000004 USD por segundo
    Salida de texto 0,000075 USD por cada 1000 caracteres 0,00015 USD por 1000 caracteres
    Tuneo* Token de entrenamiento 8 USD por millón de tokens
    Gemini 1.5 Pro Multimodal Entrada de imagen
    Entrada de vídeo
    Entrada de texto
    Entrada de audio
    0,00032875 USD por imagen
    0,00032875 USD por segundo
    0,0003125 USD por cada 1000 caracteres
    0,00003125 USD por segundo
    0,0006575 USD por imagen
    0,0006575 USD por segundo
    0,000625 USD por cada 1000 caracteres
    0,0000625 USD por segundo
    Salida de texto 0,00125 USD por 1000 caracteres 0,0025 USD por 1000 caracteres
    Tuneo* Token de entrenamiento 80 USD por millón de tokens
    Gemini 1.0 Pro Multimodal Entrada de imagen
    Entrada de vídeo
    Entrada de texto
    0,0025 USD por imagen
    0,002 USD por segundo
    0,000125 USD por cada 1000 caracteres
    Salida de texto 0,000375 USD por 1000 caracteres
    Fundamentación con la Búsqueda de Google Texto 35 USD por cada 1000 peticiones fundamentadas.

    Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

    Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
    Fundamentación web para empresas Texto 45 USD por cada 1000 peticiones fundamentadas.

    Una petición fundamentada es una solicitud que se envía a Gemini y que hace una o varias consultas a Fundamentación web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada.

    Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día.
    Fundamentación con tus datos Texto 2,50 USD por cada 1000 solicitudes a partir del 16 de junio del 2025.

    * Los precios están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
    * Si el contexto de una consulta supera los 128.000 tokens, todos los tokens se cobran según las tarifas de contexto largo.
    * Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
    * Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32.000 tokens.
    * Los PDFs se facturan como entradas de imagen, y una página de PDF equivale a una imagen.
    * El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
    * El uso de Grounding con la Búsqueda de Google y Web Grounding para empresas solo se factura cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de referencia de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.

    Imagen

    Con Imagen en Vertex AI, puedes generar imágenes originales y editarlas a partir de peticiones de texto que proporciones, o editar solo partes de las imágenes usando un área de máscara que definas, además de otras muchas funciones.

    Modelo Función Descripción Entrada Salida Precio
    Imagen 4 Ultra Generación de imágenes Generar una imagen Petición de texto Imagen 0,06 USD por imagen
    Imagen 4 Upscaling Aumenta la resolución de una imagen generada a 2K, 3K y 4K Imagen Imagen 0,06 USD por imagen
    Imagen 4 Generación de imágenes Generar una imagen Petición de texto Imagen 0,04 USD por imagen
    Imagen 4 Fast Generación de imágenes Generar una imagen Petición de texto Imagen 0,02 USD por imagen
    Imagen 3 Generación de imágenes Generar una imagen
    Editar una imagen
    Personalizar una imagen
    Petición de texto Imagen 0,04 USD por imagen
    Imagen 3 Fast Generación de imágenes Generar una imagen Petición de texto Imagen 0,02 USD por imagen
    Imagen 2, Imagen 1 Generación de imágenes Generar una imagen Petición de texto Imagen 0,020 USD por imagen
    Imagen 2, Imagen 1 Edición de imágenes Edita una imagen usando un enfoque con o sin máscara Petición de imagen o texto Imagen 0,020 USD por imagen
    Imagen 1 Upscaling Aumentar la resolución de una imagen generada a 2K y 4K Imagen Imagen 0,003 USD por imagen
    Imagen 1 Afinamiento Habilitar un "sujeto" proporcionado por el usuario para usarlo en peticiones de Imagen (entrenamiento con pocos ejemplos) Temas con identificador de texto y entre 4 y 8 imágenes por tema Modelo perfeccionado (tras el entrenamiento con temas proporcionados por el usuario) USD por hora de nodo (precios de entrenamiento personalizado de Vertex AI)
    Imagen Descripción Visual Genera un título corto o largo para una imagen Imagen Título de texto 0,0015 USD por imagen
    Imagen Preguntas y respuestas visuales Proporciona una respuesta basada en una pregunta que hace referencia a una imagen Petición de imagen o texto Respuesta de texto 0,0015 USD por imagen
    Imagen Recontextualización del producto Reimagina los productos en una nueva escena 1-3 imágenes del mismo producto y una petición de texto que describa la escena deseada Imagen 0,12 USD por imagen
    Vertex Virtual Try-On Crea imágenes de personas con diferentes prendas de vestir 1 imagen de una persona y 1 imagen de una prenda de vestir Imagen 0,06 USD por imagen

    Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

    Veo

    Veo crea vídeos de una calidad increíble en una amplia variedad de temas y estilos, y ofrece una mejor comprensión de la física del mundo real y de los matices del movimiento y la expresión humanos.

    Modelo Función Descripción Entrada Salida Resolución de salida Precio
    Veo 3.1 Generación de vídeo y audio Genera vídeos de alta calidad con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia Petición de texto o imagen Vídeo y audio 720p, 1080p 0,40 USD por segundo
    Veo 3.1 Generación de vídeos Genera vídeos de alta calidad a partir de una petición de texto o una imagen de referencia Petición de texto o imagen Vídeo 720p, 1080p 0,20 USD por segundo
    Veo 3.1 Fast Generación de vídeo y audio Genera vídeos con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia más rápido Petición de texto o imagen Vídeo y audio 720p, 1080p 0,15 USD por segundo
    Veo 3.1 Fast Generación de vídeos Genera vídeos a partir de una petición de texto o una imagen de referencia más rápido Petición de texto o imagen Vídeo 720p, 1080p 0,10 USD por segundo
    Veo 3 Generación de vídeo y audio Genera vídeos de alta calidad con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia Petición de texto o imagen Vídeo y audio 720p, 1080p 0,40 USD por segundo
    Veo 3 Generación de vídeos Genera vídeos de alta calidad a partir de una petición de texto o una imagen de referencia Petición de texto o imagen Vídeo 720p, 1080p 0,20 USD por segundo
    Veo 3 Fast Generación de vídeo y audio Genera vídeos con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia más rápido Petición de texto o imagen Vídeo y audio 720p, 1080p 0,15 USD por segundo
    Veo 3 Fast Generación de vídeos Genera vídeos a partir de una petición de texto o una imagen de referencia más rápido Petición de texto o imagen Vídeo 720p, 1080p 0,10 USD por segundo
    Veo 2 Generación de vídeos Genera vídeos a partir de una petición de texto o una imagen de referencia Petición de texto o imagen Vídeo 720p 0,50 USD por segundo
    Veo 2 Controles avanzados Genera vídeos interpolando fotogramas iniciales y finales, amplía los vídeos generados y aplica controles de cámara Petición de texto, imagen o vídeo Vídeo 720p 0,50 USD por segundo

    Lyria

    Lyria 2 ofrece una generación de música instrumental de alta calidad, ideal para composiciones sofisticadas y exploraciones creativas detalladas en las que es fundamental obtener resultados matizados.

    Modelo Función Descripción Entrada Salida Precio
    Lyria 2 Generación de música Genera música a partir de una petición de texto Petición de texto Música 0,06 USD por 30 segundos

    Conoce los costes de las incrustaciones en tus aplicaciones de IA

    Modelo Tipo Region Precio por 1000 tokens de entrada
    Gemini Embedding Entrada Global
    • Solicitudes online: 0,00015 USD
    • Solicitudes por lotes: 0,00012 USD
    Salida Global
    • Solicitudes online: sin coste económico
    • Solicitudes en lote: sin coste económico
    Modelo Tipo Region Precio por 1000 caracteres
    Embeddings para texto
    (sin incluir Gemini Embedding)
    Entrada Global
    • Solicitudes online: 0,000025 USD
    • Solicitudes por lotes: 0,00002 USD
    Salida Global
    • Solicitudes online: sin coste económico
    • Solicitudes en lote: sin coste económico
    Modelo Función Descripción Entrada Salida Precio
    multimodalembedding Embeddings for Multimodal: Text Genera inserciones usando texto como entrada Texto Incrustaciones 0,0002 USD por cada 1000 caracteres de entrada
    Incrustaciones para multimodal: imagen Genera inserciones usando una imagen como entrada Imagen Incrustaciones 0,0001 USD por imagen introducida
    Embeddings for Multimodal: Video Plus Video Plus Vídeo Incrustaciones (hasta 15 incrustaciones por minuto de vídeo) 0,0020 USD por segundo de vídeo
    Embeddings for Multimodal: Video Standard Video Standard Vídeo Incrustaciones (hasta 8 incrustaciones por minuto de vídeo) 0,0010 USD por segundo de vídeo
    Embeddings for Multimodal: Video Essential Video Essential Vídeo Embeddings (hasta 4 embeddings por minuto de vídeo) 0,0005 USD por segundo de vídeo
    Modelo de código abierto Tipo Precio por 1000 tokens de entrada
    multilingual-e5-small Entrada:
    Salida:

    Entrada por lotes:
    Salida por lotes:
    Solicitudes online: 0,000015 USD
    Solicitudes online: sin coste económico

    Solicitudes por lotes: 0,0000075 USD
    Solicitudes por lotes: sin coste económico
    multilingual-e5-large Entrada:
    Salida:

    Entrada por lotes:
    Salida por lotes:
    Solicitudes online: 0,000025 USD
    Solicitudes online: sin coste

    Solicitudes por lotes: 0,0000125 USD
    Solicitudes por lotes: sin coste

    Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

    Precios de la función de finalización de código de Vertex AI

    IA generativa en Vertex AI cobra por cada 1000 caracteres de entrada (petición) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco no se incluyen en el recuento. Durante la fase de vista previa, los cargos tienen un descuento del 100 %. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo de dólar ($0,01) se redondean a un centavo.

    Modelo Tipo Region Precio por 1000 caracteres
    Codey para la finalización de código Entrada Global
    • Solicitudes online: 0,00025 USD
    Salida Global
    • Solicitudes online: 0,0005 USD

    Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

    Translation (Text)

    Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones de los LLMs suelen ser más fluidas y naturales que las de los modelos de traducción clásicos, pero tienen una compatibilidad de idiomas más limitada (más información).

    Modelo Método Uso Precio por millón de caracteres
    LLM Text translation* Número de caracteres de entrada al mes

    10 USD por millón de caracteres*

    Número de caracteres de salida al mes

    10 USD por millón de caracteres*

    Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
    *El precio se calcula por cada carácter procesado por el modelo. Para obtener más información sobre el recuento de caracteres, consulta Facturación de caracteres.

    Precio del almacenamiento de caché de contexto para el almacenamiento en caché explícito

    Modelo Función Tipo Precio (por 1 M de tokens)
    <= 200.000 tokens de entrada
    Precio (por 1 M de tokens)
    > 200.000 tokens de entrada
    Gemini 3 Pro Almacenamiento en caché de contexto Entrada (texto, imagen, vídeo o audio) 4,5 USD (por millón de tokens/hora) 4,5 USD (por millón de tokens/hora)
    Gemini 2.5 Pro Almacenamiento en caché de contexto Entrada (texto, imagen, vídeo o audio) 4,5 USD (por millón de tokens/hora) 4,5 USD (por millón de tokens/hora)
    Gemini 2.5 Flash Almacenamiento en caché de contexto Entrada (texto, imagen, vídeo o audio) 1 USD (por millón de tokens al mes) 1 USD (por millón de tokens al mes)
    Gemini 2.5 Flash Lite Almacenamiento en caché de contexto Entrada (texto, imagen, vídeo o audio) 1 USD (por millón de tokens al mes) 1 USD (por millón de tokens al mes)

    Modelos de Gemini 2.0

    Precios basados en tokens


    Modelo

    Tipo
    Almacenamiento
    (M tok-hora)
    Precio




    Gemini 2.0 Flash
    1 millón de tokens de entrada 1 USD 0,0375 USD
    1 millón de tokens de audio de entrada 1 USD 0,25 USD
    1 millón de tokens de texto de salida N/A N/A


    Gemini 2.0 Flash Lite
    1 millón de tokens de entrada 1 USD 0,01875 USD
    1 millón de tokens de audio de entrada 1 USD 0,01875 USD
    1 millón de tokens de texto de salida N/A N/A

    Precios basados en la modalidad

    Los precios de las modalidades que se indican a continuación se basan en casos prácticos de uso medio y son solo de referencia. La facturación real solo se basará en los tokens:

    • 4 caracteres equivalen aproximadamente a 1 token de texto, incluidos los espacios en blanco.
    • Para una imagen de 1024x1024, consume 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.
    • La entrada de vídeo consume 258 tokens por segundo a una tasa de muestreo de un fotograma por segundo. Los vídeos con audio se facturan tanto por los tokens de vídeo como por los de audio.
    • La entrada de audio consume 25 tokens por segundo sin marca de tiempo.

    Modelo

    Tipo
    Almacenamiento
    (modalidad-hora)

    Precio




    Gemini 2.0 Flash
    Texto de entrada (USD/M de caracteres) 0,25 USD 0,009375 USD
    Imagen de entrada (USD por imagen) 0,00129 USD 0,000048375 USD
    Vídeo de entrada ($/s) 0,000258 USD 0,000009675 USD
    Entrada de audio (USD/s) 0,000025 USD 0,00000625 USD
    Texto de salida (USD/M de caracteres) N/A N/A




    Gemini 2.0 Flash Lite
    Texto de entrada (USD/M de caracteres) 0,25 USD 0,0046875 USD
    Imagen de entrada (USD por imagen) 0,00129 USD 0,0000241875 USD
    Vídeo de entrada ($/s) 0,000258 USD 0,000009675 USD
    Entrada de audio (USD/s) 0,000258 USD 0,0000048375 USD
    Texto de salida (USD/M de caracteres) N/A N/A


    Fundamentación con la Búsqueda de Google
    Gemini 2.0 Flash incluye hasta 1500 peticiones fundamentadas al día sin coste adicional. Las solicitudes fundamentadas
    que superen las 1500 al día se facturarán a 35 USD por cada 1000 solicitudes (hasta 1 millón de solicitudes al día).

    Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de solicitudes al día.

    Fundamentación web para empresas
    45 USD por cada 1000 solicitudes (hasta 1 millón de solicitudes al día) a partir del 5 de mayo del 2025.

    Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de solicitudes al día.

    * Los precios están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
    * Los PDFs se facturan como entradas de imagen, y una página de PDF equivale a una imagen.
    * El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
    * La fundamentación con la Búsqueda de Google solo se factura en las solicitudes que devuelven resultados que contienen al menos una URL de fundamentación de la Web. También se aplican las tarifas de uso del modelo de Gemini estándar.

    Capacidad de procesamiento reservada

    El rendimiento aprovisionado asegura el rendimiento para tus necesidades de IA generativa y se transacciona mediante unidades de escalado de IA generativa, o GSUs. Consulta más información sobre la cantidad de rendimiento que proporciona cada GSU aquí y usa nuestra herramienta de estimación online aquí.

    Duración Precio por GSU Por
    Compromiso de 1 semana 1200 $ Semana
    Compromiso de 1 mes 2700 USD Mes
    Compromiso de 3 meses 2400 USD Mes
    Compromiso de 1 año 2000 USD Mes

    Ejemplo de cálculo de costes

    Un usuario necesita asegurarse de que puede admitir 10 consultas por segundo (CPS) de una consulta con una entrada de 1000 tokens de texto y 500 tokens de audio,y recibir una salida de 300 tokens de texto usando gemini-2.0-flash.

    En la tabla de rendimiento y tasa de consumo, vemos que, en el caso de Gemini 2.0 Flash, la tasa de consumo de un token de texto de entrada es de 1 token, la de un token de audio de entrada es de 7 tokens y la de un token de texto de salida es de 4 tokens.

    El total de tokens de entrada del usuario es 1000* (1 token por token de texto de entrada) + 500* (7 tokens por token de audio de entrada) = 4500 tokens de entrada ajustados para el consumo. El total de tokens de salida del usuario es 300 * 4 (4 tokens por token de texto de salida) = 1200 tokens de salida ajustados por reducción. Si los sumamos, obtenemos 4500 tokens de entrada ajustados por el consumo + 1200 tokens de salida ajustados por el consumo = 5700 tokens en total por consulta.

    Si multiplicamos el número total de tokens por consulta por las CPS, obtenemos 5700 tokens totales por consulta × 10 CPS = 57.000 tokens totales por segundo.

    Si dividimos esta cifra por el rendimiento total por segundo por GSU,obtenemos 57.000 tokens totales por segundo ÷ 3360 de rendimiento por segundo por GSU = 16,96 GSUs. El incremento mínimo de GSUs que se pueden comprar para este modelo es 1, por lo que el usuario necesitaría 17 GSUs.

    Si el usuario quisiera mantener ese rendimiento durante una semana, le costaría 1200 USD x 17 GSUs = 20.400 USD a la semana. Si quisiera mantener ese rendimiento durante un mes, tendría que pagar 2700 USD x 17 GSUs = 45.900 USD al mes. Si quisiera mantener este rendimiento durante 3 meses, le costaría 2400 USD x 17 GSUs = 40.800 USD al mes. Por último, si quisieran mantener este rendimiento durante un año, el coste sería de 2000 USD x 17 GSUs = 34.000 USD al mes.

    Ajuste de modelos

    El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y la eficiencia del modelo. El ajuste de modelos ofrece las siguientes ventajas:

    • Mayor calidad para tus tareas específicas
    • Mayor solidez de los modelos
    • Menor latencia y coste de inferencia gracias a las peticiones más cortas

    El ajuste se cobra por millón de tokens de entrenamiento. Los tokens de entrenamiento se calculan multiplicando el número total de tokens de tu conjunto de datos de entrenamiento por el número de épocas. En cuanto a la inferencia de modelos, el endpoint del modelo ajustado de Gemini tiene el mismo precio de predicción que el modelo base.

    Modelo Tipo Precio (por 1 M de tokens de entrenamiento)
    Gemini 2.5 Pro Afinamiento supervisado 25 USD
    Gemini 2.5 Flash Afinamiento supervisado
    Afinamiento de preferencias
    5 USD
    Gemini 2.5 Flash Lite Afinamiento supervisado
    Afinamiento de preferencias
    1,5 USD
    Gemma 3 27B IT Afinamiento supervisado 6,83 €
    Llama 3.1 8B Afinamiento supervisado 0,67 $
    Llama 3.2 1B Afinamiento supervisado 0,28 $
    Llama 3.2 3B Afinamiento supervisado 0,61 $
    Llama 3.3 70B Afinamiento supervisado 6,72 $
    Llama 4 Scout 17B 16E Afinamiento supervisado 5,77 USD
    Qwen 3 32B Afinamiento supervisado 6,57 USD

    * Los tokens de entrenamiento se calculan multiplicando el número total de tokens del conjunto de datos de entrenamiento por el número de épocas.
    * El precio de las predicciones de un endpoint de un modelo ajustado de Gemini es el mismo que el del modelo base.

    Compara los precios de los modelos de partners en Vertex AI

    Los modelos de partners son una lista seleccionada de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta la descripción general de los modelos de partners. En las siguientes secciones se indican los detalles de los precios de los modelos de partners de Google.

    Modelos de AI21 Labs

    Modelo Precios
    Jamba 1.5 Large (obsoleto) Entrada: 2 USD por millón de tokens
    Salida: 8 USD por millón de tokens
    Jamba 1.5 Mini (obsoleto) Entrada: 0,20 USD por millón de tokens
    Salida: 0,40 USD por millón de tokens

    Modelos Claude de Anthropic

    Modelos con precios regionales

    Global

    Modelo Precio (por 1 M de tokens) < 200.000 tokens de entrada Precio (por 1 M de tokens) >= 200.000 tokens de entrada
    Claude Opus 4.5 Entrada: 5,00 USD
    Salida: 25,00 USD

    Entrada por lotes: 2,50 USD
    Salida por lotes: 12,50 USD

    Escritura en caché de 5 min: 6,25 USD
    Escritura en caché de 1 h: 10,00 USD

    Acierto de caché: 0,50 USD

    Escritura en caché por lotes de 5 min: 3,125 USD
    Escritura en caché por lotes de 1 h: 5,00 USD
    Acierto de caché por lotes: 0,25 USD
    Claude Sonnet 4.5 Entrada: 3,00 USD
    Salida: 15,00 USD

    Entrada por lotes: 1,50 USD
    Salida por lotes: 7,50 USD

    Escritura en caché de 5 M: 3,75 USD
    Escritura en caché de 1 h: 6,00 USD

    Acierto de caché: 0,30 USD

    Escritura en caché por lotes: 1,88 USD
    Acierto de caché por lotes: 0,15 USD
    Entrada: 6,00 USD
    Salida: 22,50 USD

    Entrada por lotes: 3,00 USD
    Salida por lotes: 11,25 USD

    Escritura en caché de 5 min: 7,50 USD
    Escritura en caché de 1 h: 12,00 USD

    Acierto de caché: 0,60 USD

    Escritura en caché por lotes: 3,75 USD
    Acierto de caché por lotes: 0,30 USD
    Claude Haiku 4.5 Entrada: 1,00 USD
    Salida: 5,00 USD

    Entrada por lotes: 0,50 USD
    Salida por lotes: 2,50 USD

    Escritura en caché de 5 M: 1,25 USD
    Escritura en caché de 1 h: 2,00 USD

    Acierto de caché: 0,10 USD

    Escritura en caché por lotes: 0,625 USD
    Acierto de caché por lotes: 0,05 USD

    us-east5

    Modelo Precio (por 1 M de tokens) < 200.000 tokens de entrada Precio (por 1 M de tokens) >= 200.000 tokens de entrada
    Claude Opus 4.5 Entrada: 5,50 USD
    Salida: 27,50 USD

    Entrada por lotes: 2,75 USD
    Salida por lotes: 13,75 USD

    Escritura en caché de 5 min: 6,875 USD
    Escritura en caché de 1 h: 11,00 USD

    Acierto de caché: 0,55 USD

    Escritura en caché por lotes de 5 min: 3,438 USD
    Escritura en caché por lotes de 1 h: 5,50 USD
    Acierto de caché por lotes: 0,275 USD
    Claude Sonnet 4.5 Entrada: 3,30 USD
    Salida: 16,50 USD

    Entrada por lotes: 1,65 USD
    Salida por lotes: 8,25 USD

    Escritura en caché de 5 min: 4,13 USD
    Escritura en caché de 1 h: 6,60 USD

    Acierto de caché: 0,33 USD

    Escritura en caché por lotes: 2,06 USD
    Acierto de caché por lotes: 0,17 USD
    Entrada: 6,60 USD
    Salida: 24,75 USD

    Entrada por lotes: 3,30 USD
    Salida por lotes: 12,38 USD

    Escritura en caché de 5 M: 8,25 USD
    Escritura en caché de 1 h: 13,20 USD

    Acierto de caché: 0,66 USD

    Escritura en caché por lotes: 4,13 USD
    Acierto de caché por lotes: 0,33 USD
    Claude Haiku 4.5 Entrada: 1,10 USD
    Salida: 5,50 USD

    Entrada por lotes: 0,55 USD
    Salida por lotes: 2,75 USD

    Escritura en caché de 5 min: 1,375 USD
    Escritura en caché de 1 h: 2,20 USD

    Escritura en caché: 1,375 USD
    Acierto de caché: 0,11 USD

    Escritura en caché por lotes: 0,688 USD
    Acierto de caché por lotes: 0,055 USD

    europe‑west1

    Modelo Precio (por 1 M de tokens) < 200.000 tokens de entrada Precio (por 1 M de tokens) >= 200.000 tokens de entrada
    Claude Opus 4.5 Entrada: 5,50 USD
    Salida: 27,50 USD

    Entrada por lotes: 2,75 USD
    Salida por lotes: 13,75 USD

    Escritura en caché de 5 min: 6,875 USD
    Escritura en caché de 1 h: 11,00 USD

    Acierto de caché: 0,55 USD

    Escritura en caché por lotes de 5 min: 3,438 USD
    Escritura en caché por lotes de 1 h: 5,50 USD
    Acierto de caché por lotes: 0,275 USD
    Claude Sonnet 4.5 Entrada: 3,30 USD
    Salida: 16,50 USD

    Entrada por lotes: 1,65 USD
    Salida por lotes: 8,25 USD

    Escritura en caché de 5 min: 4,13 USD
    Escritura en caché de 1 h: 6,60 USD

    Acierto de caché: 0,33 USD

    Escritura en caché por lotes: 2,06 USD
    Acierto de caché por lotes: 0,17 USD
    Entrada: 6,60 USD
    Salida: 24,75 USD

    Entrada por lotes: 3,30 USD
    Salida por lotes: 12,38 USD

    Escritura en caché de 5 M: 8,25 USD
    Escritura en caché de 1 h: 13,20 USD

    Acierto de caché: 0,66 USD

    Escritura en caché por lotes: 4,13 USD
    Acierto de caché por lotes: 0,33 USD
    Claude Haiku 4.5 Entrada: 1,10 USD
    Salida: 5,50 USD

    Entrada por lotes: 0,55 USD
    Salida por lotes: 2,75 USD

    Escritura en caché de 5 M: 1,375 USD
    Escritura en caché de 1 h: 2,20 USD

    Acierto de caché: 0,11 USD

    Escritura en caché por lotes: 0,688 USD
    Acierto de caché por lotes: 0,055 USD

    asia‑southeast1

    Modelo Precio (por 1 M de tokens) < 200.000 tokens de entrada Precio (por 1 M de tokens) >= 200.000 tokens de entrada
    Claude Opus 4.5 Entrada: 5,50 USD
    Salida: 27,50 USD

    Entrada por lotes: 2,75 USD
    Salida por lotes: 13,75 USD

    Escritura en caché de 5 min: 6,875 USD
    Escritura en caché de 1 h: 11,00 USD

    Acierto de caché: 0,55 USD

    Escritura en caché por lotes de 5 min: 3,438 USD
    Escritura en caché por lotes de 1 h: 5,50 USD
    Acierto de caché por lotes: 0,275 USD
    Claude Sonnet 4.5 Entrada: 3,30 USD
    Salida: 16,50 USD

    Entrada por lotes: 1,65 USD
    Salida por lotes: 8,25 USD

    Escritura en caché de 5 min: 4,13 USD
    Escritura en caché de 1 h: 6,60 USD

    Acierto de caché: 0,33 USD

    Escritura en caché por lotes: 2,06 USD
    Acierto de caché por lotes: 0,17 USD
    Entrada: 6,60 USD
    Salida: 24,75 USD

    Entrada por lotes: 3,30 USD
    Salida por lotes: 12,38 USD

    Escritura en caché de 5 M: 8,25 USD
    Escritura en caché de 1 h: 13,20 USD

    Acierto de caché: 0,66 USD

    Escritura en caché por lotes: 4,13 USD
    Acierto de caché por lotes: 0,33 USD

    asia‑east1

    Modelo Precio (por 1 M de tokens) < 200.000 tokens de entrada Precio (por 1 M de tokens) >= 200.000 tokens de entrada
    Claude Haiku 4.5 Entrada: 1,10 USD
    Salida: 5,50 USD

    Entrada por lotes: 0,55 USD
    Salida por lotes: 2,75 USD

    Escritura en caché de 5 min: 1,375 USD
    Escritura en caché de 1 h: 2,20 USD

    Escritura en caché: 1,375 USD
    Acierto de caché: 0,11 USD

    Escritura en caché por lotes: 0,688 USD
    Acierto de caché por lotes: 0,055 USD

    * Si el contexto de entrada de una consulta tiene una longitud igual o superior a 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.

    Modelos con precios uniformes en todas las regiones

    Modelo Precio (por 1 M de tokens) < 200.000 tokens de entrada Precio (por 1 M de tokens) >= 200.000 tokens de entrada
    Claude Opus 4.1 Entrada: 15 USD
    Salida: 75 USD

    Entrada por lote: 7,50 USD
    Salida por lote: 37,50 USD

    Escritura en caché de 5 M: 18,75 USD
    Escritura en caché de 1 h: 30 USD

    Acierto de caché: 1,50 USD

    Escritura en caché por lote: 9,375 USD
    Acierto de caché por lote: 0,75 USD
    N/A
    Claude Opus 4 Entrada: 15 USD
    Salida: 75 USD

    Entrada por lotes: 7,50 USD
    Salida por lotes: 37,50 USD

    Escritura en caché de 5 M: 18,75 USD
    Escritura en caché de 1 h: 30 USD

    Acierto de caché: 1,50 USD

    Escritura en caché por lotes: 9,375 USD
    Acierto de caché por lotes: 0,75 USD
    N/A
    Claude Sonnet 4 Entrada: 3 USD
    Salida: 15 USD

    Entrada por lote: 1,50 USD
    Salida por lote: 7,50 USD

    Escritura en caché de 5 M: 3,75 USD
    Escritura en caché de 1 h: 6,00 USD

    Acierto de caché: 0,30 USD

    Escritura en caché por lote: 1,875 USD
    Acierto de caché por lote: 0,15 USD
    Entrada: 6 USD
    Salida: 22,50 USD

    Entrada por lotes: 3 USD
    Salida por lotes: 11,25 USD

    Escritura en caché de 5 min: 7,50 USD
    Escritura en caché de 1 h: 12,00 USD

    Acierto de caché: 0,60 USD

    Escritura en caché por lotes: 3,75 USD
    Acierto de caché por lotes: 0,30 USD
    Claude 3.5 Haiku Entrada: 0,80 USD
    Salida: 4 USD

    Entrada por lotes: 0,40 USD
    Salida por lotes: 2 USD

    Escritura en caché de 5 minutos: 1 USD
    Escritura en caché de 1 hora: 1,60 USD

    Acierto de caché: 0,08 USD

    Escritura en caché por lotes: 0,50 USD
    Acierto de caché por lotes: 0,04 USD
    N/A
    Claude 3 Haiku Entrada: 0,25 USD
    Salida: 1,25 USD

    Escritura en caché de 5 min: 0,30 USD
    Escritura en caché de 1 h: 0,50 USD

    Acierto de caché: 0,03 USD
    N/A
    Claude 3.7 Sonnet (obsoleto) Entrada: 3 USD
    Salida: 15 USD

    Entrada por lote: 1,50 USD
    Salida por lote: 7,50 USD

    Escritura en caché: 3,75 USD
    Acierto de caché: 0,30 USD

    Escritura en caché por lote: 1,875 USD
    Acierto de caché por lote: 0,15 USD
    N/A
    Claude 3.5 Sonnet v2 (obsoleto) Entrada: 3 USD
    Salida: 15 USD

    Entrada por lote: 1,50 USD
    Salida por lote: 7,50 USD

    Escritura en caché: 3,75 USD
    Acierto de caché: 0,30 USD

    Escritura en caché por lote: 1,875 USD
    Acierto de caché por lote: 0,15 USD
    N/A
    Claude 3.5 Sonnet (obsoleto) Entrada: 3 $
    Salida: 15 $

    Escritura en caché: 3,75 $
    Acierto de caché: 0,30 $
    N/A
    Claude 3 Opus (obsoleto) Entrada: 15 $
    Salida: 75 $

    Escritura en caché: 18,75 $
    Acierto de caché: 1,50 $
    N/A

    * Si el contexto de entrada de una consulta tiene una longitud igual o superior a 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.

    Precios de las herramientas

    Herramienta Precio
    Solicitud de búsqueda web 10 USD por cada 1000 búsquedas
    Modelos admitidos: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1 y Claude Opus 4.

    * Si el contexto de entrada de una consulta tiene una longitud igual o superior a 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.

    Modelos de Deepseek

    Modelo Precios
    DeepSeek-V3.1 Entrada: 0,60 USD por millón de tokens
    Salida: 1,70 USD por millón de tokens

    Entrada por lotes: 0,30 USD por millón de tokens
    Salida por lotes: 0,85 USD por millón de tokens
    DeepSeek-V3.2 * Entrada: 0,56 USD por millón de tokens
    Salida: 1,68 USD por millón de tokens

    Entrada por lotes: 0,28 USD por millón de tokens
    Salida por lotes: 0,84 USD por millón de tokens
    DeepSeek-R1 (0528) Entrada: 1,35 USD por millón de tokens
    Salida: 5,40 USD por millón de tokens

    Entrada por lotes: 0,675 USD por millón de tokens
    Salida por lotes: 2,70 USD por millón de tokens
    DeepSeek-OCR Entrada: 0,30 USD por millón de tokens (o 0,0003 USD por página)
    Salida: 1,20 USD por millón de tokens (o 0,00012 USD por página)
    • Disponible sin coste económico hasta el 17 de diciembre del 2025.

    Modelos de MiniMax

    Modelo Precios
    MiniMax-M2 Entrada: 0,30 USD por millón de tokens
    Salida: 1,20 USD por millón de tokens

    Modelos de Moonshot

    Modelo Precios
    Kimi-K2-Thinking Entrada: 0,60 USD por millón de tokens
    Salida: 2,50 USD por millón de tokens

    Modelos de Qwen

    Modelo Precios
    Qwen3-Next-80B-Thinking Entrada: 0,15 USD por millón de tokens
    Salida: 1,20 USD por millón de tokens
    Qwen3-Next-80B-Instruct Entrada: 0,15 USD por millón de tokens
    Salida: 1,20 USD por millón de tokens
    Qwen3-Coder-480B-A35B-Instruct Entrada: 0,22 USD por millón de tokens
    Salida: 1,80 USD por millón de tokens

    Entrada por lotes: 0,11 USD por millón de tokens
    Salida por lotes: 0,90 USD por millón de tokens
    Qwen3-235B-A22B-Instruct-2507 Entrada: 0,22 USD por millón de tokens
    Salida: 0,88 USD por millón de tokens

    Entrada por lotes: 0,11 USD por millón de tokens
    Salida por lotes: 0,44 USD por millón de tokens

    Modelos de OpenAI

    Modelo Precios
    gpt-oss-120b Entrada: 0,09 USD por millón de tokens
    Salida: 0,36 USD por millón de tokens

    Entrada por lotes: 0,045 USD por millón de tokens
    Salida por lotes: 0,18 USD por millón de tokens
    gpt-oss-20b Entrada: 0,07 USD por millón de tokens
    Salida: 0,25 USD por millón de tokens

    Entrada por lotes: 0,035 USD por millón de tokens
    Salida por lotes: 0,125 USD por millón de tokens

    Modelos Llama de Meta

    Modelo Precios
    Llama 3.1 405B Entrada: 5,00 USD por millón de tokens
    Salida: 16,00 USD por millón de tokens
    Llama 3.3 70B Entrada: 0,72 USD por millón de tokens
    Salida: 0,72 USD por millón de tokens

    Entrada por lotes: 0,36 USD por millón de tokens
    Salida por lotes: 0,36 USD por millón de tokens
    Llama 4 Scout Entrada: 0,25 USD por millón de tokens
    Salida: 0,70 USD por millón de tokens

    Entrada por lotes: 0,125 USD por millón de tokens
    Salida por lotes: 0,35 USD por millón de tokens
    Llama 4 Maverick Entrada: 0,35 USD por millón de tokens
    Salida: 1,15 USD por millón de tokens

    Entrada por lotes: 0,175 USD por millón de tokens
    Salida por lotes: 0,575 USD por millón de tokens

    Modelos de Mistral AI

    Modelo Precios
    Mistral OCR (25.05) Entrada: 0,0005 USD por millón de tokens (o 0,0005 USD por página)
    Salida: 0,0005 USD por millón de tokens (o 0,0005 USD por página)
    Mistral Medium 3 Entrada: 0,40 USD por millón de tokens
    Salida: 2,00 USD por millón de tokens
    Mistral Small 3.1 (25.03) Entrada: 0,10 USD por millón de tokens
    Salida: 0,30 USD por millón de tokens
    Mistral Large (24.11) (obsoleto) Entrada: 2,00 USD por millón de tokens
    Salida: 6,00 USD por millón de tokens
    Codestral 2 Entrada: 0,30 USD por millón de tokens
    Salida: 0,90 USD por millón de tokens
    Codestral (25.01) (obsoleto) Entrada: 0,30 USD por millón de tokens
    Salida: 0,90 USD por millón de tokens

    Solicita un presupuesto personalizado

    Gracias al modelo de pago por uso de Google Cloud, solo pagas por los servicios que usas. Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu empresa.
    Contactar con Ventas