Coste de crear y desplegar modelos de IA en Vertex AI
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Solo se te cobra por las solicitudes que devuelven un código de respuesta 200. Las solicitudes que devuelvan otros códigos de respuesta, como los códigos 4xx y 5xx, no se cobran por la entrada ni por la salida.
En esta página se indican los precios de la IA generativa en Vertex AI. Para consultar los precios de otros servicios de Vertex AI, como los de la plataforma de aprendizaje automático y los de MLOps, visita la página de precios de Vertex AI.
Modelos de Google
Gemini 3
| Modelo | Tipo | Precio (por 1 M de tokens) <= 200.000 tokens de entrada | Precio (por 1 M de tokens) > 200.000 tokens de entrada | Precio (por 1 M de tokens) <= 200.000 tokens de entrada almacenados en caché | Precio (por 1 M de tokens) > 200.000 tokens de entrada almacenados en caché | Precio (por 1 M de tokens) <= 200.000 tokens de entrada con la API por lotes | Precio (por 1 M de tokens) > 200.000 tokens de entrada con la API por lotes |
|---|---|---|---|---|---|---|---|
| Versión preliminar de Gemini 3 Pro | |||||||
| Entrada (texto, imagen, vídeo o audio) | 2 USD | 4 $ | 0,2 USD | 0,4 USD | 1 USD | 2 USD | |
| Salida de texto (respuesta y razonamiento) | 12 USD | 18 $ | N/A | N/A | 6 $ | 9 USD | |
| Resultados de imagen** | 120 $ | N/A | N/A | N/A | 60 USD | N/A | |
| Fundamentación con la Búsqueda de Google y fundamentación web para empresas |
Gemini 3 Pro incluye 5000 consultas de búsqueda al mes sin coste adicional. Las consultas de búsqueda que superen esos límites se facturarán a 14 USD por cada 1000 consultas de búsqueda. Una petición enviada por un cliente a Gemini puede dar lugar a una o varias consultas en la Búsqueda de Google (o en Web Grounding for Enterprise). Se te cobrará cada consulta de búsqueda individual que realices. La facturación empezará el 5 de enero del 2026. Los tokens de entrada proporcionados por Grounding with Google Search o Web Grounding for Enterprise no se cobran. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||||||
| Fundamentación con Google Maps |
Gemini 3 Pro incluye 5000 consultas de búsqueda al mes sin coste adicional. Las consultas de Maps que superen esos límites se facturarán a 14 USD por cada 1000 consultas. Una petición enviada por un cliente a Gemini puede generar una o varias consultas a Google Maps. Se te cobrará cada consulta individual que realices. La facturación empezará el 5 de enero del 2026 |
||||||
| Fundamentación con tus datos | 2,5 USD por cada 1000 solicitudes. | ||||||
* Si el contexto de entrada de una consulta supera los 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
** Una imagen de salida de 1024x1024 o 2048x2048 consume 1120 tokens de salida de imagen, lo que equivale a 0,134 USD por imagen generada. Una imagen 4K (4096x4096) consume 2000 tokens de salida de imagen, lo que equivale a 0,24 USD por imagen generada.
Gemini 2.5
| Modelo | Tipo | Precio (por 1 M de tokens) <= 200.000 tokens de entrada | Precio (por 1 M de tokens) > 200.000 tokens de entrada | Precio (por 1 M de tokens) <= 200.000 tokens de entrada almacenados en caché | Precio (por 1 M de tokens) > 200.000 tokens de entrada almacenados en caché | Precio (por 1 M de tokens) <= 200.000 tokens de entrada con la API por lotes | Precio (por 1 M de tokens) > 200.000 tokens de entrada con la API por lotes |
|---|---|---|---|---|---|---|---|
| Gemini 2.5 Pro | |||||||
| Entrada (texto, imagen, vídeo o audio) | 1,25 USD | 2,5 USD | 0,125 USD | 0,250 USD | 0,625 USD | 1,25 USD | |
| Salida de texto (respuesta y razonamiento) | 10 USD | 15 USD | N/A | N/A | 5 USD | 7,5 USD | |
| Gemini 2.5 Pro Uso en ordenadores (versión preliminar) |
|||||||
| Entrada (texto, imagen, vídeo o audio) | 1,25 USD | 2,5 USD | N/A | N/A | N/A | N/A | |
| Salida de texto (respuesta y razonamiento) | 10,00 USD | 15,00 € | N/A | N/A | N/A | N/A | |
Gemini 2.5 Flash |
|||||||
| Entrada (texto, imagen o vídeo) | 0,30 USD | 0,30 USD | 0,03 USD | 0,03 USD | 0,15 USD | 0,15 USD | |
| Entrada de audio | 1 USD | 1 USD | $0,100 | $0,100 | 0,5 USD | 0,5 USD | |
| Salida de texto (respuesta y razonamiento) | 2,50 USD | 2,50 USD | N/A | N/A | 1,25 USD | 1,25 USD | |
| Resultados de imagen*** | 30 USD | 30 USD | N/A | N/A | 15 USD | 15 USD | |
API Live de Gemini 2.5 Flash |
|||||||
| 1 millón de tokens de texto de entrada | 0,5 USD | 0,5 USD | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de audio de entrada | 3 USD | 3 USD | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de vídeo o imagen de entrada | 3 USD | 3 USD | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de texto de salida | 2 USD | 2 USD | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de audio de salida | 12 USD | 12 USD | N/A | N/A | N/A | N/A | |
Gemini 2.5 Flash Lite |
|||||||
| Entrada (texto, imagen o vídeo) | 0,1 USD | 0,1 USD | 0,010 USD | 0,010 USD | 0,05 USD | 0,05 USD | |
| Entrada de audio | 0,3 $ | 0,3 $ | 0,03 USD | 0,03 USD | 0,15 USD | 0,15 USD | |
| Salida de texto (respuesta y razonamiento) | 0,4 USD | 0,4 USD | N/A | N/A | 0,2 USD | 0,2 USD | |
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash, 2.5 Flash y 2.5 Flash-Lite incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional. Gemini 2.5 Pro incluye 10.000 peticiones fundamentadas al día sin coste adicional. Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google**. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||||||
Fundamentación web para empresas |
45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a la fundamentación web para empresas**. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de peticiones fundamentadas al día. |
||||||
| Fundamentación con tus datos | 2,5 USD por cada 1000 solicitudes. | ||||||
| Fundamentación con Google Maps | 25 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace al menos una consulta a Google Maps. |
||||||
* Si el contexto de entrada de una consulta supera los 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
** El uso de Grounding con la Búsqueda de Google y Web Grounding para empresas se factura solo cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de referencia de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.
*** Una imagen de 1024x1024 consume 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.
**** La facturación del uso de Compute utiliza la SKU de Gemini 2.5 Pro. Para separar los costes del uso de Compute, aplica etiquetas de facturación. Más información
- Explicación de la facturación de la ventana de contexto de las sesiones de LiveAPI: se le cobra por turno todos los tokens que haya en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye tokens nuevos (turno actual) y todos los tokens acumulados de los turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto que hayas configurado. Un "turno" es una entrada del usuario y la respuesta del modelo.
- Modo de audio proactivo: cuando está habilitado, se cobran los tokens de entrada mientras LiveAPI está escuchando. Los tokens de salida solo se cobran cuando la API responde.
- Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran según la tarifa de salida de tokens de texto.
Gemini 2.0
Gemini 2.0 se factura por tokens. Para calcular el número de tokens de entrada de tu solicitud antes de enviarla, puedes usar el tokenizador del SDK o la API countTokens. Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens utilizados.
Usa el botón de la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.
Precios basados en tokens
| Modelo | Tipo | Precio | Precio con la API de Batch | ||
|---|---|---|---|---|---|
Gemini 2.0 Flash |
|||||
| 1 millón de tokens de entrada | 0,15 USD | 0,075 USD | |||
| 1 millón de tokens de audio de entrada | 1 USD | 0,50 USD | |||
| 1 millón de tokens de texto de salida | 0,60 USD | 0,30 USD | |||
| Ajuste con 1 millón de tokens de entrenamiento | 3,00 USD | ||||
Generación de imágenes con Gemini 2.0 Flash |
|||||
| 1 millón de tokens de entrada | 0,15 USD | ||||
| 1 millón de tokens de audio de entrada | 1 USD | ||||
| 1 millón de tokens de vídeo de entrada | 3 USD | ||||
| 1 millón de tokens de texto de salida | 0,60 USD | ||||
| 1 millón de tokens de imagen de salida | 30,00 USD | ||||
API Gemini 2.0 Flash Live |
|||||
| 1 millón de tokens de texto de entrada | 0,5 USD | ||||
| 1 millón de tokens de audio de entrada | 3 USD | ||||
| 1 millón de tokens de vídeo o imagen de entrada | 3 USD | ||||
| 1 millón de tokens de texto de salida | 2 USD | ||||
| 1 millón de tokens de audio de salida | 12 USD | ||||
Gemini 2.0 Flash Lite |
|||||
| 1 millón de tokens de entrada | 0,075 USD | 0,0375 USD | |||
| 1 millón de tokens de audio de entrada | 0,075 USD | 0,0375 USD | |||
| 1 millón de tokens de texto de salida | 0,30 USD | 0,15 USD | |||
| Ajuste con 1 millón de tokens de entrenamiento | 1 USD | ||||
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional. Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||||
Fundamentación web para empresas |
45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a Fundamentación Web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||||
| Fundamentación con tus datos | 2,5 USD por cada 1000 solicitudes a partir del 16 de junio del 2025. | ||||
Fundamentación con Google Maps |
Los modelos de Gemini incluyen una serie de peticiones fundamentadas diarias sin coste adicional: Las peticiones fundamentadas que superen esos límites se facturarán a 25 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace al menos una consulta a Google Maps. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||||
Precios basados en la modalidad
Los precios de las modalidades que se indican a continuación se basan en casos prácticos de uso medio y son solo de referencia. La facturación real solo se basará en los tokens:
- 4 caracteres equivalen aproximadamente a 1 token de texto, incluidos los espacios en blanco.
- Para una imagen de 1024x1024, consume 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.
- La entrada de vídeo consume 258 tokens por segundo a una tasa de muestreo de un fotograma por segundo. Los vídeos con audio se facturan tanto por los tokens de vídeo como por los de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
| Modelo | Tipo | Precio | Precio con la API de Batch |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| Texto de entrada (USD/M de caracteres) | 0,0375 USD | 0,01875 USD | |
| Imagen de entrada (USD por imagen) | 0,0001935 USD | 0,00009675 USD | |
| Vídeo de entrada ($/s) | 0,0000387 USD | 0,00001935 USD | |
| Entrada de audio (USD/s) | 0,000025 USD | 0,0000125 USD | |
| Texto de salida (USD/M de caracteres) | 0,15 USD | 0,075 USD | |
Generación de imágenes con Gemini 2.0 Flash |
|||
| Texto de entrada (USD/M de caracteres) | 0,0375 USD | ||
| Imagen de entrada (USD por imagen) | 0,0001935 USD | ||
| Vídeo de entrada ($/s) | 0,0000387 USD | ||
| Entrada de audio (USD/s) | 0,000025 USD | ||
| Texto de salida (USD/M de caracteres) | 0,15 USD | ||
| Imagen de salida ($/imagen) | 0,04 USD | ||
Gemini 2.0 Flash Lite |
|||
| Texto de entrada (USD/M de caracteres) | 0,01875 USD | 0,009375 USD | |
| Imagen de entrada (USD por imagen) | 0,00009675 USD | 0,000048375 USD | |
| Vídeo de entrada ($/s) | 0,00001935 USD | 0,000009675 USD | |
| Entrada de audio (USD/s) | 0,000001875 USD | 0,000000938 USD | |
| Texto de salida (USD/M de caracteres) | 0,075 USD | 0,0375 USD | |
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1500 peticiones fundamentadas al día sin coste adicional. Las peticiones fundamentadas que superen esos límites se facturarán a 35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||
Fundamentación web para empresas |
45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o varias consultas a Fundamentación Web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||
* Los precios están en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Los tokens de entrenamiento se calculan multiplicando el número total de tokens del conjunto de datos de entrenamiento por el número de épocas.
* Los PDFs se facturan como entradas de imagen, y una página de PDF equivale a una imagen.
* El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* El uso de Grounding con la Búsqueda de Google y Web Grounding para empresas solo se factura cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de referencia de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.
* API Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada o salida) y 258 tokens por segundo de vídeo (entrada). La fundamentación con la Búsqueda de Google sigue siendo gratuita mientras la API de Gemini 2.0 Flash Live esté en vista previa.
- Explicación de la facturación de la ventana de contexto de las sesiones de LiveAPI: se le cobra por turno todos los tokens que haya en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye tokens nuevos (turno actual) y todos los tokens acumulados de los turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto que hayas configurado. Un "turno" es una entrada del usuario y la respuesta del modelo.
- Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran según la tarifa de salida de tokens de texto.
Precios de Vertex AI Model Optimizer (experimental)*
Vertex AI Model Optimizer simplifica el uso de Gemini para los clientes empresariales, ya que proporciona un único metaendpoint para las peticiones de modelos de Gemini. Los clientes que usan este servicio no tienen que especificar si quieren usar Flash, Pro o una versión concreta. En lugar de eso, solo tienen que proporcionar un ajuste configurable (coste, calidad o equilibrio) para indicar sus preferencias, y Model Optimizer aplica el nivel de inteligencia adecuado para la tarea enviando cada consulta al modelo que mejor se adapte a ella.
Vertex AI Model Optimizer aplica precios dinámicos. Esto significa que el precio medio por token depende del nivel de inteligencia del modelo que se aplique para completar la tarea. Por este motivo, a continuación se ofrecen ejemplos de precios para ilustrar posibles situaciones en función de la configuración (consulte las tablas que aparecen más abajo). Los SKUs de Model Optimizer cuestan 1 USD y funcionan como una unidad de compra que se aplica a tu facturación. Se te seguirá facturando en función del consumo después de usar los modelos.
| Relación de E/S de 5:1 | Ejemplo 1: chatbot |
NOTA: Estos intervalos no son una garantía, los resultados de cada cliente pueden variar. | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Preferencia de los clientes | Tokens de entrada de cliente enviados a MO | Tokens de salida del cliente enviados a MO | Precio medio de entrada por millón de tokens (intervalo alto) | Precio medio de salida por millón de tokens (rango alto) | Precio medio de entrada por millón de tokens (intervalo bajo) | Precio medio de salida por millón de tokens (intervalo bajo) | |||||
| Coste | 10.000.000 | 2.000.000 | 0,63 USD | 2,50 USD | 0,16 USD | 0,63 USD | |||||
| Equilibrado | 10.000.000 | 2.000.000 | 1,26 USD | 5,00 USD | 0,63 USD | 2,50 USD | |||||
| Calidad | 10.000.000 | 2.000.000 | 1,89 USD | 7,50 USD | 1,26 USD | 5,00 USD | |||||
| Relación de E/S de 1:20 | Ejemplo 2: Generación de contenido | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Preferencia de los clientes | Tokens de entrada de cliente enviados a MO | Tokens de salida del cliente enviados a MO | Precio medio de entrada por millón de tokens (intervalo alto) | Precio medio de salida por millón de tokens (rango alto) | Precio medio de entrada por millón de tokens (intervalo bajo) | Precio medio de salida por millón de tokens (intervalo bajo) | |||||
| Coste | 1.000.000 | 20.000.000 | 0,63 USD | 2,50 USD | 0,16 USD | 0,63 USD | |||||
| Equilibrado | 1.000.000 | 20.000.000 | 1,26 USD | 5,00 USD | 0,63 USD | 2,50 USD | |||||
| Calidad | 1.000.000 | 20.000.000 | 1,89 USD | 7,50 USD | 1,26 USD | 5,00 USD | |||||
Otros modelos de Gemini
Todos los modelos de Gemini, excepto Gemini 2.0 y Gemini 2.5, se facturan en función de las modalidades, como caracteres, imágenes o segundos de vídeo o audio. La entrada de texto se cobra por cada 1000 caracteres de entrada (petición) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco se excluyen del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo de dólar ($0,01) se redondean a un centavo. La entrada de contenido multimedia se cobra por imagen o por segundo (vídeo). Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens utilizados.
| Modelo | Función | Tipo | Precio ( =< 128.000 tokens de entrada) |
Precio ( > 128.000 tokens de entrada) |
||
|---|---|---|---|---|---|---|
| Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,00002 USD por imagen 0,00002 USD por segundo 0,00001875 USD por cada 1000 caracteres 0,000002 USD por segundo |
0,00004 USD por imagen 0,00004 USD por segundo 0,0000375 USD por cada 1000 caracteres 0,000004 USD por segundo |
||
| Salida de texto | 0,000075 USD por cada 1000 caracteres | 0,00015 USD por 1000 caracteres | ||||
| Tuneo* | Token de entrenamiento | 8 USD por millón de tokens | ||||
| Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,00032875 USD por imagen 0,00032875 USD por segundo 0,0003125 USD por cada 1000 caracteres 0,00003125 USD por segundo |
0,0006575 USD por imagen 0,0006575 USD por segundo 0,000625 USD por cada 1000 caracteres 0,0000625 USD por segundo |
||
| Salida de texto | 0,00125 USD por 1000 caracteres | 0,0025 USD por 1000 caracteres | ||||
| Tuneo* | Token de entrenamiento | 80 USD por millón de tokens | ||||
| Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto |
0,0025 USD por imagen 0,002 USD por segundo 0,000125 USD por cada 1000 caracteres |
|||
| Salida de texto | 0,000375 USD por 1000 caracteres | |||||
| Fundamentación con la Búsqueda de Google | Texto | 35 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud enviada a Gemini que hace una o más consultas a la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||||
| Fundamentación web para empresas | Texto | 45 USD por cada 1000 peticiones fundamentadas. Una petición fundamentada es una solicitud que se envía a Gemini y que hace una o varias consultas a Fundamentación web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobra una vez por cada petición fundamentada. Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de peticiones fundamentadas al día. |
||||
| Fundamentación con tus datos | Texto | 2,50 USD por cada 1000 solicitudes a partir del 16 de junio del 2025. |
||||
* Los precios están en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Si el contexto de una consulta supera los 128.000 tokens, todos los tokens se cobran según las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32.000 tokens.
* Los PDFs se facturan como entradas de imagen, y una página de PDF equivale a una imagen.
* El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* El uso de Grounding con la Búsqueda de Google y Web Grounding para empresas solo se factura cuando una petición devuelve resultados web (es decir, resultados que contienen al menos una URL de referencia de la Web). Se aplican tarifas de uso de modelos de Gemini por separado.
Imagen
Con Imagen en Vertex AI, puedes generar imágenes originales y editarlas a partir de peticiones de texto que proporciones, o editar solo partes de las imágenes usando un área de máscara que definas, además de otras muchas funciones.
| Modelo | Función | Descripción | Entrada | Salida | Precio |
|---|---|---|---|---|---|
| Imagen 4 Ultra | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,06 USD por imagen |
| Imagen 4 | Upscaling | Aumenta la resolución de una imagen generada a 2K, 3K y 4K | Imagen | Imagen | 0,06 USD por imagen |
| Imagen 4 | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,04 USD por imagen |
| Imagen 4 Fast | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,02 USD por imagen |
| Imagen 3 | Generación de imágenes | Generar una imagen Editar una imagen Personalizar una imagen |
Petición de texto | Imagen | 0,04 USD por imagen |
| Imagen 3 Fast | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,02 USD por imagen |
| Imagen 2, Imagen 1 | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,020 USD por imagen |
| Imagen 2, Imagen 1 | Edición de imágenes | Edita una imagen usando un enfoque con o sin máscara | Petición de imagen o texto | Imagen | 0,020 USD por imagen |
| Imagen 1 | Upscaling | Aumentar la resolución de una imagen generada a 2K y 4K | Imagen | Imagen | 0,003 USD por imagen |
| Imagen 1 | Afinamiento | Habilitar un "sujeto" proporcionado por el usuario para usarlo en peticiones de Imagen (entrenamiento con pocos ejemplos) | Temas con identificador de texto y entre 4 y 8 imágenes por tema | Modelo perfeccionado (tras el entrenamiento con temas proporcionados por el usuario) | USD por hora de nodo (precios de entrenamiento personalizado de Vertex AI) |
| Imagen | Descripción Visual | Genera un título corto o largo para una imagen | Imagen | Título de texto | 0,0015 USD por imagen |
| Imagen | Preguntas y respuestas visuales | Proporciona una respuesta basada en una pregunta que hace referencia a una imagen | Petición de imagen o texto | Respuesta de texto | 0,0015 USD por imagen |
| Imagen | Recontextualización del producto | Reimagina los productos en una nueva escena | 1-3 imágenes del mismo producto y una petición de texto que describa la escena deseada | Imagen | 0,12 USD por imagen |
| Vertex Virtual Try-On | Crea imágenes de personas con diferentes prendas de vestir | 1 imagen de una persona y 1 imagen de una prenda de vestir | Imagen | 0,06 USD por imagen |
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Veo
Veo crea vídeos de una calidad increíble en una amplia variedad de temas y estilos, y ofrece una mejor comprensión de la física del mundo real y de los matices del movimiento y la expresión humanos.
| Modelo | Función | Descripción | Entrada | Salida | Resolución de salida | Precio |
|---|---|---|---|---|---|---|
| Veo 3.1 | Generación de vídeo y audio | Genera vídeos de alta calidad con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia | Petición de texto o imagen | Vídeo y audio | 720p, 1080p | 0,40 USD por segundo |
| Veo 3.1 | Generación de vídeos | Genera vídeos de alta calidad a partir de una petición de texto o una imagen de referencia | Petición de texto o imagen | Vídeo | 720p, 1080p | 0,20 USD por segundo |
| Veo 3.1 Fast | Generación de vídeo y audio | Genera vídeos con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia más rápido | Petición de texto o imagen | Vídeo y audio | 720p, 1080p | 0,15 USD por segundo |
| Veo 3.1 Fast | Generación de vídeos | Genera vídeos a partir de una petición de texto o una imagen de referencia más rápido | Petición de texto o imagen | Vídeo | 720p, 1080p | 0,10 USD por segundo |
| Veo 3 | Generación de vídeo y audio | Genera vídeos de alta calidad con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia | Petición de texto o imagen | Vídeo y audio | 720p, 1080p | 0,40 USD por segundo |
| Veo 3 | Generación de vídeos | Genera vídeos de alta calidad a partir de una petición de texto o una imagen de referencia | Petición de texto o imagen | Vídeo | 720p, 1080p | 0,20 USD por segundo |
| Veo 3 Fast | Generación de vídeo y audio | Genera vídeos con efectos de sonido o voz sincronizados a partir de una petición de texto o una imagen de referencia más rápido | Petición de texto o imagen | Vídeo y audio | 720p, 1080p | 0,15 USD por segundo |
| Veo 3 Fast | Generación de vídeos | Genera vídeos a partir de una petición de texto o una imagen de referencia más rápido | Petición de texto o imagen | Vídeo | 720p, 1080p | 0,10 USD por segundo |
| Veo 2 | Generación de vídeos | Genera vídeos a partir de una petición de texto o una imagen de referencia | Petición de texto o imagen | Vídeo | 720p | 0,50 USD por segundo |
| Veo 2 | Controles avanzados | Genera vídeos interpolando fotogramas iniciales y finales, amplía los vídeos generados y aplica controles de cámara | Petición de texto, imagen o vídeo | Vídeo | 720p | 0,50 USD por segundo |
Lyria
Lyria 2 ofrece una generación de música instrumental de alta calidad, ideal para composiciones sofisticadas y exploraciones creativas detalladas en las que es fundamental obtener resultados matizados.
| Modelo | Función | Descripción | Entrada | Salida | Precio |
|---|---|---|---|---|---|
| Lyria 2 | Generación de música | Genera música a partir de una petición de texto | Petición de texto | Música | 0,06 USD por 30 segundos |
Conoce los costes de las incrustaciones en tus aplicaciones de IA
| Modelo | Tipo | Region | Precio por 1000 tokens de entrada |
|---|---|---|---|
| Gemini Embedding | Entrada | Global |
|
| Salida | Global |
|
| Modelo | Tipo | Region | Precio por 1000 caracteres |
|---|---|---|---|
| Embeddings para texto (sin incluir Gemini Embedding) |
Entrada | Global |
|
| Salida | Global |
|
| Modelo | Función | Descripción | Entrada | Salida | Precio |
|---|---|---|---|---|---|
| multimodalembedding | Embeddings for Multimodal: Text | Genera inserciones usando texto como entrada | Texto | Incrustaciones | 0,0002 USD por cada 1000 caracteres de entrada |
| Incrustaciones para multimodal: imagen | Genera inserciones usando una imagen como entrada | Imagen | Incrustaciones | 0,0001 USD por imagen introducida | |
| Embeddings for Multimodal: Video Plus | Video Plus | Vídeo | Incrustaciones (hasta 15 incrustaciones por minuto de vídeo) | 0,0020 USD por segundo de vídeo | |
| Embeddings for Multimodal: Video Standard | Video Standard | Vídeo | Incrustaciones (hasta 8 incrustaciones por minuto de vídeo) | 0,0010 USD por segundo de vídeo | |
| Embeddings for Multimodal: Video Essential | Video Essential | Vídeo | Embeddings (hasta 4 embeddings por minuto de vídeo) | 0,0005 USD por segundo de vídeo |
| Modelo de código abierto | Tipo | Precio por 1000 tokens de entrada |
|---|---|---|
| multilingual-e5-small | Entrada: Salida: Entrada por lotes: Salida por lotes: |
Solicitudes online: 0,000015 USD Solicitudes online: sin coste económico Solicitudes por lotes: 0,0000075 USD Solicitudes por lotes: sin coste económico |
| multilingual-e5-large | Entrada: Salida: Entrada por lotes: Salida por lotes: |
Solicitudes online: 0,000025 USD Solicitudes online: sin coste Solicitudes por lotes: 0,0000125 USD Solicitudes por lotes: sin coste |
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Precios de la función de finalización de código de Vertex AI
IA generativa en Vertex AI cobra por cada 1000 caracteres de entrada (petición) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco no se incluyen en el recuento. Durante la fase de vista previa, los cargos tienen un descuento del 100 %. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo de dólar ($0,01) se redondean a un centavo.
| Modelo | Tipo | Region | Precio por 1000 caracteres |
|---|---|---|---|
| Codey para la finalización de código | Entrada | Global |
|
| Salida | Global |
|
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Translation (Text)
Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones de los LLMs suelen ser más fluidas y naturales que las de los modelos de traducción clásicos, pero tienen una compatibilidad de idiomas más limitada (más información).
| Modelo | Método | Uso | Precio por millón de caracteres |
|---|---|---|---|
| LLM | Text translation* | Número de caracteres de entrada al mes |
10 USD por millón de caracteres* |
| Número de caracteres de salida al mes |
10 USD por millón de caracteres* |
Los precios de esta página están en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
*El precio se calcula por cada carácter procesado por el modelo. Para obtener más información sobre el recuento de caracteres, consulta Facturación de caracteres.
Precio del almacenamiento de caché de contexto para el almacenamiento en caché explícito
| Modelo | Función | Tipo | Precio (por 1 M de tokens) <= 200.000 tokens de entrada |
Precio (por 1 M de tokens) > 200.000 tokens de entrada |
|---|---|---|---|---|
| Gemini 3 Pro | Almacenamiento en caché de contexto | Entrada (texto, imagen, vídeo o audio) | 4,5 USD (por millón de tokens/hora) | 4,5 USD (por millón de tokens/hora) |
| Gemini 2.5 Pro | Almacenamiento en caché de contexto | Entrada (texto, imagen, vídeo o audio) | 4,5 USD (por millón de tokens/hora) | 4,5 USD (por millón de tokens/hora) |
| Gemini 2.5 Flash | Almacenamiento en caché de contexto | Entrada (texto, imagen, vídeo o audio) | 1 USD (por millón de tokens al mes) | 1 USD (por millón de tokens al mes) |
| Gemini 2.5 Flash Lite | Almacenamiento en caché de contexto | Entrada (texto, imagen, vídeo o audio) | 1 USD (por millón de tokens al mes) | 1 USD (por millón de tokens al mes) |
Modelos de Gemini 2.0
Precios basados en tokens
Modelo |
Tipo |
Almacenamiento (M tok-hora) |
Precio |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 1 millón de tokens de entrada | 1 USD | 0,0375 USD | |
| 1 millón de tokens de audio de entrada | 1 USD | 0,25 USD | |
| 1 millón de tokens de texto de salida | N/A | N/A | |
Gemini 2.0 Flash Lite |
|||
| 1 millón de tokens de entrada | 1 USD | 0,01875 USD | |
| 1 millón de tokens de audio de entrada | 1 USD | 0,01875 USD | |
| 1 millón de tokens de texto de salida | N/A | N/A |
Precios basados en la modalidad
Los precios de las modalidades que se indican a continuación se basan en casos prácticos de uso medio y son solo de referencia. La facturación real solo se basará en los tokens:
- 4 caracteres equivalen aproximadamente a 1 token de texto, incluidos los espacios en blanco.
- Para una imagen de 1024x1024, consume 1290 tokens. El recuento de tokens por imagen varía en función de la resolución de la imagen. Para obtener más información sobre cómo calcular los tokens, consulta nuestra documentación.
- La entrada de vídeo consume 258 tokens por segundo a una tasa de muestreo de un fotograma por segundo. Los vídeos con audio se facturan tanto por los tokens de vídeo como por los de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo |
Tipo |
Almacenamiento (modalidad-hora) |
Precio |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| Texto de entrada (USD/M de caracteres) | 0,25 USD | 0,009375 USD | |
| Imagen de entrada (USD por imagen) | 0,00129 USD | 0,000048375 USD | |
| Vídeo de entrada ($/s) | 0,000258 USD | 0,000009675 USD | |
| Entrada de audio (USD/s) | 0,000025 USD | 0,00000625 USD | |
| Texto de salida (USD/M de caracteres) | N/A | N/A | |
Gemini 2.0 Flash Lite |
|||
| Texto de entrada (USD/M de caracteres) | 0,25 USD | 0,0046875 USD | |
| Imagen de entrada (USD por imagen) | 0,00129 USD | 0,0000241875 USD | |
| Vídeo de entrada ($/s) | 0,000258 USD | 0,000009675 USD | |
| Entrada de audio (USD/s) | 0,000258 USD | 0,0000048375 USD | |
| Texto de salida (USD/M de caracteres) | N/A | N/A | |
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash incluye hasta 1500 peticiones fundamentadas al día sin coste adicional. Las solicitudes fundamentadas que superen las 1500 al día se facturarán a 35 USD por cada 1000 solicitudes (hasta 1 millón de solicitudes al día). Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de solicitudes al día. |
||
Fundamentación web para empresas |
45 USD por cada 1000 solicitudes (hasta 1 millón de solicitudes al día) a partir del 5 de mayo del 2025. Ponte en contacto con el equipo de tu cuenta si necesitas más de un millón de solicitudes al día. |
||
* Los precios están en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Los PDFs se facturan como entradas de imagen, y una página de PDF equivale a una imagen.
* El endpoint del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La fundamentación con la Búsqueda de Google solo se factura en las solicitudes que devuelven resultados que contienen al menos una URL de fundamentación de la Web. También se aplican las tarifas de uso del modelo de Gemini estándar.
Capacidad de procesamiento reservada
El rendimiento aprovisionado asegura el rendimiento para tus necesidades de IA generativa y se transacciona mediante unidades de escalado de IA generativa, o GSUs. Consulta más información sobre la cantidad de rendimiento que proporciona cada GSU aquí y usa nuestra herramienta de estimación online aquí.
| Duración | Precio por GSU | Por |
|---|---|---|
| Compromiso de 1 semana | 1200 $ | Semana |
| Compromiso de 1 mes | 2700 USD | Mes |
| Compromiso de 3 meses | 2400 USD | Mes |
| Compromiso de 1 año | 2000 USD | Mes |
Ejemplo de cálculo de costes
Un usuario necesita asegurarse de que puede admitir 10 consultas por segundo (CPS) de una consulta con una entrada de 1000 tokens de texto y 500 tokens de audio,y recibir una salida de 300 tokens de texto usando gemini-2.0-flash.
En la tabla de rendimiento y tasa de consumo, vemos que, en el caso de Gemini 2.0 Flash, la tasa de consumo de un token de texto de entrada es de 1 token, la de un token de audio de entrada es de 7 tokens y la de un token de texto de salida es de 4 tokens.
El total de tokens de entrada del usuario es 1000* (1 token por token de texto de entrada) + 500* (7 tokens por token de audio de entrada) = 4500 tokens de entrada ajustados para el consumo. El total de tokens de salida del usuario es 300 * 4 (4 tokens por token de texto de salida) = 1200 tokens de salida ajustados por reducción. Si los sumamos, obtenemos 4500 tokens de entrada ajustados por el consumo + 1200 tokens de salida ajustados por el consumo = 5700 tokens en total por consulta.
Si multiplicamos el número total de tokens por consulta por las CPS, obtenemos 5700 tokens totales por consulta × 10 CPS = 57.000 tokens totales por segundo.
Si dividimos esta cifra por el rendimiento total por segundo por GSU,obtenemos 57.000 tokens totales por segundo ÷ 3360 de rendimiento por segundo por GSU = 16,96 GSUs. El incremento mínimo de GSUs que se pueden comprar para este modelo es 1, por lo que el usuario necesitaría 17 GSUs.
Si el usuario quisiera mantener ese rendimiento durante una semana, le costaría 1200 USD x 17 GSUs = 20.400 USD a la semana. Si quisiera mantener ese rendimiento durante un mes, tendría que pagar 2700 USD x 17 GSUs = 45.900 USD al mes. Si quisiera mantener este rendimiento durante 3 meses, le costaría 2400 USD x 17 GSUs = 40.800 USD al mes. Por último, si quisieran mantener este rendimiento durante un año, el coste sería de 2000 USD x 17 GSUs = 34.000 USD al mes.
Ajuste de modelos
El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y la eficiencia del modelo. El ajuste de modelos ofrece las siguientes ventajas:
- Mayor calidad para tus tareas específicas
- Mayor solidez de los modelos
- Menor latencia y coste de inferencia gracias a las peticiones más cortas
El ajuste se cobra por millón de tokens de entrenamiento. Los tokens de entrenamiento se calculan multiplicando el número total de tokens de tu conjunto de datos de entrenamiento por el número de épocas. En cuanto a la inferencia de modelos, el endpoint del modelo ajustado de Gemini tiene el mismo precio de predicción que el modelo base.
| Modelo | Tipo | Precio (por 1 M de tokens de entrenamiento) |
|---|---|---|
| Gemini 2.5 Pro | Afinamiento supervisado | 25 USD |
| Gemini 2.5 Flash | Afinamiento supervisado Afinamiento de preferencias |
5 USD |
| Gemini 2.5 Flash Lite | Afinamiento supervisado Afinamiento de preferencias |
1,5 USD |
| Gemma 3 27B IT | Afinamiento supervisado | 6,83 € |
| Llama 3.1 8B | Afinamiento supervisado | 0,67 $ |
| Llama 3.2 1B | Afinamiento supervisado | 0,28 $ |
| Llama 3.2 3B | Afinamiento supervisado | 0,61 $ |
| Llama 3.3 70B | Afinamiento supervisado | 6,72 $ |
| Llama 4 Scout 17B 16E | Afinamiento supervisado | 5,77 USD |
| Qwen 3 32B | Afinamiento supervisado | 6,57 USD |
* Los tokens de entrenamiento se calculan multiplicando el número total de tokens del conjunto de datos de entrenamiento por el número de épocas.
* El precio de las predicciones de un endpoint de un modelo ajustado de Gemini es el mismo que el del modelo base.
Compara los precios de los modelos de partners en Vertex AI
Los modelos de partners son una lista seleccionada de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta la descripción general de los modelos de partners. En las siguientes secciones se indican los detalles de los precios de los modelos de partners de Google.
Modelos de AI21 Labs
| Modelo | Precios |
|---|---|
| Jamba 1.5 Large (obsoleto) | Entrada: 2 USD por millón de tokens Salida: 8 USD por millón de tokens |
| Jamba 1.5 Mini (obsoleto) | Entrada: 0,20 USD por millón de tokens Salida: 0,40 USD por millón de tokens |
Modelos Claude de Anthropic
Modelos con precios regionales
Global
| Modelo | Precio (por 1 M de tokens) < 200.000 tokens de entrada | Precio (por 1 M de tokens) >= 200.000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: 5,00 USD Salida: 25,00 USD Entrada por lotes: 2,50 USD Salida por lotes: 12,50 USD Escritura en caché de 5 min: 6,25 USD Escritura en caché de 1 h: 10,00 USD Acierto de caché: 0,50 USD Escritura en caché por lotes de 5 min: 3,125 USD Escritura en caché por lotes de 1 h: 5,00 USD Acierto de caché por lotes: 0,25 USD |
|
| Claude Sonnet 4.5 | Entrada: 3,00 USD Salida: 15,00 USD Entrada por lotes: 1,50 USD Salida por lotes: 7,50 USD Escritura en caché de 5 M: 3,75 USD Escritura en caché de 1 h: 6,00 USD Acierto de caché: 0,30 USD Escritura en caché por lotes: 1,88 USD Acierto de caché por lotes: 0,15 USD |
Entrada: 6,00 USD Salida: 22,50 USD Entrada por lotes: 3,00 USD Salida por lotes: 11,25 USD Escritura en caché de 5 min: 7,50 USD Escritura en caché de 1 h: 12,00 USD Acierto de caché: 0,60 USD Escritura en caché por lotes: 3,75 USD Acierto de caché por lotes: 0,30 USD |
| Claude Haiku 4.5 | Entrada: 1,00 USD Salida: 5,00 USD Entrada por lotes: 0,50 USD Salida por lotes: 2,50 USD Escritura en caché de 5 M: 1,25 USD Escritura en caché de 1 h: 2,00 USD Acierto de caché: 0,10 USD Escritura en caché por lotes: 0,625 USD Acierto de caché por lotes: 0,05 USD |
us-east5
| Modelo | Precio (por 1 M de tokens) < 200.000 tokens de entrada | Precio (por 1 M de tokens) >= 200.000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: 5,50 USD Salida: 27,50 USD Entrada por lotes: 2,75 USD Salida por lotes: 13,75 USD Escritura en caché de 5 min: 6,875 USD Escritura en caché de 1 h: 11,00 USD Acierto de caché: 0,55 USD Escritura en caché por lotes de 5 min: 3,438 USD Escritura en caché por lotes de 1 h: 5,50 USD Acierto de caché por lotes: 0,275 USD |
|
| Claude Sonnet 4.5 | Entrada: 3,30 USD Salida: 16,50 USD Entrada por lotes: 1,65 USD Salida por lotes: 8,25 USD Escritura en caché de 5 min: 4,13 USD Escritura en caché de 1 h: 6,60 USD Acierto de caché: 0,33 USD Escritura en caché por lotes: 2,06 USD Acierto de caché por lotes: 0,17 USD |
Entrada: 6,60 USD Salida: 24,75 USD Entrada por lotes: 3,30 USD Salida por lotes: 12,38 USD Escritura en caché de 5 M: 8,25 USD Escritura en caché de 1 h: 13,20 USD Acierto de caché: 0,66 USD Escritura en caché por lotes: 4,13 USD Acierto de caché por lotes: 0,33 USD |
| Claude Haiku 4.5 | Entrada: 1,10 USD Salida: 5,50 USD Entrada por lotes: 0,55 USD Salida por lotes: 2,75 USD Escritura en caché de 5 min: 1,375 USD Escritura en caché de 1 h: 2,20 USD Escritura en caché: 1,375 USD Acierto de caché: 0,11 USD Escritura en caché por lotes: 0,688 USD Acierto de caché por lotes: 0,055 USD |
europe‑west1
| Modelo | Precio (por 1 M de tokens) < 200.000 tokens de entrada | Precio (por 1 M de tokens) >= 200.000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: 5,50 USD Salida: 27,50 USD Entrada por lotes: 2,75 USD Salida por lotes: 13,75 USD Escritura en caché de 5 min: 6,875 USD Escritura en caché de 1 h: 11,00 USD Acierto de caché: 0,55 USD Escritura en caché por lotes de 5 min: 3,438 USD Escritura en caché por lotes de 1 h: 5,50 USD Acierto de caché por lotes: 0,275 USD |
|
| Claude Sonnet 4.5 | Entrada: 3,30 USD Salida: 16,50 USD Entrada por lotes: 1,65 USD Salida por lotes: 8,25 USD Escritura en caché de 5 min: 4,13 USD Escritura en caché de 1 h: 6,60 USD Acierto de caché: 0,33 USD Escritura en caché por lotes: 2,06 USD Acierto de caché por lotes: 0,17 USD |
Entrada: 6,60 USD Salida: 24,75 USD Entrada por lotes: 3,30 USD Salida por lotes: 12,38 USD Escritura en caché de 5 M: 8,25 USD Escritura en caché de 1 h: 13,20 USD Acierto de caché: 0,66 USD Escritura en caché por lotes: 4,13 USD Acierto de caché por lotes: 0,33 USD |
| Claude Haiku 4.5 | Entrada: 1,10 USD Salida: 5,50 USD Entrada por lotes: 0,55 USD Salida por lotes: 2,75 USD Escritura en caché de 5 M: 1,375 USD Escritura en caché de 1 h: 2,20 USD Acierto de caché: 0,11 USD Escritura en caché por lotes: 0,688 USD Acierto de caché por lotes: 0,055 USD |
asia‑southeast1
| Modelo | Precio (por 1 M de tokens) < 200.000 tokens de entrada | Precio (por 1 M de tokens) >= 200.000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: 5,50 USD Salida: 27,50 USD Entrada por lotes: 2,75 USD Salida por lotes: 13,75 USD Escritura en caché de 5 min: 6,875 USD Escritura en caché de 1 h: 11,00 USD Acierto de caché: 0,55 USD Escritura en caché por lotes de 5 min: 3,438 USD Escritura en caché por lotes de 1 h: 5,50 USD Acierto de caché por lotes: 0,275 USD |
|
| Claude Sonnet 4.5 | Entrada: 3,30 USD Salida: 16,50 USD Entrada por lotes: 1,65 USD Salida por lotes: 8,25 USD Escritura en caché de 5 min: 4,13 USD Escritura en caché de 1 h: 6,60 USD Acierto de caché: 0,33 USD Escritura en caché por lotes: 2,06 USD Acierto de caché por lotes: 0,17 USD |
Entrada: 6,60 USD Salida: 24,75 USD Entrada por lotes: 3,30 USD Salida por lotes: 12,38 USD Escritura en caché de 5 M: 8,25 USD Escritura en caché de 1 h: 13,20 USD Acierto de caché: 0,66 USD Escritura en caché por lotes: 4,13 USD Acierto de caché por lotes: 0,33 USD |
asia‑east1
| Modelo | Precio (por 1 M de tokens) < 200.000 tokens de entrada | Precio (por 1 M de tokens) >= 200.000 tokens de entrada |
|---|---|---|
| Claude Haiku 4.5 | Entrada: 1,10 USD Salida: 5,50 USD Entrada por lotes: 0,55 USD Salida por lotes: 2,75 USD Escritura en caché de 5 min: 1,375 USD Escritura en caché de 1 h: 2,20 USD Escritura en caché: 1,375 USD Acierto de caché: 0,11 USD Escritura en caché por lotes: 0,688 USD Acierto de caché por lotes: 0,055 USD |
* Si el contexto de entrada de una consulta tiene una longitud igual o superior a 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
Modelos con precios uniformes en todas las regiones
| Modelo | Precio (por 1 M de tokens) < 200.000 tokens de entrada | Precio (por 1 M de tokens) >= 200.000 tokens de entrada |
|---|---|---|
| Claude Opus 4.1 | Entrada: 15 USD Salida: 75 USD Entrada por lote: 7,50 USD Salida por lote: 37,50 USD Escritura en caché de 5 M: 18,75 USD Escritura en caché de 1 h: 30 USD Acierto de caché: 1,50 USD Escritura en caché por lote: 9,375 USD Acierto de caché por lote: 0,75 USD |
N/A |
| Claude Opus 4 | Entrada: 15 USD Salida: 75 USD Entrada por lotes: 7,50 USD Salida por lotes: 37,50 USD Escritura en caché de 5 M: 18,75 USD Escritura en caché de 1 h: 30 USD Acierto de caché: 1,50 USD Escritura en caché por lotes: 9,375 USD Acierto de caché por lotes: 0,75 USD |
N/A |
| Claude Sonnet 4 | Entrada: 3 USD Salida: 15 USD Entrada por lote: 1,50 USD Salida por lote: 7,50 USD Escritura en caché de 5 M: 3,75 USD Escritura en caché de 1 h: 6,00 USD Acierto de caché: 0,30 USD Escritura en caché por lote: 1,875 USD Acierto de caché por lote: 0,15 USD |
Entrada: 6 USD Salida: 22,50 USD Entrada por lotes: 3 USD Salida por lotes: 11,25 USD Escritura en caché de 5 min: 7,50 USD Escritura en caché de 1 h: 12,00 USD Acierto de caché: 0,60 USD Escritura en caché por lotes: 3,75 USD Acierto de caché por lotes: 0,30 USD |
| Claude 3.5 Haiku | Entrada: 0,80 USD Salida: 4 USD Entrada por lotes: 0,40 USD Salida por lotes: 2 USD Escritura en caché de 5 minutos: 1 USD Escritura en caché de 1 hora: 1,60 USD Acierto de caché: 0,08 USD Escritura en caché por lotes: 0,50 USD Acierto de caché por lotes: 0,04 USD |
N/A |
| Claude 3 Haiku | Entrada: 0,25 USD Salida: 1,25 USD Escritura en caché de 5 min: 0,30 USD Escritura en caché de 1 h: 0,50 USD Acierto de caché: 0,03 USD | N/A |
| Claude 3.7 Sonnet (obsoleto) | Entrada: 3 USD Salida: 15 USD Entrada por lote: 1,50 USD Salida por lote: 7,50 USD Escritura en caché: 3,75 USD Acierto de caché: 0,30 USD Escritura en caché por lote: 1,875 USD Acierto de caché por lote: 0,15 USD |
N/A |
| Claude 3.5 Sonnet v2 (obsoleto) | Entrada: 3 USD Salida: 15 USD Entrada por lote: 1,50 USD Salida por lote: 7,50 USD Escritura en caché: 3,75 USD Acierto de caché: 0,30 USD Escritura en caché por lote: 1,875 USD Acierto de caché por lote: 0,15 USD |
N/A |
| Claude 3.5 Sonnet (obsoleto) | Entrada: 3 $ Salida: 15 $ Escritura en caché: 3,75 $ Acierto de caché: 0,30 $ |
N/A |
| Claude 3 Opus (obsoleto) | Entrada: 15 $ Salida: 75 $ Escritura en caché: 18,75 $ Acierto de caché: 1,50 $ |
N/A |
* Si el contexto de entrada de una consulta tiene una longitud igual o superior a 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
Precios de las herramientas
| Herramienta | Precio |
|---|---|
| Solicitud de búsqueda web | 10 USD por cada 1000 búsquedas
Modelos admitidos: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1 y Claude Opus 4. |
* Si el contexto de entrada de una consulta tiene una longitud igual o superior a 200.000 tokens, todos los tokens (tanto de entrada como de salida) se cobran según las tarifas de contexto largo.
Modelos de Deepseek
| Modelo | Precios |
|---|---|
| DeepSeek-V3.1 | Entrada: 0,60 USD por millón de tokens Salida: 1,70 USD por millón de tokens Entrada por lotes: 0,30 USD por millón de tokens Salida por lotes: 0,85 USD por millón de tokens |
| DeepSeek-V3.2 * | Entrada: 0,56 USD por millón de tokens Salida: 1,68 USD por millón de tokens Entrada por lotes: 0,28 USD por millón de tokens Salida por lotes: 0,84 USD por millón de tokens |
| DeepSeek-R1 (0528) | Entrada: 1,35 USD por millón de tokens Salida: 5,40 USD por millón de tokens Entrada por lotes: 0,675 USD por millón de tokens Salida por lotes: 2,70 USD por millón de tokens |
| DeepSeek-OCR | Entrada: 0,30 USD por millón de tokens (o 0,0003 USD por página) Salida: 1,20 USD por millón de tokens (o 0,00012 USD por página) |
- Disponible sin coste económico hasta el 17 de diciembre del 2025.
Modelos de MiniMax
| Modelo | Precios |
|---|---|
| MiniMax-M2 | Entrada: 0,30 USD por millón de tokens Salida: 1,20 USD por millón de tokens |
Modelos de Moonshot
| Modelo | Precios |
|---|---|
| Kimi-K2-Thinking | Entrada: 0,60 USD por millón de tokens Salida: 2,50 USD por millón de tokens |
Modelos de Qwen
| Modelo | Precios |
|---|---|
| Qwen3-Next-80B-Thinking | Entrada: 0,15 USD por millón de tokens Salida: 1,20 USD por millón de tokens |
| Qwen3-Next-80B-Instruct | Entrada: 0,15 USD por millón de tokens Salida: 1,20 USD por millón de tokens |
| Qwen3-Coder-480B-A35B-Instruct | Entrada: 0,22 USD por millón de tokens Salida: 1,80 USD por millón de tokens Entrada por lotes: 0,11 USD por millón de tokens Salida por lotes: 0,90 USD por millón de tokens |
| Qwen3-235B-A22B-Instruct-2507 | Entrada: 0,22 USD por millón de tokens Salida: 0,88 USD por millón de tokens Entrada por lotes: 0,11 USD por millón de tokens Salida por lotes: 0,44 USD por millón de tokens |
Modelos de OpenAI
| Modelo | Precios |
|---|---|
| gpt-oss-120b | Entrada: 0,09 USD por millón de tokens Salida: 0,36 USD por millón de tokens Entrada por lotes: 0,045 USD por millón de tokens Salida por lotes: 0,18 USD por millón de tokens |
| gpt-oss-20b | Entrada: 0,07 USD por millón de tokens Salida: 0,25 USD por millón de tokens Entrada por lotes: 0,035 USD por millón de tokens Salida por lotes: 0,125 USD por millón de tokens |
Modelos Llama de Meta
| Modelo | Precios |
|---|---|
| Llama 3.1 405B | Entrada: 5,00 USD por millón de tokens Salida: 16,00 USD por millón de tokens |
| Llama 3.3 70B | Entrada: 0,72 USD por millón de tokens Salida: 0,72 USD por millón de tokens Entrada por lotes: 0,36 USD por millón de tokens Salida por lotes: 0,36 USD por millón de tokens |
| Llama 4 Scout | Entrada: 0,25 USD por millón de tokens Salida: 0,70 USD por millón de tokens Entrada por lotes: 0,125 USD por millón de tokens Salida por lotes: 0,35 USD por millón de tokens |
| Llama 4 Maverick | Entrada: 0,35 USD por millón de tokens Salida: 1,15 USD por millón de tokens Entrada por lotes: 0,175 USD por millón de tokens Salida por lotes: 0,575 USD por millón de tokens |
Modelos de Mistral AI
| Modelo | Precios |
|---|---|
| Mistral OCR (25.05) | Entrada: 0,0005 USD por millón de tokens (o 0,0005 USD por página) Salida: 0,0005 USD por millón de tokens (o 0,0005 USD por página) |
| Mistral Medium 3 | Entrada: 0,40 USD por millón de tokens Salida: 2,00 USD por millón de tokens |
| Mistral Small 3.1 (25.03) | Entrada: 0,10 USD por millón de tokens Salida: 0,30 USD por millón de tokens |
| Mistral Large (24.11) (obsoleto) | Entrada: 2,00 USD por millón de tokens Salida: 6,00 USD por millón de tokens |
| Codestral 2 | Entrada: 0,30 USD por millón de tokens Salida: 0,90 USD por millón de tokens |
| Codestral (25.01) (obsoleto) | Entrada: 0,30 USD por millón de tokens Salida: 0,90 USD por millón de tokens |