Costo de crear y, luego, implementar modelos de IA en Vertex AI
Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en SKU de Google Cloud.
Solo se te cobra por las solicitudes que devuelven un código de respuesta 200. Las solicitudes que devuelven otros códigos de respuesta, como los códigos 4xx y 5xx, no se cobran por la entrada o salida.
En esta página, se abordan los precios de la IA generativa en Vertex AI. Para obtener información sobre todos los demás precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.
Modelos de Google
Gemini 3
| Modelo | Tipo | Precio (por 1 millón de tokens) <= 200,000 tokens de entrada | Precio (por millón de tokens) > 200,000 tokens de entrada | Precio (por millón de tokens) <= 200,000 tokens de entrada almacenados en caché | Precio (por millón de tokens) > 200,000 tokens de entrada almacenados en caché | Precio (por 1 M de tokens) <= 200,000 tokens de entrada con la API por lotes | Precio (por 1 M de tokens) > 200,000 tokens de entrada con la API por lotes |
|---|---|---|---|---|---|---|---|
| Versión preliminar de Gemini 3 Pro | |||||||
| Entrada (texto, imagen, video, audio) | $2 | $4 | $0.2 | $0.4 | $1 | $2 | |
| Salida de texto (respuesta y razonamiento) | $12 | $18 | N/A | N/A | $6 | $9 | |
| Resultado de imagen** | $120 | N/A | N/A | N/A | $60 | N/A | |
| Fundamentación con la Búsqueda de Google y fundamentación web para empresas |
Gemini 3 Pro incluye 5,000 consultas de búsqueda por mes sin cargo adicional. Las consultas de búsqueda que superen esos límites se facturarán a $14 por cada 1,000 consultas de búsqueda. Una solicitud enviada por un cliente a Gemini puede generar una o más consultas a la Búsqueda de Google (o Web Grounding for Enterprise). Se te cobrará por cada búsqueda individual que realices. La facturación comenzará el 5 de enero de 2026. Los tokens de entrada proporcionados por Grounding con la Búsqueda de Google o Web Grounding para empresas no se cobran. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||||
| Fundamentación con Google Maps |
Gemini 3 Pro incluye 5,000 búsquedas por mes sin cargo adicional. Las consultas de Maps que superen esos límites se facturarán a $14 por cada 1,000 consultas. Una solicitud enviada por un cliente a Gemini puede generar una o más consultas a Google Maps. Se te cobrará por cada consulta individual que realices. La facturación comenzará el 5 de enero de 2026 |
||||||
| Fundamentación con tus datos | $2.5 por 1,000 solicitudes. | ||||||
* Si el contexto de entrada de una consulta tiene más de 200,000 tokens, todos los tokens (de entrada y salida) se cobran con las tarifas de contexto largo.
** Una imagen de salida de 1,000 (1024 x 1024) y 2,000 (2048 x 2048) consume 1,120 tokens de salida de imagen, lo que equivale a $0.134 por imagen generada. Una imagen 4K (4096 x 4096) consume 2,000 tokens de salida de imagen, lo que equivale a $0.24 por imagen generada.
Gemini 2.5
| Modelo | Tipo | Precio (por 1 millón de tokens) <= 200,000 tokens de entrada | Precio (por millón de tokens) > 200,000 tokens de entrada | Precio (por millón de tokens) <= 200,000 tokens de entrada almacenados en caché | Precio (por millón de tokens) > 200,000 tokens de entrada almacenados en caché | Precio (por 1 M de tokens) <= 200,000 tokens de entrada con la API por lotes | Precio (por 1 M de tokens) > 200,000 tokens de entrada con la API por lotes |
|---|---|---|---|---|---|---|---|
| Gemini 2.5 Pro | |||||||
| Entrada (texto, imagen, video, audio) | $1.25 | $2.5 | $0.125 | $0.250 | $0.625 | $1.25 | |
| Salida de texto (respuesta y razonamiento) | $10 | $15 | N/A | N/A | $5 | $7.5 | |
| Gemini 2.5 Pro Uso en computadora (versión preliminar) |
|||||||
| Entrada (texto, imagen, video, audio) | $1.25 | $2.5 | N/A | N/A | N/A | N/A | |
| Salida de texto (respuesta y razonamiento) | $10.00 | $15 | N/A | N/A | N/A | N/A | |
Gemini 2.5 Flash |
|||||||
| Entrada (texto, imagen, video) | $0.30 | $0.30 | $0.030 | $0.030 | $0.15 | $0.15 | |
| Entrada de audio | $1 | $1 | $0.100 | $0.100 | $0.5 | $0.5 | |
| Salida de texto (respuesta y razonamiento) | $2.50 | $2.50 | N/A | N/A | $1.25 | $1.25 | |
| Resultado de imagen*** | $30 | $30 | N/A | N/A | $15 | $15 | |
API de Gemini 2.5 Flash Live |
|||||||
| 1 millón de tokens de texto de entrada | $0.5 | $0.5 | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de audio de entrada | $3 | $3 | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de entrada de video o imagen | $3 | $3 | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de texto de salida | $2 | $2 | N/A | N/A | N/A | N/A | |
| 1 millón de tokens de audio de salida | $12 | $12 | N/A | N/A | N/A | N/A | |
Gemini 2.5 Flash Lite |
|||||||
| Entrada (texto, imagen, video) | $0.1 | $0.1 | $0.010 | $0.010 | $0.05 | $0.05 | |
| Entrada de audio | $0.3 | $0.3 | $0.030 | $0.030 | $0.15 | $0.15 | |
| Salida de texto (respuesta y razonamiento) | $0.4 | $0.4 | N/A | N/A | $0.2 | $0.2 | |
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash, 2.5 Flash y 2.5 Flash-Lite incluyen un total de 1,500 instrucciones fundamentadas por día sin costo adicional. Gemini 2.5 Pro incluye 10,000 instrucciones fundamentadas por día sin cargo adicional. Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google**. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||||
Fundamentación web para empresas |
$45 por cada 1,000 instrucciones fundamentadas$. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding for enterprise**. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||||
| Fundamentación con tus datos | $2.5 por 1,000 solicitudes. | ||||||
| Fundamentación con Google Maps | $25 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza al menos 1 consulta a Google Maps. |
||||||
* Si el contexto de entrada de una consulta tiene más de 200,000 tokens, todos los tokens (de entrada y salida) se cobran con las tarifas de contexto largo.
** La fundamentación con la Búsqueda de Google y la fundamentación web para empresas solo se facturan cuando una instrucción devuelve resultados web correctamente (es decir, resultados que contienen al menos una URL de apoyo de fundamentación de la Web). Las tarifas de uso del modelo de Gemini se aplican por separado.
*** Una imagen de 1024 x 1024 consume 1290 tokens. El recuento de tokens por imagen varía según la resolución de la imagen. Para obtener más información sobre cómo calcular tokens, puedes consultar nuestra documentación.
**** La facturación de uso de la computadora usa el SKU de Gemini 2.5 Pro. Para dividir los costos de uso de la computadora, aplica etiquetas de facturación. Obtén más información aquí.
- Explicación de la facturación de la ventana de contexto de la sesión de LiveAPI: Se te cobra por turno por todos los tokens presentes en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye tokens nuevos (turno actual) y todos los tokens acumulados de turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto configurada. Un "turno" es una entrada del usuario y la respuesta del modelo.
- Modo de audio proactivo: Cuando está habilitado, se cobran tokens de entrada mientras LiveAPI está escuchando. Los tokens de salida solo se cobran cuando la API responde.
- Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran a la tarifa de salida de tokens de texto.
Gemini 2.0
Gemini 2.0 se factura en función de los tokens. Para calcular la cantidad de tokens de entrada en tu solicitud antes de enviarla, puedes usar el tokenizador del SDK o la API de countTokens. Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens usados.
Usa el botón de activación en la tabla de precios para comparar los precios basados en tokens y los precios basados en modalidades.
Precios basados en tokens
| Modelo | Tipo | Precio | Precio con la API de Batch | ||
|---|---|---|---|---|---|
Gemini 2.0 Flash |
|||||
| 1 millón de tokens de entrada | $0.15 | $0.075 | |||
| 1 millón de tokens de audio de entrada | $1.00 | $0.50 | |||
| 1 millón de tokens de texto de salida | $0.60 | $0.30 | |||
| Ajuste para 1 millón de tokens de entrenamiento | $3.00 | ||||
Generación de imágenes con Gemini 2.0 Flash |
|||||
| 1 millón de tokens de entrada | $0.15 | ||||
| 1 millón de tokens de audio de entrada | $1.00 | ||||
| 1 millón de tokens de video de entrada | $3 | ||||
| 1 millón de tokens de texto de salida | $0.60 | ||||
| 1 millón de tokens de imagen de salida | $30.00 | ||||
API de Gemini 2.0 Flash Live |
|||||
| 1 millón de tokens de texto de entrada | $0.5 | ||||
| 1 millón de tokens de audio de entrada | $3 | ||||
| 1 millón de tokens de entrada de video o imagen | $3 | ||||
| 1 millón de tokens de texto de salida | $2 | ||||
| 1 millón de tokens de audio de salida | $12 | ||||
Gemini 2.0 Flash Lite |
|||||
| 1 millón de tokens de entrada | $0.075 | $0.0375 | |||
| 1 millón de tokens de audio de entrada | $0.075 | $0.0375 | |||
| 1 millón de tokens de texto de salida | $0.30 | $0.15 | |||
| Ajuste para 1 millón de tokens de entrenamiento | $1.00 | ||||
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1,500 instrucciones fundamentadas por día sin cargo adicional. Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||
Fundamentación web para empresas |
$45 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding for enterprise*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||
| Fundamentación con tus datos | $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. | ||||
Fundamentación con Google Maps |
Los modelos de Gemini incluyen una cantidad de instrucciones fundamentadas diarias sin costo adicional: Las instrucciones fundamentadas que superen esos límites se facturarán a $25 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que hace al menos 1 consulta a Google Maps. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||
Precios basados en la modalidad
Los precios de modalidad que se indican a continuación se basan en casos de uso promedio y solo se ofrecen como referencia. La facturación real solo se basará en tokens:
- 4 caracteres dan como resultado aproximadamente 1 token de texto, incluidos los espacios en blanco.
- Para una imagen de 1024 x 1024, se consumen 1290 tokens. El recuento de tokens por imagen varía según la resolución de la imagen. Para obtener más información sobre cómo calcular tokens, puedes consultar nuestra documentación.
- La entrada de video consume 258 tokens por segundo con una frecuencia de muestreo de un fotograma por segundo. Los videos con audio se facturan por los tokens de video y los tokens de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
| Modelo | Tipo | Precio | Precio con la API de Batch |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| Texto de entrada (USD por millón de caracteres) | $0.0375 | $0.01875 | |
| Imagen de entrada ($/imagen) | $0.0001935 | $0.00009675 | |
| Video de entrada ($/s) | $0.0000387 | $0.00001935 | |
| Audio de entrada (USD/s) | $0.000025 | $0.0000125 | |
| Texto de salida (USD por millón de caracteres) | $0.15 | $0.075 | |
Generación de imágenes con Gemini 2.0 Flash |
|||
| Texto de entrada (USD por millón de caracteres) | $0.0375 | ||
| Imagen de entrada ($/imagen) | $0.0001935 | ||
| Video de entrada ($/s) | $0.0000387 | ||
| Audio de entrada (USD/s) | $0.000025 | ||
| Texto de salida (USD por millón de caracteres) | $0.15 | ||
| Imagen de salida ($/imagen) | $0.04 | ||
Gemini 2.0 Flash Lite |
|||
| Texto de entrada (USD por millón de caracteres) | $0.01875 | $0.009375 | |
| Imagen de entrada ($/imagen) | $0.00009675 | $0.000048375 | |
| Video de entrada ($/s) | $0.00001935 | $0.000009675 | |
| Audio de entrada (USD/s) | $0.000001875 | $0.000000938 | |
| Texto de salida (USD por millón de caracteres) | $0.075 | $0.0375 | |
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash y 2.5 Flash incluyen un total de 1,500 instrucciones fundamentadas por día sin cargo adicional. Las instrucciones fundamentadas que superen esos límites se facturarán a $35 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||
Fundamentación web para empresas |
$45 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas a Web Grounding for enterprise*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||
* Los precios aparecen en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Los tokens de entrenamiento se calculan con la cantidad total de tokens en tu conjunto de datos de entrenamiento, multiplicada por la cantidad de épocas.
* Los PDFs se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La fundamentación con la Búsqueda de Google y la fundamentación web para empresas solo se facturan cuando una instrucción devuelve resultados web correctamente (es decir, resultados que contienen al menos una URL de apoyo de fundamentación de la Web). Las tarifas de uso del modelo de Gemini se aplican por separado.
* API de Gemini 2.0 Flash Live: 25 tokens por segundo de audio (entrada/salida), 258 tokens por segundo de video (entrada). La fundamentación con la Búsqueda de Google sigue siendo sin costo mientras la API de Gemini 2.0 Flash Live esté en versión preliminar.
- Explicación de la facturación de la ventana de contexto de la sesión de LiveAPI: Se te cobra por turno por todos los tokens presentes en la ventana de contexto de la sesión. La ventana de contexto de la sesión incluye tokens nuevos (turno actual) y todos los tokens acumulados de turnos anteriores. Esto significa que los tokens de turnos anteriores se vuelven a procesar y se tienen en cuenta en cada nuevo turno, hasta el tamaño de la ventana de contexto configurada. Un "turno" es una entrada del usuario y la respuesta del modelo.
- Cuando se habilita la transcripción de audio a texto, todos los tokens de texto generados para la transcripción se cobran a la tarifa de salida de tokens de texto.
Precios del optimizador de modelos de Vertex AI (experimental)*
Vertex AI Model Optimizer simplifica el uso de Gemini para clientes empresariales, ya que proporciona un único metaextremo para las solicitudes de modelos de Gemini. Los clientes que usan este servicio no tienen que especificar si usarán Flash, Pro o una versión específica. En cambio, simplemente proporcionan un parámetro de configuración (costo, calidad o equilibrio) para indicar sus preferencias, y el optimizador de modelos aplica el nivel de inteligencia adecuado para la tarea enviando cada consulta al modelo que mejor se ajusta.
Vertex AI Model Optimizer aplica precios dinámicos. Esto significa que el precio promedio por token depende del nivel de inteligencia del modelo aplicado para completar la tarea. Por este motivo, se proporcionan ejemplos de precios a continuación para ilustrar situaciones probables en función de tu configuración (consulta las tablas que aparecen más abajo). Los SKUs de Model Optimizer son SKUs de $1 que funcionan como una unidad de compra para aplicar a tu facturación. Se te seguirá facturando en función del consumo después de que uses los modelos.
| Relación de E/S de 5:1 | Ejemplo 1 Chatbot |
NOTA: Estos rangos no son garantías, los resultados individuales de los clientes pueden variar | |||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Preferencia del cliente | Tokens de entrada del cliente enviados al MO | Tokens de salida del cliente enviados al MO | Precio promedio de entrada por millón de tokens (rango alto) | Precio promedio de salida por millón de tokens (rango alto) | Precio promedio de entrada por millón de tokens (rango bajo) | Precio promedio de salida por millón de tokens (rango bajo) | |||||
| Costo | 10,000,000 | 2,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
| Equilibrado | 10,000,000 | 2,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
| Calidad | 10,000,000 | 2,000,000 | $1.89 | $7.50 | $1.26 | $5.00 | |||||
| Relación de E/S de 1:20 | Ejemplo 2: Generación de contenido | ||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|
| Preferencia del cliente | Tokens de entrada del cliente enviados al MO | Tokens de salida del cliente enviados al MO | Precio promedio de entrada por millón de tokens (rango alto) | Precio promedio de salida por millón de tokens (rango alto) | Precio promedio de entrada por millón de tokens (rango bajo) | Precio promedio de salida por millón de tokens (rango bajo) | |||||
| Costo | 1,000,000 | 20,000,000 | $0.63 | $2.50 | $0.16 | $0.63 | |||||
| Equilibrado | 1,000,000 | 20,000,000 | $1.26 | $5.00 | $0.63 | $2.50 | |||||
| Calidad | 1,000,000 | 20,000,000 | $1.89 | $7.50 | $1.26 | $5.00 | |||||
Otros modelos de Gemini
Todos los modelos de Gemini, excepto Gemini 2.0 o Gemini 2.5, se facturan en función de las modalidades, como caracteres, imágenes y segundos de video o audio. La entrada de texto se cobra por cada 1,000 caracteres de entrada (instrucción) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y el espacio en blanco se excluye del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo. Las entradas de medios se cobran por imagen o por segundo (video). Si tu solicitud falla con un error 400 o 500, no se te cobrarán los tokens usados.
| Modelo | Atributo | Tipo | Precio ( =< 128,000 tokens de entrada) |
Precio ( > 128,000 tokens de entrada) |
||
|---|---|---|---|---|---|---|
| Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.00002 por imagen $0.00002 por segundo $0.00001875 por 1,000 caracteres $0.000002 por segundo |
$0.00004 por imagen $0.00004 por segundo $0.0000375 por 1,000 caracteres $0.000004 por segundo |
||
| Salida de texto | $0.000075 por 1,000 caracteres | $0.00015 por 1,000 caracteres | ||||
| Ajuste* | Token de entrenamiento | $8 por millón de tokens | ||||
| Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.00032875 por imagen $0.00032875 por segundo $0.0003125 por 1,000 caracteres $0.00003125 por segundo |
$0.0006575 por imagen $0.0006575 por segundo $0.000625 por 1,000 caracteres $0.0000625 por segundo |
||
| Salida de texto | $0.00125 por 1,000 caracteres | $0.0025 por 1,000 caracteres | ||||
| Ajuste* | Token de entrenamiento | $80 por millón de tokens | ||||
| Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto |
$0.0025 por imagen $0.002 por segundo $0.000125 por 1,000 caracteres |
|||
| Salida de texto | $0.000375 por 1,000 caracteres | |||||
| Fundamentación con la Búsqueda de Google | Texto | $35 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas en la Búsqueda de Google*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||
| Fundamentación web para empresas | Texto | $45 por cada 1,000 instrucciones fundamentadas. Una instrucción fundamentada es una solicitud enviada a Gemini que realiza una o más consultas a la fundamentación web para empresas*. Aunque se envíen varias consultas de búsqueda a la Búsqueda de Google, solo se cobrará una instrucción fundamentada. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de instrucciones fundamentadas por día. |
||||
| Fundamentación con tus datos | Texto | $2.5 por cada 1,000 solicitudes a partir del 16 de junio de 2025. |
||||
* Los precios aparecen en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Si un contexto de consulta tiene más de 128,000 tokens, todos se cobran con las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32,000 tokens.
* Los PDFs se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La fundamentación con la Búsqueda de Google y la fundamentación web para empresas solo se facturan cuando una instrucción devuelve resultados web correctamente (es decir, resultados que contienen al menos una URL de apoyo de fundamentación de la Web). Las tarifas de uso del modelo de Gemini se aplican por separado.
Imagen
Con Imagen en Vertex AI, puedes generar imágenes nuevas y editar imágenes según las instrucciones de texto que proporciones, o editar solo partes de imágenes con un área de máscara que definas junto con muchas otras capacidades.
| Modelo | Función | Descripción | Entrada | Resultado | Precio |
|---|---|---|---|---|---|
| Imagen 4 Ultra | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.06 por imagen |
| Imagen 4 | Mejora de la resolución | Aumenta la resolución de una imagen generada a 2K, 3K y 4K | Imagen | Imagen | $0.06 por imagen |
| Imagen 4 | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.04 por imagen |
| Imagen 4 Fast | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.02 por imagen |
| Imagen 3 | Generación de imágenes | Generar una imagen Editar una imagen Personalizar una imagen |
Instrucción de texto | Imagen | $0.04 por imagen |
| Imagen 3 Fast | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.02 por imagen |
| Imagen 2, Imagen 1 | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.020 por imagen |
| Imagen 2, Imagen 1 | Edición de imágenes | Edita una imagen con el enfoque “máscara” o “sin máscara” | Instrucción de imagen/texto | Imagen | $0.020 por imagen |
| Imagen 1 | Mejora de la resolución | Aumenta la resolución de una imagen generada a 2k y 4k | Imagen | Imagen | $0.003 por imagen |
| Imagen 1 | Ajuste | Habilita un "asunto" proporcionado por el usuario para usarlo en instrucciones de Imagen (entrenamiento de pocas tomas) | Asuntos con identificador de texto y 4 a 8 imágenes por sujeto | Modelo preciso (después del entrenamiento con sujetos proporcionados por el usuario) | $ por hora de procesamiento de nodo (precios de entrenamiento personalizado de Vertex AI) |
| Imagen | Subtítulos visuales | Genera una leyenda de texto corta o larga para una imagen | Imagen | Leyenda de texto | $0.0015/imagen |
| Imagen | Preguntas y respuestas visuales | Proporciona una respuesta basada en una pregunta que haga referencia a una imagen | Instrucción de imagen/texto | Respuesta de texto | $0.0015/imagen |
| Imagen | Recontextualización de productos | Reimagina productos en una escena nueva | De 1 a 3 imágenes del mismo producto y una instrucción de texto que describa la escena deseada | Imagen | $0.12 por imagen |
| Prueba virtual de Vertex | Crea imágenes de personas con diferentes prendas de vestir | 1 imagen de una persona y 1 imagen de ropa | Imagen | $0.06 por imagen |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Veo
Veo crea videos de calidad increíblemente alta en una amplia gama de temas y estilos, lo que aporta una mejor comprensión de la física del mundo real y los matices del movimiento y la expresión humanos.
| Modelo | Función | Descripción | Entrada | Salida | Resolución de salida | Precio |
|---|---|---|---|---|---|---|
| Veo 3.1 | Generación de video y audio | Genera videos de alta calidad con efectos de sonido o voz sincronizados a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video + audio | 720p, 1080p | $0.40 por segundo |
| Veo 3.1 | Generación de video | Genera videos de alta calidad a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video | 720p, 1080p | $0.20 por segundo |
| Veo 3.1 Fast | Generación de video y audio | Genera videos con efectos de sonido o voz sincronizados a partir de una instrucción de texto o una imagen de referencia con más rapidez | Instrucción de texto/imagen | Video + audio | 720p, 1080p | $0.15 por segundo |
| Veo 3.1 Fast | Generación de video | Genera videos a partir de una instrucción de texto o una imagen de referencia más rápido | Instrucción de texto/imagen | Video | 720p, 1080p | $0.10 por segundo |
| Veo 3 | Generación de video y audio | Genera videos de alta calidad con efectos de sonido o voz sincronizados a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video + audio | 720p, 1080p | $0.40 por segundo |
| Veo 3 | Generación de video | Genera videos de alta calidad a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video | 720p, 1080p | $0.20 por segundo |
| Veo 3 Fast | Generación de video y audio | Genera videos con efectos de sonido o voz sincronizados a partir de una instrucción de texto o una imagen de referencia con más rapidez | Instrucción de texto/imagen | Video + audio | 720p, 1080p | $0.15 por segundo |
| Veo 3 Fast | Generación de video | Genera videos a partir de una instrucción de texto o una imagen de referencia más rápido | Instrucción de texto/imagen | Video | 720p, 1080p | $0.10 por segundo |
| Veo 2 | Generación de video | Genera videos a partir de una instrucción de texto o una imagen de referencia | Instrucción de texto/imagen | Video | 720p | $0.50 por segundo |
| Veo 2 | Controles avanzados | Genera videos a través de la interpolación de fotogramas de inicio y finalización, extiende los videos generados y aplica controles de cámara | Instrucción de texto/imagen/video | Video | 720p | $0.50 por segundo |
Lyria
Lyria 2 ofrece generación de música instrumental de alta calidad, ideal para composiciones sofisticadas y exploración creativa detallada en la que la salida matizada es clave.
| Modelo | Función | Descripción | Entrada | Salida | Precio |
|---|---|---|---|---|---|
| Lyria 2 | Generación de música | Genera música a partir de una instrucción de texto | Instrucción de texto | Música | $0.06 por 30 segundos |
Comprende los costos de embeddings para tus aplicaciones de IA
| Modelo | Tipo | Región | Precio por 1,000 tokens de entrada |
|---|---|---|---|
| Embedding de Gemini | Entrada | Global |
|
| Salida | Global |
|
| Modelo | Tipo | Región | Precio por 1,000 caracteres |
|---|---|---|---|
| Embeddings para texto (sin incluir Gemini Embedding) |
Entrada | Global |
|
| Salida | Global |
|
| Modelo | Función | Descripción | Entrada | Resultado | Precio |
|---|---|---|---|---|---|
| multimodalembedding | Incorporaciones para multimodales: texto | Genera incorporaciones con texto como entrada | Texto | Incorporaciones | $0.0002 / 1,000 caracteres de entrada |
| Embeddings for Multimodal: Image | Genera incorporaciones con imagen como entrada | Imagen | Incorporaciones | $0.0001 / imagen de entrada | |
| Incorporaciones para multimodales: Video Plus | Video Plus | Video | Incorporaciones (hasta 15 incorporaciones por minuto de video) | $0.0020 por segundo de video | |
| Incorporaciones para multimodales: video estándar | Video Standard | Video | Incorporaciones (hasta 8 incorporaciones por minuto de video) | $0.0010 por segundo de video | |
| Incorporaciones para multimodales: Video Essential | Video Essential | Video | Incorporaciones (hasta 4 incorporaciones por minuto de video) | $0.0005 por segundo de video |
| Modelo de código abierto | Tipo | Precio por 1,000 tokens de entrada |
|---|---|---|
| multilingual-e5-small | Entrada: Salida: Entrada por lotes: Salida por lotes: |
Solicitudes en línea: $0.000015 Solicitudes en línea: sin cargo Solicitudes en lotes: $0.0000075 Solicitudes en lotes: sin cargo |
| multilingual-e5-large | Entrada: Salida: Entrada por lotes: Salida por lotes: |
Solicitudes en línea: $0.000025 Solicitudes en línea: sin cargo Solicitudes por lotes: $0.0000125 Solicitudes por lotes: sin cargo |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Precios de la finalización de código de Vertex AI
La asistencia de IA generativa en Vertex AI cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del recuento. Durante la etapa de vista previa, los cargos tienen un 100% de descuento. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo.
| Modelo | Tipo | Región | Precio por 1,000 caracteres |
|---|---|---|---|
| Codey para completar código | Entrada | Global |
|
| Salida | Global |
|
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Traducción (texto)
Usar la API de Vertex AI y el LLM de Translation para traducir texto Las traducciones de LLM tienden a ser más fluidas y a sonar más humanas que los modelos de traducción clásicos, pero tienen un soporte de idiomas más limitado (Más información).
| Modelo | Método | Uso | Precio por millón de caracteres |
|---|---|---|---|
| LLM | Traducción de texto* | La cantidad de caracteres de entrada por mes |
$10 por millón de caracteres* |
| La cantidad de caracteres de salida por mes |
$10 por millón de caracteres* |
Los precios aparecen en dólares estadounidenses.
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
*El precio es por carácter procesado por el modelo. Consulta Caracteres que se cobran para obtener más detalles sobre los caracteres que se consideran en el precio
Precio de almacenamiento en caché de contexto para almacenamiento en caché explícito
| Modelo | Atributo | Tipo | Precio (por 1 millón de tokens) <= 200,000 tokens de entrada |
Precio (por 1 millón de tokens) > 200,000 tokens de entrada |
|---|---|---|---|---|
| Gemini 3 Pro | Almacenamiento de caché de contexto | Entrada (texto, imagen, video, audio) | $4.5 (por millón de tokens por hora) | $4.5 (por millón de tokens por hora) |
| Gemini 2.5 Pro | Almacenamiento de caché de contexto | Entrada (texto, imagen, video, audio) | $4.5 (por millón de tokens por hora) | $4.5 (por millón de tokens por hora) |
| Gemini 2.5 Flash | Almacenamiento de caché de contexto | Entrada (texto, imagen, video, audio) | $1 (por millón de tokens por hora) | $1 (por millón de tokens por hora) |
| Gemini 2.5 Flash Lite | Almacenamiento de caché de contexto | Entrada (texto, imagen, video, audio) | $1 (por millón de tokens por hora) | $1 (por millón de tokens por hora) |
Modelos de Gemini 2.0
Precios basados en tokens
Modelo |
Tipo |
Almacenamiento (M tok-hora) |
Precio |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| 1 millón de tokens de entrada | $1.00 | $0.0375 | |
| 1 millón de tokens de audio de entrada | $1.00 | $0.25 | |
| 1 millón de tokens de texto de salida | N/A | N/A | |
Gemini 2.0 Flash Lite |
|||
| 1 millón de tokens de entrada | $1.00 | $0.01875 | |
| 1 millón de tokens de audio de entrada | $1.00 | $0.01875 | |
| 1 millón de tokens de texto de salida | N/A | N/A |
Precios basados en la modalidad
Los precios de modalidad que se indican a continuación se basan en casos de uso promedio y solo se ofrecen como referencia. La facturación real solo se basará en tokens:
- 4 caracteres dan como resultado aproximadamente 1 token de texto, incluidos los espacios en blanco.
- Para una imagen de 1024 x 1024, se consumen 1290 tokens. El recuento de tokens por imagen varía según la resolución de la imagen. Para obtener más información sobre cómo calcular tokens, puedes consultar nuestra documentación.
- La entrada de video consume 258 tokens por segundo con una frecuencia de muestreo de un fotograma por segundo. Los videos con audio se facturan por los tokens de video y los tokens de audio.
- La entrada de audio consume 25 tokens por segundo sin marca de tiempo.
Modelo |
Tipo |
Almacenamiento (modalidad-hora) |
Precio |
|---|---|---|---|
Gemini 2.0 Flash |
|||
| Texto de entrada (USD por millón de caracteres) | $0.25 | $0.009375 | |
| Imagen de entrada ($/imagen) | $0.00129 | $0.000048375 | |
| Video de entrada ($/s) | $0.000258 | $0.000009675 | |
| Audio de entrada (USD/s) | $0.000025 | $0.00000625 | |
| Texto de salida (USD por millón de caracteres) | N/A | N/A | |
Gemini 2.0 Flash Lite |
|||
| Texto de entrada (USD por millón de caracteres) | $0.25 | $0.0046875 | |
| Imagen de entrada ($/imagen) | $0.00129 | $0.0000241875 | |
| Video de entrada ($/s) | $0.000258 | $0.000009675 | |
| Audio de entrada (USD/s) | $0.000258 | $0.0000048375 | |
| Texto de salida (USD por millón de caracteres) | N/A | N/A | |
Fundamentación con la Búsqueda de Google |
Gemini 2.0 Flash incluye hasta 1,500 solicitudes fundamentadas por día sin cargo adicional. Las solicitudes fundamentadas que superen las 1,500 por día se facturarán a $35 por cada 1,000 solicitudes (hasta 1 millón de solicitudes por día). Comunícate con tu equipo de cuentas si necesitas más de 1 millón de solicitudes por día. |
||
Fundamentación web para empresas |
$45 por cada 1,000 solicitudes (hasta 1 millón de solicitudes por día) a partir del 5 de mayo de 2025. Comunícate con tu equipo de cuentas si necesitas más de 1 millón de solicitudes por día. |
||
* Los precios aparecen en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Los PDFs se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* La fundamentación con la Búsqueda de Google solo se factura para las solicitudes que devuelven resultados que contienen al menos una URL de apoyo de fundamentación de la Web. También se aplican tarifas de uso del modelo estándar de Gemini.
Capacidad de procesamiento aprovisionada
La capacidad de procesamiento aprovisionada garantiza la capacidad de procesamiento para tus necesidades de IA generativa y se transacciona a través de unidades de escala de IA generativa o GSU. Obtén más información sobre la cantidad de rendimiento que proporciona cada GSU aquí y usa nuestro estimador en línea aquí.
| Duración | Precio por GSU | Por |
|---|---|---|
| Compromiso de 1 semana | $1,200 | Semana |
| Compromiso de 1 mes | $2,700 | Mes |
| Compromiso de 3 meses | $2,400 | Mes |
| Compromiso por 1 año | $2,000 | Mes |
Ejemplo de cálculo de costos
Un usuario necesita asegurarse de que puede admitir 10 consultas por segundo (QPS) de una consulta con una entrada de 1,000 tokens de texto y 500 tokens de audio, y recibir una salida de 300 tokens de texto con gemini-2.0-flash.
Con la tabla de tasa de transferencia y tasa de consumo, para gemini-2.0-flash sabemos que la tasa de consumo de un token de texto de entrada es de 1 token, la tasa de consumo de un token de audio de entrada es de 7 tokens y la tasa de consumo de un token de texto de salida es de 4 tokens.
El total de tokens de entrada del usuario es 1,000* (1 token por token de texto de entrada) + 500* (7 tokens por token de audio de entrada) = 4,500 tokens de entrada ajustados por reducción. El total de tokens de salida del usuario es de 300* (4 tokens por token de texto de salida) = 1,200 tokens de salida ajustados por reducción. Si los sumamos, obtenemos 4,500 tokens de entrada ajustados por reducción + 1,200 tokens de salida ajustados por reducción = 5,700 tokens totales por consulta.
Si multiplicamos el total de tokens por consulta por QPS, obtenemos 5,700 tokens totales por consulta * 10 QPS = 57,000 tokens totales por segundo.
Si dividimos esto por la capacidad de procesamiento total por segundo por GSU, obtenemos 57,000 tokens totales por segundo ÷ 3,360 de capacidad de procesamiento por segundo por GSU = 16.96 GSUs. El incremento mínimo de compra de GSU para este modelo es de 1, por lo que el usuario necesitaría 17 GSUs.
Si el usuario quisiera mantener este rendimiento durante 1 semana, costaría $1,200 * 17 GSUs = $20,400 por semana. Si quisiera mantener este rendimiento durante 1 mes, el costo sería de $2,700 * 17 GSUs = $45,900 por mes. Si quisiera mantener este rendimiento durante 3 meses, el costo sería de $2,400 * 17 GSUs = $40,800 por mes. Por último, si quisiera mantener este rendimiento durante 1 año, el costo sería de $2,000 * 17 GSUs = $34,000 por mes.
Ajuste de modelo
El ajuste de modelos es una forma eficaz de personalizar modelos grandes para tus tareas. Es un paso clave para mejorar la calidad y la eficiencia del modelo. El ajuste de modelos proporciona los siguientes beneficios:
- Mayor calidad para tus tareas específicas
- Mayor solidez del modelo
- Menor latencia de inferencia y costo debido a instrucciones más cortas
El ajuste se cobra por millón de tokens de entrenamiento. Los tokens de entrenamiento se calculan con la cantidad total de tokens en tu conjunto de datos de entrenamiento, multiplicada por tu cantidad de épocas. Para la inferencia de modelos, el extremo del modelo ajustado de Gemini tiene el mismo precio de predicción que el modelo base.
| Modelo | Tipo | Precio (por 1 M de tokens de entrenamiento) |
|---|---|---|
| Gemini 2.5 Pro | Ajuste supervisado | $25 |
| Gemini 2.5 Flash | Ajuste supervisado Ajuste de preferencias |
$5 |
| Gemini 2.5 Flash Lite | Ajuste supervisado Ajuste de preferencias |
$1.5 |
| Gemma 3 27B IT | Ajuste supervisado | $6.83 |
| Llama 3.1 8B | Ajuste supervisado | $0.67 |
| Llama 3.2 1B | Ajuste supervisado | $0.28 |
| Llama 3.2 3B | Ajuste supervisado | $0.61 |
| Llama 3.3 70B | Ajuste supervisado | $6.72 |
| Llama 4 Scout 17B 16E | Ajuste supervisado | $5.77 |
| Qwen 3 32B | Ajuste supervisado | $6.57 |
* Los tokens de entrenamiento se calculan con la cantidad total de tokens en tu conjunto de datos de entrenamiento, multiplicada por la cantidad de épocas.
* Un extremo de modelo ajustado de Gemini tiene el mismo precio de predicción que el modelo base.
Compara los precios de los modelos de socios en Vertex AI
Los modelos de socios son una lista seleccionada de modelos de IA generativa que desarrollan los socios de Google. Los modelos de socios se ofrecen como APIs administradas. Para obtener más información, consulta Descripción general de los modelos de socios. En las siguientes secciones, se enumeran los detalles de los precios de los modelos de socios de Google.
Modelos de AI21 Labs
| Modelo | Precios |
|---|---|
| Jamba 1.5 Large (obsoleto) | Entrada: $2 por millón de tokens Salida: $8 por millón de tokens |
| Jamba 1.5 Mini (obsoleto) | Entrada: $0.20 por millón de tokens Salida: $0.40 por millón de tokens |
Modelos Claude de Anthropic
Modelos con precios regionales
Global
| Modelo | Precio (por 1 millón de tokens) < 200,000 tokens de entrada | Precio (por millón de tokens) >= 200,000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: $5.00 Salida: $25.00 Entrada por lotes: $2.50 Salida por lotes: $12.50 Escritura en caché de 5 min: $6.25 Escritura en caché de 1 h: $10.00 Acierto de caché: $0.50 Escritura en caché por lotes de 5 min: $3.125 Escritura en caché por lotes de 1 h: $5.00 Acierto de caché por lotes: $0.25 |
|
| Claude Sonnet 4.5 | Entrada: $3.00 Salida: $15.00 Entrada por lotes: $1.50 Salida por lotes: $7.50 Escritura en caché de 5 min: $3.75 Escritura en caché de 1 h: $6.00 Acierto de caché: $0.30 Escritura en caché por lotes: $1.88 Acierto de caché por lotes: $0.15 |
Entrada: $6.00 Salida: $22.50 Entrada por lotes: $3.00 Salida por lotes: $11.25 Escritura en caché de 5 min: $7.50 Escritura en caché de 1 h: $12.00 Acierto de caché: $0.60 Escritura en caché por lotes: $3.75 Acierto de caché por lotes: $0.30 |
| Claude Haiku 4.5 | Entrada: $1.00 Salida: $5.00 Entrada por lotes: $0.50 Salida por lotes: $2.50 Escritura en caché de 5 min: $1.25 Escritura en caché de 1 h: $2.00 Acierto de caché: $0.10 Escritura en caché por lotes: $0.625 Acierto de caché por lotes: $0.05 |
us-east5
| Modelo | Precio (por 1 millón de tokens) < 200,000 tokens de entrada | Precio (por millón de tokens) >= 200,000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: $5.50 Salida: $27.50 Entrada por lotes: $2.75 Salida por lotes: $13.75 Escritura en caché de 5 min: $6.875 Escritura en caché de 1 h: $11.00 Acierto de caché: $0.55 Escritura en caché por lotes de 5 min: $3.438 Escritura en caché por lotes de 1 h: $5.50 Acierto de caché por lotes: $0.275 |
|
| Claude Sonnet 4.5 | Entrada: $3.30 Salida: $16.50 Entrada por lotes: $1.65 Salida por lotes: $8.25 Escritura en caché de 5 min: $4.13 Escritura en caché de 1 h: $6.60 Acierto de caché: $0.33 Escritura en caché por lotes: $2.06 Acierto de caché por lotes: $0.17 |
Entrada: $6.60 Salida: $24.75 Entrada por lotes: $3.30 Salida por lotes: $12.38 Escritura en caché de 5 min: $8.25 Escritura en caché de 1 h: $13.20 Acertar caché: $0.66 Escritura en caché por lotes: $4.13 Acertar caché por lotes: $0.33 |
| Claude Haiku 4.5 | Entrada: $1.10 Salida: $5.50 Entrada por lotes: $0.55 Salida por lotes: $2.75 Escritura en caché de 5 min: $1.375 Escritura en caché de 1 h: $2.20 Escritura en caché: $1.375 Acertar caché: $0.11 Escritura en caché por lotes: $0.688 Acertar caché por lotes: $0.055 |
europe-west1
| Modelo | Precio (por 1 millón de tokens) < 200,000 tokens de entrada | Precio (por millón de tokens) >= 200,000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: $5.50 Salida: $27.50 Entrada por lotes: $2.75 Salida por lotes: $13.75 Escritura en caché de 5 min: $6.875 Escritura en caché de 1 h: $11.00 Acierto de caché: $0.55 Escritura en caché por lotes de 5 min: $3.438 Escritura en caché por lotes de 1 h: $5.50 Acierto de caché por lotes: $0.275 |
|
| Claude Sonnet 4.5 | Entrada: $3.30 Salida: $16.50 Entrada por lotes: $1.65 Salida por lotes: $8.25 Escritura en caché de 5 min: $4.13 Escritura en caché de 1 h: $6.60 Acierto de caché: $0.33 Escritura en caché por lotes: $2.06 Acierto de caché por lotes: $0.17 |
Entrada: $6.60 Salida: $24.75 Entrada por lotes: $3.30 Salida por lotes: $12.38 Escritura en caché de 5 min: $8.25 Escritura en caché de 1 h: $13.20 Acertar caché: $0.66 Escritura en caché por lotes: $4.13 Acertar caché por lotes: $0.33 |
| Claude Haiku 4.5 | Entrada: $1.10 Salida: $5.50 Entrada por lotes: $0.55 Salida por lotes: $2.75 Escritura en caché de 5 min: $1.375 Escritura en caché de 1 h: $2.20 Acierto de caché: $0.11 Escritura en caché por lotes: $0.688 Acierto de caché por lotes: $0.055 |
asia-southeast1
| Modelo | Precio (por 1 millón de tokens) < 200,000 tokens de entrada | Precio (por millón de tokens) >= 200,000 tokens de entrada |
|---|---|---|
| Claude Opus 4.5 | Entrada: $5.50 Salida: $27.50 Entrada por lotes: $2.75 Salida por lotes: $13.75 Escritura en caché de 5 min: $6.875 Escritura en caché de 1 h: $11.00 Acierto de caché: $0.55 Escritura en caché por lotes de 5 min: $3.438 Escritura en caché por lotes de 1 h: $5.50 Acierto de caché por lotes: $0.275 |
|
| Claude Sonnet 4.5 | Entrada: $3.30 Salida: $16.50 Entrada por lotes: $1.65 Salida por lotes: $8.25 Escritura en caché de 5 min: $4.13 Escritura en caché de 1 h: $6.60 Acierto de caché: $0.33 Escritura en caché por lotes: $2.06 Acierto de caché por lotes: $0.17 |
Entrada: $6.60 Salida: $24.75 Entrada por lotes: $3.30 Salida por lotes: $12.38 Escritura en caché de 5 min: $8.25 Escritura en caché de 1 h: $13.20 Acertar caché: $0.66 Escritura en caché por lotes: $4.13 Acertar caché por lotes: $0.33 |
asia-east1
| Modelo | Precio (por 1 millón de tokens) < 200,000 tokens de entrada | Precio (por millón de tokens) >= 200,000 tokens de entrada |
|---|---|---|
| Claude Haiku 4.5 | Entrada: $1.10 Salida: $5.50 Entrada por lotes: $0.55 Salida por lotes: $2.75 Escritura en caché de 5 min: $1.375 Escritura en caché de 1 h: $2.20 Escritura en caché: $1.375 Acertar caché: $0.11 Escritura en caché por lotes: $0.688 Acertar caché por lotes: $0.055 |
* Si el contexto de entrada de una consulta es igual o superior a 200,000 tokens, todos los tokens (de entrada y salida) se cobran con las tarifas de contexto largo.
Modelos con precios uniformes en todas las regiones
| Modelo | Precio (por 1 millón de tokens) < 200,000 tokens de entrada | Precio (por millón de tokens) >= 200,000 tokens de entrada |
|---|---|---|
| Claude Opus 4.1 | Entrada: $15 Salida: $75 Entrada por lotes: $7.50 Salida por lotes: $37.50 Escritura en caché de 5 min: $18.75 Escritura en caché de 1 h: $30 Acierto de caché: $1.50 Escritura en caché por lotes: $9.375 Acierto de caché por lotes: $0.75 |
N/A |
| Claude Opus 4 | Entrada: $15 Salida: $75 Entrada por lotes: $7.50 Salida por lotes: $37.50 Escritura en caché de 5 min: $18.75 Escritura en caché de 1 h: $30 Acertar caché: $1.50 Escritura en caché por lotes: $9.375 Acertar caché por lotes: $0.75 |
N/A |
| Claude Sonnet 4 | Entrada: $3 Salida: $15 Entrada por lotes: $1.50 Salida por lotes: $7.50 Escritura en caché de 5 min: $3.75 Escritura en caché de 1 h: $6.00 Acierto de caché: $0.30 Escritura en caché por lotes: $1.875 Acierto de caché por lotes: $0.15 |
Entrada: $6 Salida: $22.50 Entrada por lotes: $3 Salida por lotes: $11.25 Escritura en caché de 5 min: $7.50 Escritura en caché de 1 h: $12.00 Acertar caché: $0.60 Escritura en caché por lotes: $3.75 Acertar caché por lotes: $0.30 |
| Claude 3.5 Haiku | Entrada: $0.80 Salida: $4 Entrada por lotes: $0.40 Salida por lotes: $2 Escritura en caché de 5 min: $1 Escritura en caché de 1 h: $1.60 Acierto de caché: $0.08 Escritura en caché por lotes: $0.50 Acierto de caché por lotes: $0.04 |
N/A |
| Claude 3 Haiku | Entrada: $0.25 Salida: $1.25 Escritura en caché de 5 min: $0.30 Escritura en caché de 1 h: $0.50 Acierto de caché: $0.03 | N/A |
| Claude 3.7 Sonnet (obsoleto) | Entrada: $3 Salida: $15 Entrada por lotes: $1.50 Salida por lotes: $7.50 Escritura en caché: $3.75 Acierto de caché: $0.30 Escritura en caché por lotes: $1.875 Acierto de caché por lotes: $0.15 |
N/A |
| Claude 3.5 Sonnet v2 (obsoleto) | Entrada: $3 Salida: $15 Entrada por lotes: $1.50 Salida por lotes: $7.50 Escritura en caché: $3.75 Acierto de caché: $0.30 Escritura en caché por lotes: $1.875 Acierto de caché por lotes: $0.15 |
N/A |
| Claude 3.5 Sonnet (obsoleto) | Entrada: $3 Salida: $15 Escritura en caché: $3.75 Acertar en caché: $0.30 |
N/A |
| Claude 3 Opus (obsoleto) | Entrada: $15 Salida: $75 Escritura en caché: $18.75 Acertar caché: $1.50 |
N/A |
* Si el contexto de entrada de una consulta es igual o superior a 200,000 tokens, todos los tokens (de entrada y salida) se cobran con las tarifas de contexto largo.
Precios de las herramientas
| Herramienta | Precio |
|---|---|
| Solicitud de búsqueda web | $10 por 1, 000 búsquedas
Modelos compatibles: Claude Haiku 4.5, Claude Sonnet 4.5, Claude Sonnet 4, Claude Opus 4.1 y Claude Opus 4. |
* Si el contexto de entrada de una consulta es igual o superior a 200,000 tokens, todos los tokens (de entrada y salida) se cobran con las tarifas de contexto largo.
Modelos de Deepseek
| Modelo | Precios |
|---|---|
| DeepSeek-V3.1 | Entrada: $0.60 por millón de tokens Salida: $1.70 por millón de tokens Entrada por lotes: $0.30 por millón de tokens Salida por lotes: $0.85 por millón de tokens |
| DeepSeek-R1 (0528) | Entrada: $1.35 por millón de tokens Salida: $5.40 por millón de tokens Entrada por lotes: $0.675 por millón de tokens Salida por lotes: $2.70 por millón de tokens |
| DeepSeek-OCR * | Entrada: $0.30 por millón de tokens (o $0.0003 por página) Salida: $1.20 por millón de tokens (o $0.00012 por página) |
- Disponible sin cargo hasta el 10 de noviembre de 2025.
Modelos de MiniMax
| Modelo | Precios |
|---|---|
| MiniMax-M2 * | Entrada: $0.30 por millón de tokens Salida: $1.20 por millón de tokens |
- Disponible sin cargo hasta el 10 de noviembre de 2025.
Modelos de Moonshot
| Modelo | Precios |
|---|---|
| Kimi-K2-Thinking * | Entrada: $0.60 por millón de tokens Salida: $2.50 por millón de tokens |
- Disponible sin cargo hasta el 17 de noviembre de 2025.
Modelos de Qwen
| Modelo | Precios |
|---|---|
| Qwen3-Next-80B-Thinking | Entrada: $0.15 por millón de tokens Salida: $1.20 por millón de tokens |
| Qwen3-Next-80B-Instruct | Entrada: $0.15 por millón de tokens Salida: $1.20 por millón de tokens |
| Qwen3-Coder-480B-A35B-Instruct | Entrada: $0.22 por millón de tokens Salida: $1.80 por millón de tokens Entrada por lotes: $0.11 por millón de tokens Salida por lotes: $0.90 por millón de tokens |
| Qwen3-235B-A22B-Instruct-2507 | Entrada: $0.22 por millón de tokens Salida: $0.88 por millón de tokens Entrada por lotes: $0.11 por millón de tokens Salida por lotes: $0.44 por millón de tokens |
Modelos de OpenAI
| Modelo | Precios |
|---|---|
| gpt-oss-120b | Entrada: $0.09 por millón de tokens Salida: $0.36 por millón de tokens Entrada por lotes: $0.045 por millón de tokens Salida por lotes: $0.18 por millón de tokens |
| gpt-oss-20b | Entrada: $0.07 por millón de tokens Salida: $0.25 por millón de tokens Entrada por lotes: $0.035 por millón de tokens Salida por lotes: $0.125 por millón de tokens |
Modelos Llama de Meta
| Modelo | Precios |
|---|---|
| Llama 3.1 405b | Entrada: $5.00 por millón de tokens Salida: $16.00 por millón de tokens |
| Llama 3.3 70B | Entrada: $0.72 por millón de tokens Salida: $0.72 por millón de tokens Entrada por lotes: $0.36 por millón de tokens Salida por lotes: $0.36 por millón de tokens |
| Llama 4 Scout | Entrada: $0.25 por millón de tokens Salida: $0.70 por millón de tokens Entrada por lotes: $0.125 por millón de tokens Salida por lotes: $0.35 por millón de tokens |
| Llama 4 Maverick | Entrada: $0.35 por millón de tokens Salida: $1.15 por millón de tokens Entrada por lotes: $0.175 por millón de tokens Salida por lotes: $0.575 por millón de tokens |
Modelos de Mistral AI
| Modelo | Precios |
|---|---|
| OCR de Mistral (25.05) | Entrada: $0.0005 por millón de tokens (o $0.0005 por página) Salida: $0.0005 por millón de tokens (o $0.0005 por página) |
| Mistral Medium 3 | Entrada: $0.40 por millón de tokens Salida: $2.00 por millón de tokens |
| Mistral Small 3.1 (25.03) | Entrada: $0.10 por millón de tokens Salida: $0.30 por millón de tokens |
| Mistral Large (24.11) (obsoleto) | Entrada: $2.00 por millón de tokens Salida: $6.00 por millón de tokens |
| Codestral 2 | Entrada: $0.30 por millón de tokens Salida: $0.90 por millón de tokens |
| Codestral (25.01) (obsoleto) | Entrada: $0.30 por millón de tokens Salida: $0.90 por millón de tokens |