Precios de Vertex AI
Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en SKU de Google Cloud.
En esta página, se abordan los precios de la asistencia de IA generativa en Vertex AI. Para obtener información sobre todos los demás precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.
Modelos de Google
Gemini
Con los modelos multimodales en Vertex AI, puedes ingresar texto o medios (imágenes, video). La entrada de texto se cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo. Las entradas de medios se cobran por imagen o por segundo (video).
Modelo | Atributo | Tipo | Precio ( =<128,000 tokens de entrada) |
Precio (> 128,000 tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.00002 por imagen $0.00002 por segundo $0.00001875 por 1,000 caracteres $0.000002 por segundo |
$0.00004 por imagen $0.00004 por segundo $0.0000375 por 1,000 caracteres $0.000004 por segundo |
Salida de texto | $0.000075 por 1,000 caracteres | $0.00015 / 1,000 caracteres | ||
Ajustes* | Token de entrenamiento | USD 8 por millón de tokens | ||
Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.00032875 por imagen $0.00032875 por segundo $0.0003125 por 1,000 caracteres $0.00003125 por segundo |
$0.0006575 por imagen $0.0006575 por segundo $0.000625 por 1,000 caracteres $0.0000625 por segundo |
Salida de texto | $0.00125 por 1,000 caracteres | $0.0025 por 1,000 caracteres | ||
Ajustes* | Token de entrenamiento | USD 80 por millón de tokens | ||
Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto |
$0.0025 por imagen $0.002 por segundo $0.000125 por 1,000 caracteres |
|
Salida de texto | $0.000375 por 1,000 caracteres | |||
Grounding with Google Search | Texto | Solicitudes de fundamentación | USD 35 por 1,000 solicitudes (hasta 1 millón de solicitudes por día). Comunícate con tu equipo de cuentas si necesitas más de un millón de solicitudes por día. |
* Los precios aparecen en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* Si el contexto de una consulta es más largo que 128,000, todos los tokens se cobran con las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32,000.
* Los PDF se facturan como entrada de imagen, con una página de PDF equivalente a una imagen.
* El extremo del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* Conexión a la Búsqueda de Google: Si utilizas la recuperación dinámica para optimizar los costos, solo se cobrará la Conexión a la Búsqueda de Google por las solicitudes que contengan al menos una URL de asistencia de conexión de la Web en su respuesta. Siempre se aplican costos para Gemini.
Imagen
Con Imagen en Vertex AI, puedes generar imágenes nuevas y editar imágenes según las instrucciones de texto que proporciones, o editar solo partes de imágenes mediante un área de máscara que definas junto con muchas otras capacidades.
Modelo | Función | Descripción | Entrada | Resultado | Precio |
---|---|---|---|---|---|
Imagen 3 | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.04 por imagen |
Imagen 3 rápida | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.02 por imagen |
Imagen 2, Imagen | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.020 por imagen |
Edición de imágenes | Edita una imagen con el enfoque “máscara” o “sin máscara” | Instrucción de imagen/texto | Imagen | $0.020 por imagen | |
Mejora de la resolución | Aumenta la resolución de una imagen generada a 2k y 4k | Imagen | Imagen | $0.003 por imagen | |
Ajuste | Habilita un "asunto" proporcionado por el usuario para usarlo en instrucciones de Imagen (entrenamiento de pocas tomas) | Asuntos con identificador de texto y 4 a 8 imágenes por sujeto | Modelo preciso (después del entrenamiento con sujetos proporcionados por el usuario) | $ por hora de procesamiento de nodo (precios de entrenamiento personalizado de Vertex AI) | |
Subtítulos visuales | Genera una leyenda de texto corta o larga para una imagen | Imagen | Leyenda de texto | $0.0015/imagen | |
Preguntas y respuestas visuales | Proporciona una respuesta basada en una pregunta que haga referencia a una imagen | Instrucción de imagen/texto | Respuesta de texto | $0.0015/imagen |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Embedding
Modelo | Función | Descripción | Entrada | Resultado | Precio |
---|---|---|---|---|---|
multimodalembedding | Incorporaciones para multimodales: texto | Genera incorporaciones con texto como entrada | Texto | Incorporaciones | $0.0002 / 1,000 caracteres de entrada |
Incorporaciones para multimodales: imagen | Genera incorporaciones con imagen como entrada | Imagen | Incorporaciones | $0.0001 / imagen de entrada | |
Incorporaciones para multimodales: video plus | Video Plus | Video | Incorporaciones (hasta 15 incorporaciones por minuto de video) | $0.0020 por segundo de video | |
Incorporaciones para multimodales: Estándar de video | Video Standard | Video | Incorporaciones (hasta 8 incorporaciones por minuto de video) | $0.0010 por segundo de video | |
Incorporaciones para multimodales: elementos esenciales de video | Video Essential | Video | Incorporaciones (hasta 4 incorporaciones por minuto de video) | $0.0005 por segundo de video |
Modelo | Tipo | Región | Precio por 1,000 caracteres |
---|---|---|---|
Incorporaciones para texto | Entrada | Global |
|
Salida | Global |
|
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Finalización de código
La asistencia de IA generativa en Vertex AI cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del recuento. Durante la etapa de vista previa, los cargos tienen un 100% de descuento. Las solicitudes de predicción que generan respuestas filtradas se cobran solo por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo ($0.01) se redondean a un centavo.
Modelo | Tipo | Región | Precio por 1,000 caracteres |
---|---|---|---|
Codey para completar código | Entrada | Global |
|
Salida | Global |
|
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Traducción (texto)
Usar la API de Vertex AI y el LLM de traducción para traducir texto Las traducciones de los LLM suelen ser más fluidas y sonar más humanas que las de los modelos de traducción clásicos, pero tienen una compatibilidad con el idioma más limitada (Más información).
Modelo | Método | Uso | Precio por millón de caracteres |
---|---|---|---|
LLM | Traducción del texto (Vista previa)* | La cantidad de caracteres de entrada por mes |
$10 por millón de caracteres* |
La cantidad de caracteres de salida por mes |
$10 por millón de caracteres* |
Los precios aparecen en dólares estadounidenses.
Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en los SKU de Cloud Platform.
* El precio se calcula por carácter procesado por el modelo. Consulta Caracteres que se cobran para obtener más detalles sobre los caracteres que se consideran en el precio
Almacenamiento de contexto en caché
Con el almacenamiento en caché del contexto, puedes reducir el costo del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido almacenando en caché la parte del contexto de tu texto de entrada o contenido multimedia en modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la caché, que puede controlar el usuario, determina los cargos de “Almacenamiento de caché de contexto”. Cuando se crea un contexto almacenado en caché, se les cobrará a los usuarios el costo estándar del token de entrada. Los aciertos de caché en los datos de entrada se cobran a una tarifa reducida, “Entrada almacenada en caché”, en lugar del costo de entrada normal. El tamaño de los datos para el almacenamiento y la entrada se calcula de la misma manera que el precio de la entrada de Gemini.
Modelo | Función | Tipo | Precio ( =< 128K tokens de entrada) | Precio (> 128,000 tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Entrada almacenada en caché | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.000005 por imagen 0.000005 por segundo 0.0000046875 por 1,000 caracteres 0.0000005 por segundo |
0.00001 por imagen 0.00001 por segundo 0.000009375 por 1,000 caracteres 0.000001 por segundo |
Almacenamiento de caché de contexto | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.000263 por imagen por hora 0.000263 por segundo por hora 0.00025 por 1,000 caracteres por hora 0.000025 por segundo por hora |
||
Gemini 1.5 Pro | Entrada almacenada en caché | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.0000821875 por imagen 0.0000821875 por segundo 0.000078125 por 1,000 caracteres 0.0000078125 por segundo |
0.000164375 por imagen 0.000164375 por segundo 0.00015625 por 1,000 caracteres 0.000015625 por segundo |
Almacenamiento de caché de contexto | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.0011835 / imagen / hr 0.0011835/ segundo / hr 0.001125 / 1,000 caracteres / hr 0.0001125 / segundo / hr |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Ejemplo de cálculo de costos almacenados en caché
Si un usuario crea un contexto en caché de 250,000 caracteres con un TTL de 2 horas y, posteriormente, envía veinte solicitudes separadas al modelo Gemini 1.5 Pro durante esas 2 horas, y cada solicitud tiene una consulta de 200 caracteres agregada al contexto en caché y un resultado de 400 caracteres, el cargo total se calcula de la siguiente manera:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Ejemplo de cálculo de costos
Si un usuario envía cinco solicitudes diferentes al modelo de Bison de texto PaLM, y cada solicitud tiene una entrada de 200 caracteres y un resultado de 400 caracteres, el cargo total se calcula de la siguiente manera:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelos de socios
Los modelos de socios son una lista seleccionada de modelos de IA generativa que desarrollan los socios de Google. Los modelos de socios se ofrecen como APIs administradas. Para obtener más información, consulta Descripción general de los modelos de socios. En las siguientes secciones, se enumeran los detalles de precios para los modelos de socios de Google.
Modelos de AI21 Labs
Modelo | Precios |
---|---|
Jamba 1.5 Large | Entrada: $2 / millón de tokens Salida: $8 / millón de tokens |
Jamba 1.5 Mini | Entrada: $0.20 por cada millón de tokens Salida: $0.40 por cada millón de tokens |
Modelos Claude de Anthropic
Modelo | Precios |
---|---|
Claude 3.5 Haiku | Entrada: $0.80 / millón de tokens Salida: $4.00 / millón de tokens |
Claude 3.5 Sonnet v2 | Entrada: USD 3 por millón de tokens Salida: USD 15 por millón de tokens |
Claude 3.5 Sonnet | Entrada: USD 3 por millón de tokens Salida: USD 15 por millón de tokens |
Claude 3 Haiku | Entrada: $0.25 / millón de tokens Salida: $1.25 / millón de tokens |
Claude 3 Sonnet | Entrada: USD 3 por millón de tokens Salida: USD 15 por millón de tokens |
Claude 3 Opus | Entrada: $15 por millón de tokens Salida: $75 por millón de tokens |
Modelos de Llama de Meta
Modelo | Precios |
---|---|
Llama 3.1 405b | Entrada: $5.00 por millón de tokens Salida: $16.00 por millón de tokens |
Modelos de Mistral AI
Modelo | Precios |
---|---|
Mistral grande (24.11) | Entrada: $2.00 por millón de tokens Salida: $6.00 por millón de tokens |
Mistral grande (24.07) | Entrada: $2.00 por millón de tokens Salida: $6.00 por millón de tokens |
Mistral Nemo | Entrada: $0.15 por cada millón de tokens Salida: $0.15 por cada millón de tokens |
Codestral (24.05) | Entrada: $0.20 por cada millón de tokens Salida: $0.60 por cada millón de tokens |