Precios de Vertex AI
Los precios aparecen en dólares estadounidenses (USD). Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en SKU de Google Cloud.
En esta página, se abordan los precios de la IA generativa en Vertex AI. Para todos los demás precios de Vertex AI, incluidos Consulta la página de precios de Vertex AI para conocer los servicios de ML Platform y MLOps.
Modelos de Google
Gemini
Con los modelos multimodales en Vertex AI, puedes ingresar texto o multimedia (imágenes, video). La entrada de texto se cobra cada 1,000 caracteres de entrada (instrucción) y cada 1,000 caracteres de salida (respuesta). Los caracteres son se cuentan con los puntos de código UTF-8 y se excluyen los espacios en blanco del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Solicitudes de predicción que generan a las respuestas filtradas se cobran solo por la entrada. Al final de cada facturación las fracciones de un centavo (USD 0.01) se redondean a un centavo. Entrada multimedia se cobra por imagen o por segundo (video).
Modelo | Atributo | Tipo | Precio ( =< 128,000 ventana de contexto) |
Precio (ventana de contexto superior a 128,000) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.00002 / imagen $0.00002 / segundo $0.00001875 / 1,000 caracteres $0.000002 / segundo |
$0.00004 / imagen $0.00004 / segundo $0.0000375 / 1,000 caracteres $0.000004 / segundo |
Salida de texto | $0.000075 por 1,000 caracteres | $0.00015 por 1,000 caracteres | ||
Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
$0.001315 / imagen $0.001315 / segundo $0.00125 / 1,000 caracteres $0.000125 / segundo |
$0.00263 / imagen $0.00263 / segundo $0.0025 / 1,000 caracteres $0.00025 / segundo |
Salida de texto | $0.00375 por 1,000 caracteres | $0.0075 por 1,000 caracteres | ||
Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de video Entrada de texto |
$0.0025 por imagen $0.002 por segundo $0.000125 por 1,000 caracteres |
|
Salida de texto | $0.000375 por 1,000 caracteres | |||
Grounding with Google Search | Texto | Solicitudes de fundamentos | $35 por cada 1,000 solicitudes (para un máximo de 1 millón de solicitudes por día) Si necesitas más, comunícate con el equipo de cuentas de más de 1 millón de solicitudes por día. |
* Los precios se indican en dólares estadounidenses (USD).
Si pagas en una moneda distinta del dólar estadounidense, los precios que aparecen en tu moneda en
SKU de Cloud Platform
aplicar.
* Si el contexto de una consulta supera los 128,000, todos los tokens se cobran a tasas de contexto largas.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32,000.
* Los PDF se facturan como entrada de imagen, con una página PDF equivalente a una imagen.
Imagen
Con Imagen en Vertex AI, puedes generar imágenes nuevas y editarlas en función de las instrucciones de texto que proporciones, o bien editar solo partes de las imágenes con un área de máscara que definas junto con muchas otras capacidades.
Modelo | Función | Descripción | Entrada | Resultado | Precio |
---|---|---|---|---|---|
Imagen 3 | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.04 por imagen |
Imagen 3 rápida | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.02 por imagen |
Imagen 2, Imagen | Generación de imágenes | Genera una imagen | Instrucción de texto | Imagen | $0.020 por imagen |
Edición de imágenes | Edita una imagen con el enfoque “máscara” o “sin máscara” | Instrucción de imagen/texto | Imagen | $0.020 por imagen | |
Mejora de la resolución | Aumenta la resolución de una imagen generada a 2k y 4k | Imagen | Imagen | $0.003 por imagen | |
Ajuste | Habilitar un “asunto” proporcionados por el usuario para utilizar en las instrucciones de Imagen (capacitación breve) | Asuntos con identificador de texto y 4 a 8 imágenes por sujeto | Modelo preciso (después del entrenamiento con sujetos proporcionados por el usuario) | $ por hora de procesamiento de nodo (precios de entrenamiento personalizado de Vertex AI) | |
Subtítulos visuales | Genera una leyenda de texto corta o larga para una imagen | Imagen | Leyenda de texto | $0.0015/imagen | |
Preguntas y respuestas visuales | Proporciona una respuesta basada en una pregunta que haga referencia a una imagen | Instrucción de imagen/texto | Respuesta de texto | $0.0015/imagen |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Incorporación
Modelo | Función | Descripción | Entrada | Resultado | Precio |
---|---|---|---|---|---|
incorporación multimodal | Incorporaciones para multimodales: texto | Genera incorporaciones con texto como entrada | Texto | Incorporaciones | $0.0002 / 1,000 caracteres de entrada |
Incorporaciones para multimodal: Imagen | Genera incorporaciones con imagen como entrada | Imagen | Incorporaciones | $0.0001 / imagen de entrada | |
Incorporaciones para multimodales: Video Plus | Video Plus | Video | Incorporaciones (hasta 15 incorporaciones por minuto de video) | $0.0020 por segundo de video | |
Incorporaciones para multimodales: video estándar | Video Standard | Video | Incorporaciones (hasta 8 incorporaciones por minuto de video) | $0.0010 por segundo de video | |
Incorporaciones para multimodales: video esencial | Video Essential | Video | Incorporaciones (hasta 4 incorporaciones por minuto de video) | $0.0005 por segundo de video |
Modelo | Tipo | Región | Precio por 1,000 caracteres |
---|---|---|---|
Incorporaciones para texto | Entrada | Global |
|
Salida | Global |
|
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Finalización de código
La asistencia de IA generativa en Vertex AI cobra por cada 1,000 caracteres de entrada (mensaje) y cada 1,000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF-8 y el espacio en blanco se excluye del recuento. Durante la etapa de vista previa, los cargos tienen un 100% de descuento. Solicitudes de predicción que generan resultados las respuestas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un centavo (USD 0.01) se redondean a un centavo.
Modelo | Tipo | Región | Precio por 1,000 caracteres |
---|---|---|---|
Codey para completar código | Entrada | Global |
|
Salida | Global |
|
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Traducción (texto)
Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones LLM tienden a ser más fluidas y tener un sonido más humano que los modelos de traducción clásicos, pero tienen una compatibilidad de idiomas más limitada (más información).
Modelo | Método | Uso | Precio por millón de caracteres |
---|---|---|---|
LLM | Texto traducción (versión preliminar)* | La cantidad de caracteres de entrada por mes |
$10 por millón de caracteres* |
La cantidad de caracteres de salida por mes |
$10 por millón de caracteres* |
Los precios aparecen en dólares estadounidenses.
Si pagas en una moneda distinta del dólar estadounidense, los precios que aparecen en tu moneda en
SKU de Cloud Platform
aplicar.
* El precio se calcula por carácter que procesa el modelo. Para obtener más información sobre los caracteres que se cuentan, consulta Caracteres que se cobran.
Almacenamiento en caché de contexto
Con el almacenamiento en caché de contexto, puedes reducir el costo del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido al almacenar en caché la porción de contexto de tu ingresar texto o contenido multimedia a los modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la que el usuario puede controlar, determina el tipo de “Caché de contexto” Almacenamiento" cargos. Cuando se crea un contexto almacenado en caché, a los usuarios se les cobrará el costo del token de entrada estándar. Los aciertos de caché en los datos de entrada se cobran a una tarifa reducida, "Entrada en caché", en lugar del costo de entrada normal. El tamaño de los datos para ambos el almacenamiento y la entrada se calculan de la misma manera que los precios de entrada de Gemini.
Modelo | Función | Tipo | Precio ( < 128,000 ventana de contexto) | Precio (ventana de contexto superior a 128,000) |
---|---|---|---|---|
Gemini 1.5 Flash | Entrada en caché | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.000005 / imagen 0.000005 / segundo 0.0000046875 / 1,000 caracteres 0.0000005 / segundo |
0.00001 / imagen 0.00001 / segundo 0.000009375 / 1,000 caracteres 0.000001 / segundo |
Almacenamiento en caché del contexto | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.000263 / imagen / h 0.000263/ segundo / h 0.00025 / 1,000 caracteres / h 0.000025 / segundo / h |
||
Gemini 1.5 Pro | Entrada en caché | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.00032875 / imagen 0.00032875 / segundo 0.0003125 / 1,000 caracteres 0.00003125 / segundo |
0.0006575 / imagen 0.0006575 / segundo 0.000625 / 1,000 caracteres 0.0000625 / segundo |
Almacenamiento en caché del contexto | Entrada de imagen Entrada de video Entrada de texto Entrada de audio |
0.0011835 / imagen / h 0.0011835/ segundo / h 0.001125 / 1,000 caracteres / h 0.0001125 / segundo / h |
Los precios aparecen en dólares estadounidenses. Si pagas en una moneda distinta del dólar estadounidense, se aplican los precios que aparecen en tu moneda en Cloud Platform SKUs.
Ejemplo de cálculo de costo almacenado en caché
Si un usuario crea un contexto almacenado en caché de 250,000 caracteres con un TTL de 2 horas y, luego, envía veinte solicitudes separadas al modelo de Gemini 1.5 Pro durante esas 2 horas y cada solicitud tiene una consulta de 200 caracteres agregada al contexto almacenado en caché y un resultado de 400 caracteres, el cargo total se calcula de la siguiente manera:
Cache Creation cost:
250,000 input characters x ($0.00125 / 1000) = $0.3125 input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached chacater inputs
2,000 total character inputs * ($0.00125 / 1000) = $.0025 character input cost
5,000,000 total cached character inputs * ($0.0003125 / 1000) = $1.5625 cached input cost
$.0025 chacater input cost + $1.5625 cached input cost = $1.565 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
.3125 cached input cost + 0.5625 cached storage cost + $1.565 input cost + $0.03 output cost = $2.47 total cost.
Ejemplo de cálculo de costos
Si un usuario envía cinco solicitudes diferentes al modelo de Bison de texto PaLM, y cada solicitud tiene una entrada de 200 caracteres y un resultado de 400 caracteres, el cargo total se calcula de la siguiente manera:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelos de socios
Los modelos de socios son una lista seleccionada de modelos de IA generativa desarrollados por Socios de Google. Los modelos de socios se ofrecen como APIs administradas. Para ver más información, consulta Descripción general de los modelos de socios. En la siguiente tabla, se indican los detalles de precios de los modelos de socios de Google:
Los modelos de Claude de Anthropic
Modelo | Precios |
---|---|
Claude 3.5 Sonnet | Entrada: $3 por millón de tokens Salida: $15 por millón de tokens |
Claude 3 Opus | Entrada: $15 por millón de tokens Salida: $75 por millón de tokens |
Claude 3 Haiku | Entrada: $0.25 por millón de tokens Salida: $1.25 por millón de tokens |
Claude 3 Sonnet | Entrada: $3 por millón de tokens Salida: $15 por millón de tokens |
Modelos de Mistral AI
Modelo | Precios |
---|---|
Mistral Large (2407) | Entrada: $3 por millón de tokens Salida: $9 por millón de tokens |
Mistral Nemo | Entrada: $0.30 por millón de tokens Salida: $0.30 por millón de tokens |
Codestral | Entrada: $1 por millón de tokens Salida: $3 por millón de tokens |