Precios de Vertex AI
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
En esta página se incluyen los precios de la IA generativa en Vertex AI. Para consultar los precios de otros servicios de Vertex AI, incluidos ML Platform y los servicios de MLOps, consulta la página de precios de Vertex AI.
Modelos de Google
Gemini
Con los modelos multimodales de Vertex AI, puedes introducir texto o contenido multimedia (imágenes o vídeos). Los textos se cobran por cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco se excluyen del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo ($0,01) se redondean a un céntimo. La entrada de contenido multimedia se factura por imagen o por segundo (vídeo).
Modelo | Función | Tipo | Precio ( =< 128 K tokens de entrada) |
Precio: (más de 128 K tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,00002 USD por imagen 0,00002 USD por segundo 0,00001875 USD por 1000 caracteres 0,000002 USD por segundo |
0,00004 USD por imagen 0,00004 USD por segundo 0,0000375 USD por 1000 caracteres 0,000004 USD por segundo |
Salida de texto | 0,000075 USD / 1000 caracteres | 0,00015 USD / 1000 caracteres | ||
Afinación* | Token de formación | 8 USD por M de tokens | ||
Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,00032875 USD por imagen 0,00032875 USD por segundo 0,0003125 USD por 1000 caracteres 0,00003125 USD por segundo |
0,0006575 USD por imagen 0,0006575 USD por segundo 0,000625 USD por 1000 caracteres 0,0000625 USD por segundo |
Salida de texto | 0,00125 USD por 1000 caracteres | 0,0025 USD por 1000 caracteres | ||
Afinación* | Token de formación | 80 $ / M tokens | ||
Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto |
0,0025 USD por imagen 0,002 USD por segundo 0,000125 USD por 1000 caracteres |
|
Salida de texto | 0,000375 USD / 1000 caracteres | |||
La Búsqueda de Google te conecta con la realidad | Texto | Solicitudes de información básica | 35 USD por cada 1000 solicitudes (hasta 1 M de solicitudes al día). Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de solicitudes al día. |
* Los precios se indican en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Si el contexto de una consulta es más largo de 128 K, se cobrará por todos los tokens según las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un descuento del 50 %.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32.000 tokens.
* Los PDFs se facturan como entrada de imagen, y una página de PDF equivale a una imagen.
* El punto de conexión del modelo optimizado tiene el mismo precio de predicción que el modelo base.
* Anclaje con la Búsqueda de Google: si usas la recuperación dinámica para optimizar los costes, solo se te cobrará por la función de anclaje con la Búsqueda de Google en las solicitudes que incluyan al menos una URL de asistencia de anclaje de la Web en su respuesta. Los costes de Gemini siempre se aplican.
Imagen
Con Imagen en Vertex AI, puedes generar imágenes nuevas y editar imágenes en función de las peticiones de texto que proporciones, o bien editar solo partes de las imágenes mediante una máscara que definas junto con un montón de otras funciones.
Modelo | Función | Descripción | Entrada | Salida | Precio |
---|---|---|---|---|---|
Imagen 3 | Generación de imágenes | Genera una imagen | Petición de texto | Imagen | 0,04 USD por imagen |
Imagen 3 Rápido | Generación de imágenes | Genera una imagen | Petición de texto | Imagen | 0,02 USD por imagen |
Imagen 2, Imagen | Generación de imágenes | Genera una imagen | Petición de texto | Imagen | 0,020 USD por imagen |
Edición de imágenes | Edita una imagen con la opción sin máscara o con máscara | Petición de imagen o texto | Imagen | 0,020 USD por imagen | |
Escalado | Aumenta la resolución de una imagen generada a 2K y 4K | Imagen | Imagen | 0,003 USD por imagen | |
Ajustes | Permite que el usuario proporcione un "asunto" para que se use en las peticiones de Imagen (entrenamiento con pocas muestras) | Sujeto con identificador de texto y entre 4 y 8 imágenes por sujeto | Modelo perfeccionado (tras entrenarlo con los temas proporcionados por el usuario) | $ por hora de nodo (precio de entrenamiento personalizado de Vertex AI) | |
Subtítulos visuales | Genera un pie de foto de texto corto o largo | Imagen | Título de texto | 0,0015 USD por imagen | |
Preguntas y respuestas visuales | Proporciona una respuesta basada en una pregunta que hace referencia a una imagen | Petición de imagen o texto | Respuesta de texto | 0,0015 USD por imagen |
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Inserción
Modelo | Función | Descripción | Entrada | Salida | Precio |
---|---|---|---|---|---|
inserción multimodal | Embeddings para el contenido multimodal: texto | Genera inserciones a partir de texto como entrada | Texto | Inserciones | 0,0002 USD por 1000 caracteres introducidos |
Incrustaciones para contenido multimodal: imagen | Generar embeddings usando una imagen como entrada | Imagen | Inserciones | 0,0001 USD por imagen de entrada | |
Insertaciones para contenido multimodal: vídeo más | Video Plus | Vídeo | Insertaciones (hasta 15 insertaciones por minuto de vídeo) | 0,0020 USD por segundo de vídeo | |
Inserciones para contenido multimodal: estándar de vídeo | Vídeo estándar | Vídeo | Inserciones (hasta 8 inserciones por minuto de vídeo) | 0,0010 USD por segundo de vídeo | |
Embeddings para contenido multimodal: Vídeo esencial | Video esencial | Vídeo | Insertaciones (hasta 4 por minuto de vídeo) | 0,0005 USD por segundo de vídeo |
Modelo | Tipo | Region | Precio por cada 1000 caracteres |
---|---|---|---|
Embeddings de texto | Entrada | Global |
|
Salida | Global |
|
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Finalización de código
La IA generativa en Vertex AI se cobra por cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan según los puntos de código UTF-8 y los espacios en blanco no se incluyen en el recuento. Durante la fase de vista previa, los cargos se descuentan al 100 %. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo ($0,01) se redondean a un céntimo.
Modelo | Tipo | Region | Precio por cada 1000 caracteres |
---|---|---|---|
Codey para la finalización de código | Entrada | Global |
|
Salida | Global |
|
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Traducción (texto)
Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones de los modelos de lenguaje extenso tienden a ser más fluidas y naturales que las de los modelos de traducción clásicos, pero su compatibilidad con idiomas es más limitada. Más información
Modelo | Método | Uso | Precio por millón de caracteres |
---|---|---|---|
LLM | Traducción de texto (Vista previa)* | Número de caracteres de entrada al mes |
10 USD por millón de caracteres* |
Número de caracteres de salida al mes |
10 USD por millón de caracteres* |
Los precios de esta página están en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* El precio se calcula por cada carácter que procese el modelo. Para obtener más información sobre el recuento de caracteres, consulta Facturación de caracteres
Almacenamiento en caché del contexto
Con el almacenamiento en caché del contexto, puedes reducir el coste del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido almacenando en caché la parte del contexto de tu texto de entrada o tus medios en modelos de Gemini. El tiempo que los datos se almacenan en la caché, que puede ser controlado por el usuario, determina los cargos de "Almacenamiento en caché de contexto". Al crear un contexto en caché, se les cobrará a los usuarios el coste estándar del token de entrada. Los aciertos en la caché de los datos de entrada se cobran a un precio reducido, "Entrada en caché", en lugar del coste normal de entrada. El tamaño de los datos, tanto de almacenamiento como de entrada, se calcula de la misma forma que el precio de entrada de Gemini.
Modelo | Función | Tipo | Precio ( <128 K tokens de entrada) | Precio (> 128 K tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Entrada almacenada en caché | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,000005 USD por imagen 0,000005 USD por segundo 0,0000046875 USD por 1000 caracteres 0,0000005 USD por segundo |
0,00001 USD/imagen 0,00001 USD/segundo 0,000009375 USD / 1000 caracteres 0,000001 USD/segundo |
Almacenamiento en caché de contexto | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,000263 por imagen/hora 0,000263 por segundo/hora 0,00025 por 1000 caracteres/hora 0,000025 por segundo/hora |
||
Gemini 1.5 Pro | Entrada almacenada en caché | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,0000821875 USD por imagen 0,0000821875 USD por segundo 0,000078125 USD por 1000 caracteres 0,0000078125 USD por segundo |
0,000164375 / imagen 0,000164375 / segundo 0,00015625 / 1000 caracteres 0,000015625 / segundo |
Almacenamiento en caché de contexto | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,0011835 por imagen/hora 0,0011835 por segundo/hora 0,001125 por 1000 caracteres/hora 0,0001125 por segundo/hora |
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Ejemplo de cálculo de coste almacenado en caché
Si un usuario crea un contexto en caché de 250.000 caracteres con un TTL de 2 horas y, posteriormente, envía 20 solicitudes independientes al modelo Gemini 1.5 Pro durante esas 2 horas, y cada solicitud tiene una consulta de 200 caracteres que se añade al contexto en caché y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Cálculo de costes de ejemplo
Si un usuario envía cinco solicitudes independientes al modelo PaLM Text Bison y cada solicitud tiene una entrada de 200 caracteres y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelos de partners
Los modelos de partners son una lista seleccionada de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta el artículo Introducción a los modelos de partners. En las siguientes secciones se incluyen los detalles de los precios de los modelos de partners de Google.
Modelos de AI21 Lab
Modelo | Precios |
---|---|
Jamba 1,5 grande | Entrada: 2 $ por millón de tokens Salida: 8 $ por millón de tokens |
Jamba 1,5 Mini | Entrada: 0,20 USD por millón de tokens Salida: 0,40 USD por millón de tokens |
Modelos Claude de Anthropic
Modelo | Precios |
---|---|
Claude 3.5 Haiku | Entrada: 0,80 USD por millón de tokens Salida: 4,00 USD por millón de tokens |
Claude 3.5 Sonnet v2 | Entrada: 3 $ por millón de tokens Salida: 15 $ por millón de tokens |
Claude 3.5 Sonnet | Entrada: 3 $ por millón de tokens Salida: 15 $ por millón de tokens |
Claude 3 Haiku | Entrada: 0,25 USD por millón de tokens Salida: 1,25 USD por millón de tokens |
Claude 3 Sonnet | Entrada: 3 $ por millón de tokens Salida: 15 $ por millón de tokens |
Claude 3 Opus | Entrada: 15 USD por millón de tokens Salida: 75 USD por millón de tokens |
Modelos de Llama de Meta
Modelo | Precios |
---|---|
Llama 3,1 405 B | Entrada: 5,00 $ por millón de tokens Salida: 16,00 $ por millón de tokens |
Modelos de Mistral AI
Modelo | Precios |
---|---|
Mistral Large (24,11) | Entrada: 2,00 USD por millón de tokens Salida: 6,00 USD por millón de tokens |
Mistral grande (24,07) | Entrada: 2,00 USD por millón de tokens Salida: 6,00 USD por millón de tokens |
Mistral Nemo | Entrada: 0,15 USD por millón de tokens Salida: 0,15 USD por millón de tokens |
Codestral (24,05 %) | Entrada: 0,20 USD por millón de tokens Salida: 0,60 USD por millón de tokens |