Precios de Vertex AI

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

En esta página se incluyen los precios de la IA generativa en Vertex AI. Para consultar los precios de otros servicios de Vertex AI, incluidos ML Platform y los servicios de MLOps, consulta la página de precios de Vertex AI.

Modelos de Google

Gemini

Con los modelos multimodales de Vertex AI, puedes introducir texto o contenido multimedia (imágenes o vídeos). Los textos se cobran por cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y los espacios en blanco se excluyen del recuento, lo que da como resultado aproximadamente 4 caracteres por token. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo ($0,01) se redondean a un céntimo. La entrada de contenido multimedia se factura por imagen o por segundo (vídeo).

Modelo Función Tipo Precio
( =< 128 K tokens de entrada)
Precio:
(más de 128 K tokens de entrada)
Gemini 1.5 Flash Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,00002 USD por imagen
0,00002 USD por segundo
0,00001875 USD por 1000 caracteres
0,000002 USD por segundo
0,00004 USD por imagen
0,00004 USD por segundo
0,0000375 USD por 1000 caracteres
0,000004 USD por segundo
Salida de texto 0,000075 USD / 1000 caracteres 0,00015 USD / 1000 caracteres
Afinación* Token de formación 8 USD por M de tokens
Gemini 1.5 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,00032875 USD por imagen
0,00032875 USD por segundo
0,0003125 USD por 1000 caracteres
0,00003125 USD por segundo
0,0006575 USD por imagen
0,0006575 USD por segundo
0,000625 USD por 1000 caracteres
0,0000625 USD por segundo
Salida de texto 0,00125 USD por 1000 caracteres 0,0025 USD por 1000 caracteres
Afinación* Token de formación 80 $ / M tokens
Gemini 1.0 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
0,0025 USD por imagen
0,002 USD por segundo
0,000125 USD por 1000 caracteres
Salida de texto 0,000375 USD / 1000 caracteres
La Búsqueda de Google te conecta con la realidad Texto Solicitudes de información básica 35 USD por cada 1000 solicitudes (hasta 1 M de solicitudes al día).
Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de solicitudes al día.

* Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* Si el contexto de una consulta es más largo de 128 K, se cobrará por todos los tokens según las tarifas de contexto largo.
* Los modelos de Gemini están disponibles en modo por lotes con un descuento del 50 %.
* Gemini 1.0 Pro solo admite una ventana de contexto de hasta 32.000 tokens.
* Los PDFs se facturan como entrada de imagen, y una página de PDF equivale a una imagen.
* El punto de conexión del modelo optimizado tiene el mismo precio de predicción que el modelo base.
* Anclaje con la Búsqueda de Google: si usas la recuperación dinámica para optimizar los costes, solo se te cobrará por la función de anclaje con la Búsqueda de Google en las solicitudes que incluyan al menos una URL de asistencia de anclaje de la Web en su respuesta. Los costes de Gemini siempre se aplican.

Imagen

Con Imagen en Vertex AI, puedes generar imágenes nuevas y editar imágenes en función de las peticiones de texto que proporciones, o bien editar solo partes de las imágenes mediante una máscara que definas junto con un montón de otras funciones.

Modelo Función Descripción Entrada Salida Precio
Imagen 3 Generación de imágenes Genera una imagen Petición de texto Imagen 0,04 USD por imagen
Imagen 3 Rápido Generación de imágenes Genera una imagen Petición de texto Imagen 0,02 USD por imagen
Imagen 2, Imagen Generación de imágenes Genera una imagen Petición de texto Imagen 0,020 USD por imagen
Edición de imágenes Edita una imagen con la opción sin máscara o con máscara Petición de imagen o texto Imagen 0,020 USD por imagen
Escalado Aumenta la resolución de una imagen generada a 2K y 4K Imagen Imagen 0,003 USD por imagen
Ajustes Permite que el usuario proporcione un "asunto" para que se use en las peticiones de Imagen (entrenamiento con pocas muestras) Sujeto con identificador de texto y entre 4 y 8 imágenes por sujeto Modelo perfeccionado (tras entrenarlo con los temas proporcionados por el usuario) $ por hora de nodo (precio de entrenamiento personalizado de Vertex AI)
Subtítulos visuales Genera un pie de foto de texto corto o largo Imagen Título de texto 0,0015 USD por imagen
Preguntas y respuestas visuales Proporciona una respuesta basada en una pregunta que hace referencia a una imagen Petición de imagen o texto Respuesta de texto 0,0015 USD por imagen

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Inserción

Modelo Función Descripción Entrada Salida Precio
inserción multimodal Embeddings para el contenido multimodal: texto Genera inserciones a partir de texto como entrada Texto Inserciones 0,0002 USD por 1000 caracteres introducidos
Incrustaciones para contenido multimodal: imagen Generar embeddings usando una imagen como entrada Imagen Inserciones 0,0001 USD por imagen de entrada
Insertaciones para contenido multimodal: vídeo más Video Plus Vídeo Insertaciones (hasta 15 insertaciones por minuto de vídeo) 0,0020 USD por segundo de vídeo
Inserciones para contenido multimodal: estándar de vídeo Vídeo estándar Vídeo Inserciones (hasta 8 inserciones por minuto de vídeo) 0,0010 USD por segundo de vídeo
Embeddings para contenido multimodal: Vídeo esencial Video esencial Vídeo Insertaciones (hasta 4 por minuto de vídeo) 0,0005 USD por segundo de vídeo
Modelo Tipo Region Precio por cada 1000 caracteres
Embeddings de texto Entrada Global
  • Solicitudes online: 0,000025 USD
  • Solicitudes en lote: 0,00002 USD
Salida Global
  • Solicitud online: sin coste
  • Solicitudes en lote: sin coste

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Finalización de código

La IA generativa en Vertex AI se cobra por cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan según los puntos de código UTF-8 y los espacios en blanco no se incluyen en el recuento. Durante la fase de vista previa, los cargos se descuentan al 100 %. Las solicitudes de predicción que dan lugar a respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo ($0,01) se redondean a un céntimo.

Modelo Tipo Region Precio por cada 1000 caracteres
Codey para la finalización de código Entrada Global
  • Solicitudes online: 0,00025 USD
Salida Global
  • Solicitudes online: 0,0005 USD

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Traducción (texto)

Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones de los modelos de lenguaje extenso tienden a ser más fluidas y naturales que las de los modelos de traducción clásicos, pero su compatibilidad con idiomas es más limitada. Más información

Modelo Método Uso Precio por millón de caracteres
LLM Traducción de texto (Vista previa)* Número de caracteres de entrada al mes

10 USD por millón de caracteres*

Número de caracteres de salida al mes

10 USD por millón de caracteres*

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKUs de Cloud Platform.
* El precio se calcula por cada carácter que procese el modelo. Para obtener más información sobre el recuento de caracteres, consulta Facturación de caracteres

Almacenamiento en caché del contexto

Con el almacenamiento en caché del contexto, puedes reducir el coste del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido almacenando en caché la parte del contexto de tu texto de entrada o tus medios en modelos de Gemini. El tiempo que los datos se almacenan en la caché, que puede ser controlado por el usuario, determina los cargos de "Almacenamiento en caché de contexto". Al crear un contexto en caché, se les cobrará a los usuarios el coste estándar del token de entrada. Los aciertos en la caché de los datos de entrada se cobran a un precio reducido, "Entrada en caché", en lugar del coste normal de entrada. El tamaño de los datos, tanto de almacenamiento como de entrada, se calcula de la misma forma que el precio de entrada de Gemini.

Modelo Función Tipo Precio ( <128 K tokens de entrada) Precio (> 128 K tokens de entrada)
Gemini 1.5 Flash Entrada almacenada en caché Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,000005 USD por imagen
0,000005 USD por segundo
0,0000046875 USD por 1000 caracteres
0,0000005 USD por segundo
0,00001 USD/imagen
0,00001 USD/segundo
0,000009375 USD / 1000 caracteres
0,000001 USD/segundo
Almacenamiento en caché de contexto Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,000263 por imagen/hora
0,000263 por segundo/hora
0,00025 por 1000 caracteres/hora
0,000025 por segundo/hora
Gemini 1.5 Pro Entrada almacenada en caché Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,0000821875 USD por imagen
0,0000821875 USD por segundo
0,000078125 USD por 1000 caracteres
0,0000078125 USD por segundo
0,000164375 / imagen
0,000164375 / segundo
0,00015625 / 1000 caracteres
0,000015625 / segundo
Almacenamiento en caché de contexto Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,0011835 por imagen/hora
0,0011835 por segundo/hora
0,001125 por 1000 caracteres/hora
0,0001125 por segundo/hora

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Ejemplo de cálculo de coste almacenado en caché

Si un usuario crea un contexto en caché de 250.000 caracteres con un TTL de 2 horas y, posteriormente, envía 20 solicitudes independientes al modelo Gemini 1.5 Pro durante esas 2 horas, y cada solicitud tiene una consulta de 200 caracteres que se añade al contexto en caché y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

Cálculo de costes de ejemplo

Si un usuario envía cinco solicitudes independientes al modelo PaLM Text Bison y cada solicitud tiene una entrada de 200 caracteres y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modelos de partners

Los modelos de partners son una lista seleccionada de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta el artículo Introducción a los modelos de partners. En las siguientes secciones se incluyen los detalles de los precios de los modelos de partners de Google.

Modelos de AI21 Lab

Modelo Precios
Jamba 1,5 grande Entrada: 2 $ por millón de tokens
Salida: 8 $ por millón de tokens
Jamba 1,5 Mini Entrada: 0,20 USD por millón de tokens
Salida: 0,40 USD por millón de tokens

Modelos Claude de Anthropic

Modelo Precios
Claude 3.5 Haiku Entrada: 0,80 USD por millón de tokens
Salida: 4,00 USD por millón de tokens
Claude 3.5 Sonnet v2 Entrada: 3 $ por millón de tokens
Salida: 15 $ por millón de tokens
Claude 3.5 Sonnet Entrada: 3 $ por millón de tokens
Salida: 15 $ por millón de tokens
Claude 3 Haiku Entrada: 0,25 USD por millón de tokens
Salida: 1,25 USD por millón de tokens
Claude 3 Sonnet Entrada: 3 $ por millón de tokens
Salida: 15 $ por millón de tokens
Claude 3 Opus Entrada: 15 USD por millón de tokens
Salida: 75 USD por millón de tokens

Modelos de Llama de Meta

Modelo Precios
Llama 3,1 405 B Entrada: 5,00 $ por millón de tokens
Salida: 16,00 $ por millón de tokens

Modelos de Mistral AI

Modelo Precios
Mistral Large (24,11) Entrada: 2,00 USD por millón de tokens
Salida: 6,00 USD por millón de tokens
Mistral grande (24,07) Entrada: 2,00 USD por millón de tokens
Salida: 6,00 USD por millón de tokens
Mistral Nemo Entrada: 0,15 USD por millón de tokens
Salida: 0,15 USD por millón de tokens
Codestral (24,05 %) Entrada: 0,20 USD por millón de tokens
Salida: 0,60 USD por millón de tokens

Solicita un presupuesto personalizado

Gracias al modelo de pago por uso de Google Cloud, solo pagas por los servicios que usas. Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu empresa.
Contactar con Ventas