Precios de Vertex AI

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

En esta página se indican los precios de la IA generativa en Vertex AI. Para obtener información sobre el resto de los precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.

Modelos de Google

Gemini

Con los modelos multimodales de Vertex AI, puedes introducir texto o contenido multimedia (imágenes y vídeos). La entrada de texto se cobra por cada 1000 caracteres de entrada (petición) y por cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y no se tienen en cuenta los espacios en blanco, lo que da como resultado unos 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 USD) se redondean a un céntimo. La entrada de contenido multimedia se cobra por imagen o por segundo (vídeo).

Modelo Función Tipo Precio
( =< 128.000 tokens de entrada)
Precio
(> 128.000 tokens de entrada)
Gemini 1.5 Flash Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,00002 USD por imagen
0,00002 USD por segundo
0,00001875 USD por cada 1000 caracteres
0,000002 USD por segundo
0,00004 USD por imagen
0,00004 USD por segundo
0,0000375 USD por cada 1000 caracteres
0,000004 USD por segundo
Salida de texto 0,000075 USD por cada 1000 caracteres 0,00015 USD por cada 1000 caracteres
Perfeccionamiento* Token de entrenamiento 8 USD/millones de tokens
Gemini 1.5 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,00032875 USD por imagen
0,00032875 USD por segundo
0,0003125 USD por cada 1000 caracteres
0,00003125 USD por segundo
0,0006575 USD por imagen
0,0006575 USD por segundo
0,000625 USD por cada 1000 caracteres
0,0000625 USD por segundo
Salida de texto 0,00125 USD por cada 1000 caracteres 0,0025 USD por cada 1000 caracteres
Perfeccionamiento* Token de entrenamiento 80 USD/millones de tokens
Gemini 1.0 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
0,0025 USD por imagen
0,002 USD por segundo
0,000125 USD por cada 1000 caracteres
Salida de texto 0,000375 USD por cada 1000 caracteres
Base con la Búsqueda de Google Texto Solicitudes de conexión a tierra 35 USD por cada 1000 solicitudes (hasta 1 millón de solicitudes al día).
Ponte en contacto con el equipo de tu cuenta si necesitas más
de 1 millón de solicitudes al día.

* Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
* Si el contexto de una consulta es superior a 128.000, todos los tokens se cobran a tarifas de contexto largas.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite ventanas de contexto de hasta 32K.
* Los PDFs se facturan como entrada de imágenes, con una página en PDF equivalente a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* Acceso a la Búsqueda de Google: si utilizas la recuperación dinámica para optimizar los costes, solo se te cobrará por Grounding con la Búsqueda de Google las solicitudes que contengan al menos una URL de referencia de base de la Web. Los costes de Gemini siempre se aplican.

Imagen

Con Imagen en Vertex AI, puedes generar imágenes novedosas y editarlas a partir de peticiones de texto que proporciones, o bien editar solo partes de las imágenes usando un área de máscara que definas junto con muchas otras funciones.

Modelo Función Descripción Entrada Salida Precio
Imagen 3 Generación de imágenes Generar una imagen Petición de texto Imagen 0,04 USD por imagen
Imagen 3 rápida Generación de imágenes Generar una imagen Petición de texto Imagen 0,02 USD por imagen
Imagen 2, Imagen Generación de imágenes Generar una imagen Petición de texto Imagen 0,020 USD por imagen
Edición de imágenes Editar una imagen usando el enfoque sin máscara o con máscara Petición de imagen o texto Imagen 0,020 USD por imagen
Mejora de la resolución Aumenta la resolución de una imagen generada a 2K y 4K Imagen Imagen 0,003 USD por imagen
Ajustes Habilitar un "asunto" proporcionado por el usuario para usarlo en las peticiones de Imagen (formación de poca toma) Sujetos con identificador de texto y entre 4 y 8 imágenes por asunto Modelo ajustado (después de entrenarse con los sujetos proporcionados por los usuarios) Coste por hora de nodo (precios del entrenamiento personalizado de Vertex AI)
Subtítulos visuales Generar un título de texto largo o corto para una imagen Imagen Título de texto 0,0015 USD/imagen
Preguntas y respuestas visuales Proporciona una respuesta basada en una pregunta que haga referencia a una imagen Petición de imagen o texto Respuesta de texto 0,0015 USD/imagen

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Inserción

Modelo Función Descripción Entrada Salida Precio
inserción multimodal Incrustaciones para multimodal: texto Generar incrustaciones usando texto como entrada Texto Incrustaciones 0,0002 USD por entrada de 1000 caracteres
Incrustaciones para multimodales: imagen Generar incrustaciones usando imágenes como entrada Imagen Incrustaciones 0,0001 USD por entrada de imagen
Incrustaciones para multimodal: Video Plus Vídeo plus Vídeo Incrustaciones (hasta 15 inserciones por minuto de vídeo) 0,0020 USD por segundo de vídeo
Incrustaciones para multimodales: estándar de vídeo Estándar de vídeo Vídeo Incrustaciones (hasta 8 inserciones por minuto de vídeo) 0,0010 USD por segundo de vídeo
Incrustaciones para multimodales: aspectos esenciales de vídeo Imprescindibles para vídeos Vídeo Incrustaciones (hasta 4 incrustaciones por minuto de vídeo) 0,0005 USD por segundo de vídeo
Modelo Tipo Region Precio por cada 1000 caracteres
Incrustaciones de texto Entrada Global
  • Solicitudes online: 0,000025 USD
  • Solicitudes en lote: 0,00002 USD
Salida Global
  • Solicitudes online: sin coste
  • Solicitudes por lotes: sin coste

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Completar código

La IA generativa de Vertex AI cobra por cada 1000 caracteres de entrada (petición) y por cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan según los puntos de código UTF-8 y no se tienen en cuenta los espacios en blanco. Durante la fase de vista previa, se aplica un descuento del 100% a los cargos. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 USD) se redondean a un céntimo.

Modelo Tipo Region Precio por cada 1000 caracteres
Codey para completar el código Entrada Global
  • Solicitudes online: 0,00025 USD
Salida Global
  • Solicitudes online: 0,0005 USD

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Traducción (texto)

Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones de LLMs tienden a ser más fluidas y humanas que los modelos de traducción clásicos, pero su compatibilidad con los idiomas es más limitada. (Más información)

Modelo Método Uso Precio por millón de caracteres
LLM Traducción de textos (versión preliminar)* El número de caracteres de entrada al mes

10 USD por millón de caracteres*

El número de caracteres de salida al mes

10 USD por millón de caracteres*

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
* El precio se calcula por cada carácter que procesa el modelo. Para obtener más información sobre el recuento de caracteres, consulta caracteres que se cobran.

Almacenamiento en caché de contexto

Con el almacenamiento en caché de contexto, puedes reducir el coste del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido, ya que almacena en caché la parte de contexto del texto o del contenido multimedia de entrada en los modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la caché, que puede controlar el usuario, determina los cargos por "almacenamiento en caché de contexto". Al crear un contexto almacenado en caché, se cobrará a los usuarios el coste estándar del token de entrada. Los hits en caché sobre los datos de entrada se cobran a una tarifa reducida, denominada "entrada en caché", en lugar del coste de entrada normal. El volumen de datos tanto del almacenamiento como de entrada se calcula de la misma forma que los precios de entrada de Gemini.

Modelo Función Tipo Precio ( =< 128.000 tokens de entrada) Precio (más de 128.000 tokens de entrada)
Gemini 1.5 Flash Entrada en caché Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,000005 por imagen
0,000005 por segundo
0,0000046875 por 1000 caracteres
0,0000005 por segundo
0,00001 por imagen
0,00001 por segundo
0,000009375 por 1000 caracteres
0,000001 por segundo
Almacenamiento en caché contextual Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,000263 / imagen/h
0,000263/ segundo/h
0,00025 / 1000 caracteres/h
0,000025 / segundo/h
Gemini 1.5 Pro Entrada en caché Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,0000821875 por imagen
0,0000821875 por segundo
0,000078125 por 1000 caracteres
0,0000078125 por segundo
0,000164375 por imagen
0,000164375 por segundo
0,00015625 por 1000 caracteres
0,000015625 por segundo
Almacenamiento en caché contextual Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,0011835 / imagen/h
0,0011835/ segundo/h
0,001125 / 1000 caracteres/h
0,0001125 / segundo/h

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

Ejemplo de cálculo de coste en caché

Si un usuario crea un contexto almacenado en caché de 250.000 caracteres con un TTL de 2 horas y,posteriormente, envía 20 solicitudes distintas al modelo Gemini 1.5 Pro durante esas 2 horas y en cada solicitud se añade una consulta de 200 caracteres al contexto almacenado en caché y a una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

Ejemplo de cálculo de coste

Si un usuario envía cinco solicitudes independientes al modelo PaLM Text Bison y cada solicitud tiene una entrada de 200 y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modelos de partners

Los modelos de partners son una selección de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta la descripción general de los modelos de partners. En las siguientes secciones se indican los precios detallados de los modelos de partners de Google.

Modelos de AI21 Lab

Modelo Precios
Jamba 1.5 grande Entrada: 2 USD por millón de tokens
Salida: 8 USD por millón de tokens
Jamba 1.5 mini Entrada: 0,20 USD por millón de tokens
Salida: 0,40 USD por millón de tokens

Modelos de Anthropic Claude

Modelo Precios
Haiku Claude 3.5 Entrada: 1,00 USD por millón de tokens
Salida: 5,00 USD por millón de tokens
Claude 3.5 Sonnet v2 Entrada: 3 USD por millón de tokens
Salida: 15 USD por millón de tokens
Claude 3.5 Sonnet Entrada: 3 USD por millón de tokens
Salida: 15 USD por millón de tokens
Claude 3 Haiku Entrada: 0,25 USD por millón de tokens
Salida: 1,25 USD por millón de tokens
Claude 3 Sonnet Entrada: 3 USD por millón de tokens
Salida: 15 USD por millón de tokens
Claude 3 Opus Entrada: 15 USD por millón de tokens
Salida: 75 USD por millón de tokens

Modelos de llama de Meta

Modelo Precios
Llama 3.1 405B Entrada: 5 USD por millón de tokens
Salida: 16 USD por millón de tokens

Modelos de Mistral AI

Modelo Precios
Mistral Grande (2407) Entrada: 2 USD por millón de tokens
Salida: 6 USD por millón de tokens
Mistral Nemo Entrada: 0,15 USD por millón de tokens
Salida: 0,15 USD por millón de tokens
Codestral Entrada: 0,20 USD por millón de tokens
Salida: 0,60 USD por millón de tokens

Solicita un presupuesto personalizado

Gracias al modelo de pago por uso de Google Cloud, solo pagas por los servicios que usas. Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu empresa.
Contactar con Ventas