Precios de Vertex AI

Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.

En esta página se detallan los precios de la IA generativa en Vertex AI. Para obtener más información sobre el resto de los precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.

Modelos básicos de Google

Multimodal

Con los modelos multimodales de Vertex AI, puedes introducir texto o elementos multimedia (imágenes y vídeos). La entrada de texto se cobra cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y no se incluyen los espacios en blanco, lo que resulta en aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 €) se redondean a un céntimo. La entrada de contenido multimedia se cobra por imagen o por segundo (vídeo).

Modelo Función Tipo Precio
( =< ventana contextual de 128.000)
Precio para contexto largo
( > ventana de contexto de 128.000)
Gemini 1.5 Flash Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,0001315 USD por imagen
0,0001315 USD por segundo
0,000125 USD por cada 1000 caracteres
0,0000125 USD por segundo
0,000263 USD por imagen
0,000263 USD por segundo
0,00025 USD por cada 1000 caracteres
0,000025 USD por segundo
Salida de texto 0,000375 USD por 1000 caracteres 0,00075 USD por cada 1000 caracteres
Gemini 1.5 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,001315 USD por imagen
0,001315 USD por segundo
0,00125 USD por cada 1000 caracteres
0,000125 USD por segundo
0,00263 USD por imagen
0,00263 USD por segundo
0,0025 USD por cada 1000 caracteres
0,00025 USD por segundo
Salida de texto 0,00375 USD por cada 1000 caracteres 0,0075 USD por cada 1000 caracteres
Gemini 1.0 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
0,0025 USD por imagen
0,002 USD por segundo
0,000125 USD por cada 1000 caracteres
Salida de texto 0,000375 USD por 1000 caracteres
Localización con la Búsqueda de Google Texto Solicitudes de conexión a tierra 35 USD por cada 1000 solicitudes (para un máximo de 1 millón de solicitudes al día)
Ponte en contacto con el equipo de tu cuenta si necesitas más
de 1 millón de solicitudes al día.

* Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
* Si el contexto de una consulta es superior a 128.000, se cobran todos los tokens con las tarifas de contexto más largas.
* Los modelos de Gemini están disponibles en el modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite hasta 32.000 ventanas de contexto.
* Los PDFs se facturan como entradas de imágenes, con una página de PDF que equivale a una imagen

Modelo Función Tipo Precio
Gemini 1.5 Pro Multimodal Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,00265 USD por imagen
0,00265 USD por segundo
0,0025 USD por cada 1000 caracteres
0,00025 USD por segundo
Salida de texto 0,0075 USD por cada 1000 caracteres

Almacenamiento en caché contextual

Con el almacenamiento en caché contextual, puede reducir el coste y la latencia de la generación de contenido almacenando en caché la parte de contexto del texto o los elementos multimedia que introduce en los modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la caché, que el usuario puede controlar, determina los cargos por almacenamiento en caché contextual. Los hits en caché de los datos de entrada se cobran con una tarifa reducida, "Entrada en caché", en lugar del coste de entrada normal. El tamaño de los datos del almacenamiento y de la entrada se calcula de la misma forma que los precios de entrada de Gemini.

Modelo Función Tipo Precio
( =< ventana contextual de 128.000)
Precio para contexto largo
( > ventana de contexto de 128.000)
Gemini 1.5 Pro En caché
Entrada
Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,0006575 / imagen
0,0006575 / segundo
0,000625 / 1000 caracteres
0,0000625 / segundo
0,001315 / imagen
0,001315 / segundo
0,00125 / 1000 caracteres
0,000125 / segundo
Contexto
Caché
Almacenamiento
Entrada de imagen
Entrada de vídeo
Entrada de texto
Entrada de audio
0,0011835 / imagen/h
0,0011835 / segundo/h
0,001125 / 1000 caracteres/h
0,0001125 / segundo/h

* Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
* Si el contexto de una consulta es superior a 128.000, se cobran todos los tokens con las tarifas de contexto más largas.
* La salida del modelo se factura a la frecuencia que no se aplica al almacenamiento en caché.
* Los PDFs se facturan como entradas de imágenes, con una página de PDF que equivale a una imagen

Generación de imágenes

Con la función de generación de imágenes de Vertex AI, puedes generar imágenes nuevas y editarlas a partir de las peticiones de texto que proporciones, o bien editar solo partes de las imágenes mediante un área de máscara que definas, además de muchas otras funciones.

Modelo Función Description Entrada Salida Precio
Imagen Generación de imágenes Generar una imagen Mensaje de texto Imagen 0,020 USD por imagen
Edición de imágenes Editar una imagen sin máscara o usando máscara Petición de imagen o texto Imagen 0,020 USD por imagen
Escalado Aumenta la resolución de una imagen generada a 2K y 4K Imagen Imagen 0,003 USD por imagen
Ajustes Habilita un "asunto" proporcionado por el usuario para que se utilice en las peticiones de Imagen (formación con pocas tomas) Sujeto(s) con identificador de texto y 4-8 imágenes por sujeto Modelo ajustado (después del entrenamiento con temas proporcionados por los usuarios) USD por hora de nodo (precios del entrenamiento personalizado de Vertex AI)
Subtítulos visuales Generar un título de texto corto o largo para una imagen Imagen Título de texto 0,0015 €/imagen
Preguntas y respuestas visuales Proporcionar una respuesta basada en una pregunta que haga referencia a una imagen. Petición de imagen o texto Respuesta de texto 0,0015 €/imagen

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.

API Multimodal Embeddings

Modelo Función Description Entrada Salida Precio
inserción multimodal Incrustaciones para multimodal: texto Genera inserciones utilizando texto como entrada Texto Incrustaciones 0,0002 USD por entrada de 1000 caracteres
Incrustaciones para multimodal: imagen Genera inserciones utilizando una imagen como entrada Imagen Incrustaciones 0,0001 USD por entrada de imagen
Incrustaciones para multimodal: vídeo Vídeo Plus Vídeo Inserciones (hasta 15 por minuto de vídeo) 0,0020 USD por segundo de vídeo
Incrustaciones para multimodal: vídeo Estándar de vídeo Vídeo Incrustaciones (hasta 8 inserciones por minuto de vídeo) 0,0010 USD por segundo de vídeo
Incrustaciones para multimodal: vídeo Conceptos básicos del vídeo Vídeo Incrustaciones (hasta 4 inserciones por minuto de vídeo) 0,0005 USD por segundo de vídeo

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.

Generación de texto

La IA generativa en Vertex AI se cobra por cada 1000 caracteres de entrada (petición) y por cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF‐8 y no se tienen en cuenta los espacios en blanco. Durante la fase de vista previa, los cargos tienen un 100% de descuento. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 USD) se redondean a un céntimo.

Modelo Tipo Region Precio por cada 1000 caracteres
PaLM 2 para texto (Text Bison) Entrada Mundial
  • Solicitudes online: 0,00025 USD
  • Solicitudes por lotes: 0,00020 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD
  • Solicitudes por lotes: 0,0004 USD
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
Refuerzo del aprendizaje a partir de comentarios de personas us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
PaLM 2 para el texto 32k (Text Bison 32k) Entrada Mundial
  • Solicitudes online: 0,00025 USD
  • Solicitudes por lotes: 0,00020 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD
  • Solicitudes por lotes: 0,0004 USD
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
PaLM 2 para texto
(Texto unicornio)
Entrada Mundial
  • Solicitudes online: 0,0025 USD
  • Solicitudes por lotes: 0,0020 USD
Salida Mundial
  • Solicitudes online: 0,0075 USD
  • Solicitudes por lotes: 0,0060 USD
PaLM 2 para Chat (Chat Bison) Entrada Mundial
  • Solicitudes online: 0,00025 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
Refuerzo del aprendizaje a partir de comentarios de personas us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
PaLM 2 para Chat 32k (Chat Bison 32k) Entrada Mundial
  • Solicitudes online: 0,00025 USD*
Salida Mundial
  • Solicitudes online: 0,0005 USD*
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
Incrustaciones de texto Entrada Mundial
  • Solicitudes online: 0,000025 USD
  • Solicitudes por lotes: 0,00002 USD
Salida Mundial
  • Solicitudes online: sin coste
  • Solicitudes por lotes: sin coste
Codey para la generación de código Entrada Mundial
  • Solicitudes online: 0,00025 USD
  • Solicitudes por lotes: 0,00020 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD
  • Solicitudes por lotes: 0,0004 USD
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
Codey para la generación de código 32k Entrada Mundial
  • Solicitudes online: 0,00025 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
Codey para chat de código Entrada Mundial
  • Solicitudes online: 0,00025 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
Codey para Code Chat 32k Entrada Mundial
  • Solicitudes online: 0,00025 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD
Sintonización supervisada us‐central1
europe‐west4
Precios del entrenamiento personalizado de Vertex AI por hora de nodo
Codey para completar el código Entrada Mundial
  • Solicitudes online: 0,00025 USD
Salida Mundial
  • Solicitudes online: 0,0005 USD

Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.

Ejemplo de cálculo de costes

Si un usuario envía cinco solicitudes independientes al modelo PaLM Text Bison, y cada solicitud tiene una entrada de 200 caracteres y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modelos de partners

Los modelos de partners son una lista seleccionada de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta Descripción general de los modelos de partners. En la siguiente tabla se muestran los precios detallados de los modelos de partners de Google:

Modelos Claude 3 de Anthropic

Modelo Precios
Claude 3 Opus Entrada: 15 USD por millón de tokens
Resultado: 75 USD por millón de tokens
Soneto Entrada: 3 USD por millón de tokens
Resultado: 15 USD por millón de tokens
Claude 3 Haiku Entrada: 0,25 USD por millón de tokens
Resultado: 1,25 USD por millón de tokens

Solicitar un presupuesto personalizado

Gracias al modelo de pago por uso de Google Cloud, solo pagas por los servicios que usas. Ponte en contacto con nuestro equipo de Ventas para solicitar un presupuesto personalizado para tu empresa.
Contactar con Ventas