Precios de Vertex AI
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
En esta página se detallan los precios de la IA generativa en Vertex AI. Para obtener más información sobre el resto de los precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.
Modelos básicos de Google
Multimodal
Con los modelos multimodales de Vertex AI, puedes introducir texto o elementos multimedia (imágenes y vídeos). La entrada de texto se cobra cada 1000 caracteres de entrada (solicitud) y cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y no se incluyen los espacios en blanco, lo que resulta en aproximadamente 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 €) se redondean a un céntimo. La entrada de contenido multimedia se cobra por imagen o por segundo (vídeo).
Modelo | Función | Tipo | Precio ( =< ventana contextual de 128.000) |
Precio para contexto largo ( > ventana de contexto de 128.000) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,0001315 USD por imagen 0,0001315 USD por segundo 0,000125 USD por cada 1000 caracteres 0,0000125 USD por segundo |
0,000263 USD por imagen 0,000263 USD por segundo 0,00025 USD por cada 1000 caracteres 0,000025 USD por segundo |
Salida de texto | 0,000375 USD por 1000 caracteres | 0,00075 USD por cada 1000 caracteres | ||
Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,001315 USD por imagen 0,001315 USD por segundo 0,00125 USD por cada 1000 caracteres 0,000125 USD por segundo |
0,00263 USD por imagen 0,00263 USD por segundo 0,0025 USD por cada 1000 caracteres 0,00025 USD por segundo |
Salida de texto | 0,00375 USD por cada 1000 caracteres | 0,0075 USD por cada 1000 caracteres | ||
Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto |
0,0025 USD por imagen 0,002 USD por segundo 0,000125 USD por cada 1000 caracteres |
|
Salida de texto | 0,000375 USD por 1000 caracteres | |||
Localización con la Búsqueda de Google | Texto | Solicitudes de conexión a tierra | 35 USD por cada 1000 solicitudes (para un máximo de 1 millón de solicitudes al día) Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de solicitudes al día. |
* Los precios se indican en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
* Si el contexto de una consulta es superior a 128.000, se cobran todos los tokens con las tarifas de contexto más largas.
* Los modelos de Gemini están disponibles en el modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite hasta 32.000 ventanas de contexto.
* Los PDFs se facturan como entradas de imágenes, con una página de PDF que equivale a una imagen
Modelo | Función | Tipo | Precio |
---|---|---|---|
Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,00265 USD por imagen 0,00265 USD por segundo 0,0025 USD por cada 1000 caracteres 0,00025 USD por segundo |
Salida de texto | 0,0075 USD por cada 1000 caracteres |
Almacenamiento en caché contextual
Con el almacenamiento en caché contextual, puede reducir el coste y la latencia de la generación de contenido almacenando en caché la parte de contexto del texto o los elementos multimedia que introduce en los modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la caché, que el usuario puede controlar, determina los cargos por almacenamiento en caché contextual. Los hits en caché de los datos de entrada se cobran con una tarifa reducida, "Entrada en caché", en lugar del coste de entrada normal. El tamaño de los datos del almacenamiento y de la entrada se calcula de la misma forma que los precios de entrada de Gemini.
Modelo | Función | Tipo | Precio ( =< ventana contextual de 128.000) |
Precio para contexto largo ( > ventana de contexto de 128.000) |
---|---|---|---|---|
Gemini 1.5 Pro | En caché Entrada |
Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,0006575 / imagen 0,0006575 / segundo 0,000625 / 1000 caracteres 0,0000625 / segundo |
0,001315 / imagen 0,001315 / segundo 0,00125 / 1000 caracteres 0,000125 / segundo |
Contexto Caché Almacenamiento |
Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,0011835 / imagen/h 0,0011835 / segundo/h 0,001125 / 1000 caracteres/h 0,0001125 / segundo/h |
* Los precios se indican en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
* Si el contexto de una consulta es superior a 128.000, se cobran todos los tokens con las tarifas de contexto más largas.
* La salida del modelo se factura a la frecuencia que no se aplica al almacenamiento en caché.
* Los PDFs se facturan como entradas de imágenes, con una página de PDF que equivale a una imagen
Generación de imágenes
Con la función de generación de imágenes de Vertex AI, puedes generar imágenes nuevas y editarlas a partir de las peticiones de texto que proporciones, o bien editar solo partes de las imágenes mediante un área de máscara que definas, además de muchas otras funciones.
Modelo | Función | Description | Entrada | Salida | Precio |
---|---|---|---|---|---|
Imagen | Generación de imágenes | Generar una imagen | Mensaje de texto | Imagen | 0,020 USD por imagen |
Edición de imágenes | Editar una imagen sin máscara o usando máscara | Petición de imagen o texto | Imagen | 0,020 USD por imagen | |
Escalado | Aumenta la resolución de una imagen generada a 2K y 4K | Imagen | Imagen | 0,003 USD por imagen | |
Ajustes | Habilita un "asunto" proporcionado por el usuario para que se utilice en las peticiones de Imagen (formación con pocas tomas) | Sujeto(s) con identificador de texto y 4-8 imágenes por sujeto | Modelo ajustado (después del entrenamiento con temas proporcionados por los usuarios) | USD por hora de nodo (precios del entrenamiento personalizado de Vertex AI) | |
Subtítulos visuales | Generar un título de texto corto o largo para una imagen | Imagen | Título de texto | 0,0015 €/imagen | |
Preguntas y respuestas visuales | Proporcionar una respuesta basada en una pregunta que haga referencia a una imagen. | Petición de imagen o texto | Respuesta de texto | 0,0015 €/imagen |
Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
API Multimodal Embeddings
Modelo | Función | Description | Entrada | Salida | Precio |
---|---|---|---|---|---|
inserción multimodal | Incrustaciones para multimodal: texto | Genera inserciones utilizando texto como entrada | Texto | Incrustaciones | 0,0002 USD por entrada de 1000 caracteres |
Incrustaciones para multimodal: imagen | Genera inserciones utilizando una imagen como entrada | Imagen | Incrustaciones | 0,0001 USD por entrada de imagen | |
Incrustaciones para multimodal: vídeo | Vídeo Plus | Vídeo | Inserciones (hasta 15 por minuto de vídeo) | 0,0020 USD por segundo de vídeo | |
Incrustaciones para multimodal: vídeo | Estándar de vídeo | Vídeo | Incrustaciones (hasta 8 inserciones por minuto de vídeo) | 0,0010 USD por segundo de vídeo | |
Incrustaciones para multimodal: vídeo | Conceptos básicos del vídeo | Vídeo | Incrustaciones (hasta 4 inserciones por minuto de vídeo) | 0,0005 USD por segundo de vídeo |
Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
Generación de texto
La IA generativa en Vertex AI se cobra por cada 1000 caracteres de entrada (petición) y por cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan mediante puntos de código UTF‐8 y no se tienen en cuenta los espacios en blanco. Durante la fase de vista previa, los cargos tienen un 100% de descuento. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 USD) se redondean a un céntimo.
Modelo | Tipo | Region | Precio por cada 1000 caracteres |
---|---|---|---|
PaLM 2 para texto (Text Bison) | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
Refuerzo del aprendizaje a partir de comentarios de personas | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
PaLM 2 para el texto 32k (Text Bison 32k) | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
PaLM 2 para texto (Texto unicornio) |
Entrada | Mundial |
|
Salida | Mundial |
|
|
PaLM 2 para Chat (Chat Bison) | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
Refuerzo del aprendizaje a partir de comentarios de personas | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
PaLM 2 para Chat 32k (Chat Bison 32k) | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
Incrustaciones de texto | Entrada | Mundial |
|
Salida | Mundial |
|
|
Codey para la generación de código | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
Codey para la generación de código 32k | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
Codey para chat de código | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
Codey para Code Chat 32k | Entrada | Mundial |
|
Salida | Mundial |
|
|
Sintonización supervisada | us‐central1 europe‐west4 |
Precios del entrenamiento personalizado de Vertex AI por hora de nodo | |
Codey para completar el código | Entrada | Mundial |
|
Salida | Mundial |
|
Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en los SKU de Cloud Platform.
Ejemplo de cálculo de costes
Si un usuario envía cinco solicitudes independientes al modelo PaLM Text Bison, y cada solicitud tiene una entrada de 200 caracteres y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelos de partners
Los modelos de partners son una lista seleccionada de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta Descripción general de los modelos de partners. En la siguiente tabla se muestran los precios detallados de los modelos de partners de Google:
Modelos Claude 3 de Anthropic
Modelo | Precios |
---|---|
Claude 3 Opus | Entrada: 15 USD por millón de tokens Resultado: 75 USD por millón de tokens |
Soneto | Entrada: 3 USD por millón de tokens Resultado: 15 USD por millón de tokens |
Claude 3 Haiku | Entrada: 0,25 USD por millón de tokens Resultado: 1,25 USD por millón de tokens |