Precios de Vertex AI
Los precios de esta página están en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
En esta página se indican los precios de la IA generativa en Vertex AI. Para obtener información sobre el resto de los precios de Vertex AI, incluidos los servicios de ML Platform y MLOps, consulta la página de precios de Vertex AI.
Modelos de Google
Gemini
Con los modelos multimodales de Vertex AI, puedes introducir texto o contenido multimedia (imágenes y vídeos). La entrada de texto se cobra por cada 1000 caracteres de entrada (petición) y por cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan por puntos de código UTF-8 y no se tienen en cuenta los espacios en blanco, lo que da como resultado unos 4 caracteres por token. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 USD) se redondean a un céntimo. La entrada de contenido multimedia se cobra por imagen o por segundo (vídeo).
Modelo | Función | Tipo | Precio ( =< 128.000 tokens de entrada) |
Precio (> 128.000 tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,00002 USD por imagen 0,00002 USD por segundo 0,00001875 USD por cada 1000 caracteres 0,000002 USD por segundo |
0,00004 USD por imagen 0,00004 USD por segundo 0,0000375 USD por cada 1000 caracteres 0,000004 USD por segundo |
Salida de texto | 0,000075 USD por cada 1000 caracteres | 0,00015 USD por cada 1000 caracteres | ||
Perfeccionamiento* | Token de entrenamiento | 8 USD/millones de tokens | ||
Gemini 1.5 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,00032875 USD por imagen 0,00032875 USD por segundo 0,0003125 USD por cada 1000 caracteres 0,00003125 USD por segundo |
0,0006575 USD por imagen 0,0006575 USD por segundo 0,000625 USD por cada 1000 caracteres 0,0000625 USD por segundo |
Salida de texto | 0,00125 USD por cada 1000 caracteres | 0,0025 USD por cada 1000 caracteres | ||
Perfeccionamiento* | Token de entrenamiento | 80 USD/millones de tokens | ||
Gemini 1.0 Pro | Multimodal | Entrada de imagen Entrada de vídeo Entrada de texto |
0,0025 USD por imagen 0,002 USD por segundo 0,000125 USD por cada 1000 caracteres |
|
Salida de texto | 0,000375 USD por cada 1000 caracteres | |||
Base con la Búsqueda de Google | Texto | Solicitudes de conexión a tierra | 35 USD por cada 1000 solicitudes (hasta 1 millón de solicitudes al día). Ponte en contacto con el equipo de tu cuenta si necesitas más de 1 millón de solicitudes al día. |
* Los precios se indican en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
* Si el contexto de una consulta es superior a 128.000, todos los tokens se cobran a tarifas de contexto largas.
* Los modelos de Gemini están disponibles en modo por lotes con un 50% de descuento.
* Gemini 1.0 Pro solo admite ventanas de contexto de hasta 32K.
* Los PDFs se facturan como entrada de imágenes, con una página en PDF equivalente a una imagen.
* El punto final del modelo ajustado tiene el mismo precio de predicción que el modelo base.
* Acceso a la Búsqueda de Google: si utilizas la recuperación dinámica para optimizar los costes, solo se te cobrará por Grounding con la Búsqueda de Google las solicitudes que contengan al menos una URL de referencia de base de la Web. Los costes de Gemini siempre se aplican.
Imagen
Con Imagen en Vertex AI, puedes generar imágenes novedosas y editarlas a partir de peticiones de texto que proporciones, o bien editar solo partes de las imágenes usando un área de máscara que definas junto con muchas otras funciones.
Modelo | Función | Descripción | Entrada | Salida | Precio |
---|---|---|---|---|---|
Imagen 3 | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,04 USD por imagen |
Imagen 3 rápida | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,02 USD por imagen |
Imagen 2, Imagen | Generación de imágenes | Generar una imagen | Petición de texto | Imagen | 0,020 USD por imagen |
Edición de imágenes | Editar una imagen usando el enfoque sin máscara o con máscara | Petición de imagen o texto | Imagen | 0,020 USD por imagen | |
Mejora de la resolución | Aumenta la resolución de una imagen generada a 2K y 4K | Imagen | Imagen | 0,003 USD por imagen | |
Ajustes | Habilitar un "asunto" proporcionado por el usuario para usarlo en las peticiones de Imagen (formación de poca toma) | Sujetos con identificador de texto y entre 4 y 8 imágenes por asunto | Modelo ajustado (después de entrenarse con los sujetos proporcionados por los usuarios) | Coste por hora de nodo (precios del entrenamiento personalizado de Vertex AI) | |
Subtítulos visuales | Generar un título de texto largo o corto para una imagen | Imagen | Título de texto | 0,0015 USD/imagen | |
Preguntas y respuestas visuales | Proporciona una respuesta basada en una pregunta que haga referencia a una imagen | Petición de imagen o texto | Respuesta de texto | 0,0015 USD/imagen |
Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Inserción
Modelo | Función | Descripción | Entrada | Salida | Precio |
---|---|---|---|---|---|
inserción multimodal | Incrustaciones para multimodal: texto | Generar incrustaciones usando texto como entrada | Texto | Incrustaciones | 0,0002 USD por entrada de 1000 caracteres |
Incrustaciones para multimodales: imagen | Generar incrustaciones usando imágenes como entrada | Imagen | Incrustaciones | 0,0001 USD por entrada de imagen | |
Incrustaciones para multimodal: Video Plus | Vídeo plus | Vídeo | Incrustaciones (hasta 15 inserciones por minuto de vídeo) | 0,0020 USD por segundo de vídeo | |
Incrustaciones para multimodales: estándar de vídeo | Estándar de vídeo | Vídeo | Incrustaciones (hasta 8 inserciones por minuto de vídeo) | 0,0010 USD por segundo de vídeo | |
Incrustaciones para multimodales: aspectos esenciales de vídeo | Imprescindibles para vídeos | Vídeo | Incrustaciones (hasta 4 incrustaciones por minuto de vídeo) | 0,0005 USD por segundo de vídeo |
Modelo | Tipo | Region | Precio por cada 1000 caracteres |
---|---|---|---|
Incrustaciones de texto | Entrada | Global |
|
Salida | Global |
|
Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Completar código
La IA generativa de Vertex AI cobra por cada 1000 caracteres de entrada (petición) y por cada 1000 caracteres de salida (respuesta). Los caracteres se cuentan según los puntos de código UTF-8 y no se tienen en cuenta los espacios en blanco. Durante la fase de vista previa, se aplica un descuento del 100% a los cargos. Las solicitudes de predicción que generan respuestas filtradas solo se cobran por la entrada. Al final de cada ciclo de facturación, las fracciones de un céntimo (0,01 USD) se redondean a un céntimo.
Modelo | Tipo | Region | Precio por cada 1000 caracteres |
---|---|---|---|
Codey para completar el código | Entrada | Global |
|
Salida | Global |
|
Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Traducción (texto)
Usa la API de Vertex AI y el LLM de traducción para traducir texto. Las traducciones de LLMs tienden a ser más fluidas y humanas que los modelos de traducción clásicos, pero su compatibilidad con los idiomas es más limitada. (Más información)
Modelo | Método | Uso | Precio por millón de caracteres |
---|---|---|---|
LLM | Traducción de textos (versión preliminar)* | El número de caracteres de entrada al mes |
10 USD por millón de caracteres* |
El número de caracteres de salida al mes |
10 USD por millón de caracteres* |
Los precios se indican en dólares estadounidenses (USD).
Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
* El precio se calcula por cada carácter que procesa el modelo. Para obtener más información sobre el recuento de caracteres, consulta caracteres que se cobran.
Almacenamiento en caché de contexto
Con el almacenamiento en caché de contexto, puedes reducir el coste del procesamiento de tokens de entrada de Gemini en un 75% y la latencia de la generación de contenido, ya que almacena en caché la parte de contexto del texto o del contenido multimedia de entrada en los modelos de Gemini. La cantidad de tiempo que los datos se almacenan en la caché, que puede controlar el usuario, determina los cargos por "almacenamiento en caché de contexto". Al crear un contexto almacenado en caché, se cobrará a los usuarios el coste estándar del token de entrada. Los hits en caché sobre los datos de entrada se cobran a una tarifa reducida, denominada "entrada en caché", en lugar del coste de entrada normal. El volumen de datos tanto del almacenamiento como de entrada se calcula de la misma forma que los precios de entrada de Gemini.
Modelo | Función | Tipo | Precio ( =< 128.000 tokens de entrada) | Precio (más de 128.000 tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Entrada en caché | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,000005 por imagen 0,000005 por segundo 0,0000046875 por 1000 caracteres 0,0000005 por segundo |
0,00001 por imagen 0,00001 por segundo 0,000009375 por 1000 caracteres 0,000001 por segundo |
Almacenamiento en caché contextual | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,000263 / imagen/h 0,000263/ segundo/h 0,00025 / 1000 caracteres/h 0,000025 / segundo/h |
||
Gemini 1.5 Pro | Entrada en caché | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,0000821875 por imagen 0,0000821875 por segundo 0,000078125 por 1000 caracteres 0,0000078125 por segundo |
0,000164375 por imagen 0,000164375 por segundo 0,00015625 por 1000 caracteres 0,000015625 por segundo |
Almacenamiento en caché contextual | Entrada de imagen Entrada de vídeo Entrada de texto Entrada de audio |
0,0011835 / imagen/h 0,0011835/ segundo/h 0,001125 / 1000 caracteres/h 0,0001125 / segundo/h |
Los precios se indican en dólares estadounidenses (USD). Si pagas en una moneda que no sea el dólar estadounidense, se aplicarán los precios que figuran para tu divisa en la página de SKUs de Cloud Platform.
Ejemplo de cálculo de coste en caché
Si un usuario crea un contexto almacenado en caché de 250.000 caracteres con un TTL de 2 horas y,posteriormente, envía 20 solicitudes distintas al modelo Gemini 1.5 Pro durante esas 2 horas y en cada solicitud se añade una consulta de 200 caracteres al contexto almacenado en caché y a una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Ejemplo de cálculo de coste
Si un usuario envía cinco solicitudes independientes al modelo PaLM Text Bison y cada solicitud tiene una entrada de 200 y una salida de 400 caracteres, el cargo total se calcula de la siguiente manera:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelos de partners
Los modelos de partners son una selección de modelos de IA generativa desarrollados por partners de Google. Los modelos de partners se ofrecen como APIs gestionadas. Para obtener más información, consulta la descripción general de los modelos de partners. En las siguientes secciones se indican los precios detallados de los modelos de partners de Google.
Modelos de AI21 Lab
Modelo | Precios |
---|---|
Jamba 1.5 grande | Entrada: 2 USD por millón de tokens Salida: 8 USD por millón de tokens |
Jamba 1.5 mini | Entrada: 0,20 USD por millón de tokens Salida: 0,40 USD por millón de tokens |
Modelos de Anthropic Claude
Modelo | Precios |
---|---|
Haiku Claude 3.5 | Entrada: 1,00 USD por millón de tokens Salida: 5,00 USD por millón de tokens |
Claude 3.5 Sonnet v2 | Entrada: 3 USD por millón de tokens Salida: 15 USD por millón de tokens |
Claude 3.5 Sonnet | Entrada: 3 USD por millón de tokens Salida: 15 USD por millón de tokens |
Claude 3 Haiku | Entrada: 0,25 USD por millón de tokens Salida: 1,25 USD por millón de tokens |
Claude 3 Sonnet | Entrada: 3 USD por millón de tokens Salida: 15 USD por millón de tokens |
Claude 3 Opus | Entrada: 15 USD por millón de tokens Salida: 75 USD por millón de tokens |
Modelos de llama de Meta
Modelo | Precios |
---|---|
Llama 3.1 405B | Entrada: 5 USD por millón de tokens Salida: 16 USD por millón de tokens |
Modelos de Mistral AI
Modelo | Precios |
---|---|
Mistral Grande (2407) | Entrada: 2 USD por millón de tokens Salida: 6 USD por millón de tokens |
Mistral Nemo | Entrada: 0,15 USD por millón de tokens Salida: 0,15 USD por millón de tokens |
Codestral | Entrada: 0,20 USD por millón de tokens Salida: 0,60 USD por millón de tokens |