Preços da Vertex AI
Os preços são indicados em dólares americanos (US$). Se você não paga em dólar americano, são aplicados os preços na sua moeda local listados na página SKUs do Cloud Platform.
Nesta página, você encontra informações sobre os preços da IA generativa na Vertex AI. Para todos os outros preços da Vertex AI, incluindo os serviços ML Platform e MLOps, consulte a página de preços da Vertex AI.
Modelos do Google
Gemini
Com os modelos multimodais na Vertex AI, é possível inserir texto ou mídia (imagens, vídeos). A entrada de texto é cobrada a cada 1.000 caracteres de entrada (prompt) e a cada 1.000 caracteres de saída (resposta). Os caracteres são contados pelos pontos de código UTF-8, e o espaço em branco é excluído da contagem, resultando em aproximadamente quatro caracteres por token. As solicitações Prediction que levam a respostas filtradas são cobradas apenas pela entrada. No final de cada ciclo de faturamento, as frações de um centavo (US$ 0,01) são arredondadas para um centavo. A entrada de Mídia é cobrada por imagem ou por segundo (vídeo).
Modelo | Recurso | Tipo | Preço ( =< 128K tokens de entrada) |
Preço ( > 128 mil tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Multimodal | Entrada de imagem Entrada de vídeo Entrada de texto Entrada de áudio |
US$ 0,00002 / imagem US$0,00002 / segundo US$0,00001875 / 1 mil caracteres US$0,000002 / segundo |
US$ 0,00004 / imagem US$0,00004 / segundo US$0,0000375 / 1 mil caracteres US$0,000004 / segundo |
Saída de texto | US$ 0,000075 / 1 mil caracteres | US$ 0,00015 / 1.000 caracteres | ||
Ajuste* | Token de treinamento | US$ 8 / M tokens | ||
Gemini 1.5 Pro | Multimodal | Entrada de imagem Entrada de vídeo Entrada de texto Entrada de áudio |
US$ 0,00032875 / imagem US$0,00032875 / segundo US$0,0003125 / 1 mil caracteres US$0,00003125 / segundo |
US$ 0,0006575 / imagem US$0,0006575 / segundo US$0,000625 / 1 mil caracteres US$0,0000625 / segundo |
Saída de texto | US$ 0,00125 / 1 mil caracteres | US$ 0,0025 / 1 mil caracteres | ||
Ajuste* | Token de treinamento | US$ 80 / M tokens | ||
Gemini 1.0 Pro | Multimodal | Entrada de imagem Entrada de vídeo Entrada de texto |
US$ 0,0025 / imagem US$ 0,002 / segundo US$0,000125 / 1 mil caracteres |
|
Saída de texto | US$ 0,000375 / 1 mil characters | |||
Embasamento com a Pesquisa Google | Texto | Solicitações de fundamentação | US$ 35 / 1.000 solicitações (até 1 milhão de solicitações por dia). Entre em contato com a equipe da sua conta se precisar de mais de 1 milhão de solicitações por dia. |
* Os preços são indicados em dólares americanos (USD).
Se você não paga em dólar americano, são aplicados os preços na sua moeda local listados na página SKUs do Cloud Platform.
* Se o contexto da consulta for maior que 128 mil, todos os tokens serão cobrados com as taxas de contexto longo.
* Os modelos do Gemini estão disponíveis no modo em lote com 50% de desconto.
* O Gemini 1.0 Pro só oferece suporte a uma janela de contexto de até 32 KB.
* Os PDFs são cobrados como entrada de imagem, com uma página de PDF equivalente a uma imagem.
* O endpoint do modelo ajustado tem o mesmo preço de previsão do modelo base.
* Grounding com a Pesquisa Google: se você estiver usando a recuperação dinâmica para otimizar os custos, apenas as solicitações que contiverem pelo menos um URL de suporte de fundamentação da Web na resposta serão cobradas pela Grounding com a Pesquisa Google. Os custos do Gemini sempre se aplicam.
Imagen
Com o Imagen na Vertex AI, é possível gerar imagens novas e editar com base nas solicitações de texto fornecidas, ou editar apenas partes de imagens usando uma área de máscara definida por você, além de vários outros recursos.
Modelo | Recurso | Descrição | Entrada | Saída | Preço |
---|---|---|---|---|---|
Imagem 3 | Geração de imagens | Gerar uma imagem | Comando de texto | Imagem | US$ 0,04 por imagem |
Imagen 3 Fast | Geração de imagens | Gerar uma imagem | Comando de texto | Imagem | US$ 0,02 por imagem |
Imagem 2, Imagem | Geração de imagens | Gerar uma imagem | Comando de texto | Imagem | $0,020 por imagem |
Edição de imagens | Editar uma imagem usando a abordagem sem máscara ou com máscara | Solicitação de imagem/texto | Imagem | $0,020 por imagem | |
Upscaling | Aumenta a resolução de uma imagem gerada para 2K e 4K | Imagem | Imagem | $0,003 por imagem | |
Ajuste de detalhes | Ativa um "assunto" fornecido pelo usuário para ser usado nos comandos do Imagen (treinamento de poucas imagens) | Assunto(s) com identificador de texto e de 4 a 8 imagens por assunto | Modelo ajustado (após o treinamento com assuntos fornecidos pelo usuário) | US$ por hora de uso do nó (preços do treinamento personalizado da Vertex AI) | |
Legendas visuais | Gerar uma legenda de texto curta ou longa para uma imagem | Imagem | Legenda de texto | $0,0015/imagem | |
Perguntas e respostas visuais | Fornecer uma resposta com base em uma pergunta relacionada a uma imagem | Solicitação de imagem/texto | Resposta em texto | $0,0015/imagem |
Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.
Incorporação
Modelo | Recurso | Descrição | Entrada | Saída | Preço |
---|---|---|---|---|---|
multimodalembedding | Embeddings para multimodal: texto | Gerar embeddings usando texto como entrada | Texto | Embeddings | US$ 0,0002/1.000 caracteres de entrada |
Embeddings para multimodal: imagem | Gerar embeddings usando imagem como entrada | Imagem | Embeddings | $0,0001/entrada de imagem | |
Embeddings para multimodal: vídeo Plus | Vídeo Plus | Vídeo | Embeddings (até 15 embeddings por minuto de vídeo) | US$ 0,0020 por segundo de vídeo | |
Embeddings para multimodal: padrão de vídeo | Vídeo Standard | Vídeo | Embeddings (até 8 embeddings por minuto de vídeo) | US$ 0,0010 por segundo de vídeo | |
Embeddings para multimodal: vídeo essencial | Vídeo Essential | Vídeo | Embeddings (até 4 embeddings por minuto de vídeo) | US$ 0,0005 por segundo de vídeo |
Modelo | Tipo | Região | Preço por 1.000 caracteres |
---|---|---|---|
Embeddings para texto | Entrada | Global |
|
Saída | Global |
|
Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.
Preenchimento de código
A IA generativa na Vertex AI cobra por 1.000 caracteres de entrada (prompt) e por 1.000 caracteres de saída (resposta). Os caracteres são contados pelos pontos de código UTF-8, e o espaço em branco é excluído da contagem. Durante o estágio de visualização, as cobranças são 100% descontadas. As solicitações Prediction que levam a respostas filtradas são cobradas apenas pela entrada. No final de cada ciclo de faturamento, as frações de um centavo (US$ 0,01) são arredondadas para um centavo.
Modelo | Tipo | Região | Preço por 1.000 caracteres |
---|---|---|---|
Codey para preenchimento de código | Entrada | Global |
|
Saída | Global |
|
Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.
Tradução (texto)
Use a API Vertex AI e o LLM de tradução para traduzir textos. As traduções de LLM tendem a ser mais fluentes e com um tom mais humano do que os modelos de tradução clássicos, mas têm suporte a idiomas mais limitado (Saiba mais).
Modelo | Método | Uso | Preço por milhão de caracteres |
---|---|---|---|
LLM | Tradução de texto (Prévia)* | O número de caracteres de entrada por mês |
US$ 10 por milhão de caracteres* |
O número de caracteres de saída por mês |
US$ 10 por milhão de caracteres* |
Os preços são indicados em dólares americanos (USD).
Se você não paga em dólar americano, são aplicados os preços na sua moeda local listados na página SKUs do Cloud Platform.
*O preço é calculado por caractere processado pelo modelo. Para mais informações sobre a contagem de caracteres, consulte Caracteres cobrados
Armazenamento em cache de contexto
Com o armazenamento em cache de contexto, é possível reduzir o custo do processamento de tokens de entrada do Gemini em 75% e a latência da geração de conteúdo armazenando em cache a parte de contexto do seu texto de entrada ou mídia nos modelos do Gemini. A quantidade de tempo que os dados ficam armazenados no cache, que pode ser controlada pelo usuário, determina as cobranças de "Armazenamento de cache de contexto". Ao criar um contexto em cache, os usuários serão cobrados pelo custo padrão do token de entrada. As ocorrências de cache nos dados de entrada são cobradas a uma taxa reduzida, "Entrada em cache", em vez do custo normal de entrada. O tamanho dos dados para armazenamento e entrada é calculado da mesma forma que os preços de entrada do Gemini.
Modelo | Recurso | Tipo | Preço ( =< 128K tokens de entrada) | Preço ( > 128 mil tokens de entrada) |
---|---|---|---|---|
Gemini 1.5 Flash | Entrada em cache | Entrada de imagem Entrada de vídeo Entrada de texto Entrada de áudio |
US$ 0,000005 / imagem US$ 0,000005 / segundo US$ 0,0000046875 / 1 mil caracteres US$ 0,0000005 / segundo |
0,00001 / imagem 0,00001 / segundo 0,000009375 / 1 mil caracteres 0,000001 / segundo |
Armazenamento de cache de contexto | Entrada de imagem Entrada de vídeo Entrada de texto Entrada de áudio |
0,000263 / imagem / hora 0,000263/ segundo / hora 0,00025 / 1 mil caracteres / hora 0,000025 / segundo / hora |
||
Gemini 1.5 Pro | Entrada em cache | Entrada de imagem Entrada de vídeo Entrada de texto Entrada de áudio |
0,0000821875 / imagem 0,0000821875 / segundo 0,000078125 / 1 mil caracteres 0,0000078125 / segundo |
0,000164375 / imagem 0,000164375 / segundo 0,00015625 / 1 mil caracteres 0,000015625 / segundo |
Armazenamento de cache de contexto | Entrada de imagem Entrada de vídeo Entrada de texto Entrada de áudio |
0,0011835 / imagem / hora 0,0011835/ segundo / hora 0,001125 / 1 mil caracteres / hora 0,0001125 / segundo / hora |
Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.
Exemplo de cálculo de custo em cache
Se um usuário criar um contexto armazenado em cache de 250.000 caracteres com um TTL de 2 horas e, em seguida, enviar 20 solicitações separadas para o modelo Gemini 1.5 Pro durante essas 2 horas, e cada solicitação tiver uma consulta de 200 caracteres adicionada ao contexto armazenado em cache e uma saída de 400 caracteres, a cobrança total será calculada da seguinte forma:
Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.
Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.
Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost
Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.
Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.
Exemplo de cálculo de custo
Se um usuário enviar cinco solicitações separadas para o modelo PaLM Text Bison e cada solicitação tiver uma entrada de 200 caracteres e uma saída de 400 caracteres, a cobrança total será calculada da seguinte maneira:
Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.
Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.
Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.
Modelos de parceiros
Os modelos de parceiros são uma lista selecionada de modelos de IA generativa desenvolvidos por parceiros do Google. Os modelos de parceiros são oferecidos como APIs gerenciadas. Para mais informações, consulte Visão geral dos modelos de parceiros. As seções a seguir listam os detalhes de preços dos modelos de parceiros do Google.
Modelos da AI21 Labs
Modelo | Preços |
---|---|
Jamba 1.5 Large | Entrada: US$ 2 / milhão de tokens Saída: US$ 8 / milhão de tokens |
Jamba 1.5 Mini | Entrada: US$ 0,20 / milhão de tokens Saída: US$ 0,40 / milhão de tokens |
Modelos Claude da Anthropic
Modelo | Preços |
---|---|
Claude 3.5 Haiku | Entrada: US$ 0,80 / milhão de tokens Saída: US$ 4,00 / milhão de tokens |
Claude 3.5 Sonnet v2 | Entrada: US$ 3 / milhão de tokens Saída: US$ 15 / milhão de tokens |
Claude 3.5 Sonnet | Entrada: US$ 3 / milhão de tokens Saída: US$ 15 / milhão de tokens |
Claude 3 Haiku | Entrada: US$ 0,25 / milhão de tokens Saída: US$ 1,25 / milhão de tokens |
Claude 3 Sonnet | Entrada: US$ 3 / milhão de tokens Saída: US$ 15 / milhão de tokens |
Claude 3 Opus | Entrada: US$ 15 / milhão de tokens Saída: US$ 75 / milhão de tokens |
Modelos Llama da Meta
Modelo | Preços |
---|---|
Llama 3.1 405B | Entrada: US$ 5,00 / milhão de tokens Saída: US$ 16,00 / milhão de tokens |
Modelos da Mistral AI
Modelo | Preços |
---|---|
Mistral Large (24.11) | Entrada: US$ 2,00 / milhão de tokens Saída: US$ 6,00 / milhão de tokens |
Mistral Large (24.07) | Entrada: US$ 2,00 / milhão de tokens Saída: US$ 6,00 / milhão de tokens |
Mistral Nemo | Entrada: US$ 0,15 / milhão de tokens Saída: US$ 0,15 / milhão de tokens |
Codestral (24.05) | Entrada: US$ 0,20 / milhão de tokens Saída: US$ 0,60 / milhão de tokens |