Preços da Vertex AI

Os preços são indicados em dólares americanos (US$). Se você não paga em dólar americano, são aplicados os preços na sua moeda local listados na página SKUs do Cloud Platform.

Confira nesta página os preços da IA generativa na Vertex AI. Para todos os outros preços da Vertex AI, incluindo serviços de MLOps e plataforma de ML, consulte a página de preços da Vertex AI.

Modelos do Google

Gemini

Com os modelos multimodais na Vertex AI, é possível inserir texto ou mídia (imagens, vídeos). A entrada Text é cobrada a cada 1.000 caracteres de entrada (comando) e a cada 1.000 caracteres de saída (resposta). Os caracteres são contados por pontos de código UTF-8, e o espaço em branco é excluído da contagem, resultando em aproximadamente quatro caracteres por token. As solicitações de Prediction que levam a respostas filtradas são cobradas apenas para a entrada. Ao final de cada ciclo de faturamento, as frações de um centavo (US$ 0,01) são arredondadas em um centavo. A entrada de mídia é cobrada por imagem ou por segundo (vídeo).

Modelo Recurso Tipo Preço
( =< 128 mil tokens de entrada)
Preço
(> 128 mil tokens de entrada)
Gemini 1.5 Flash Multimodal Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
US$ 0,00002 / imagem
US$0,00002 / segundo
US$0,00001875 / 1 mil caracteres
US$0,000002 / segundo
US$ 0,00004 / imagem
US$0,00004 / segundo
US$0,0000375 / 1 mil caracteres
US$0,000004 / segundo
Saída de texto US$ 0,000075 / 1 mil caracteres US$ 0,00015 / 1 mil caracteres
Ajuste* Token de treinamento US$ 8 / mi de tokens
Gemini 1.5 Pro Multimodal Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
US$ 0,00032875 / imagem
US$0,00032875 / segundo
US$0,0003125 / 1 mil caracteres
US$0,00003125 / segundo
US$ 0,0006575 / imagem
US$0,0006575 / segundo
US$0,000625 / 1.000 caracteres
US$0,0000625 / segundo
Saída de texto US$ 0,00125 / 1 mil caracteres US$ 0,0025 / 1 mil caracteres
Ajuste* Token de treinamento US$ 80 / mi de tokens
Gemini 1.0 Pro Multimodal Entrada de imagem
Entrada de vídeo
Entrada de texto
US$ 0,0025 / imagem
US$ 0,002 / segundo
US$0,000125 / 1 mil caracteres
Saída de texto US$ 0,000375 / 1 mil characters
Embasamento com a Pesquisa Google Texto Solicitações de embasamento US$ 35 / 1.000 solicitações (para até 1 milhão de solicitações por dia).
Entre em contato com sua equipe de conta se precisar de mais
de 1 milhão de solicitações por dia.

* Os preços estão listados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
* Se um contexto de consulta for maior que 128 mil, todos os tokens serão cobrados com taxas de contexto longas.
* Os modelos Gemini estão disponíveis no modo de lote com 50% de desconto.
* O Gemini 1.0 Pro oferece suporte apenas à janela de contexto de até 32K.
* Os PDFs são cobrados como entrada de imagem, com uma página PDF equivalente a uma imagem.
* O endpoint do modelo ajustado tem o mesmo preço de previsão que o modelo base.
* Embasamento na Pesquisa Google: se você usar a recuperação dinâmica para otimizar custos, somente as solicitações que contiverem pelo menos um URL de suporte embasado da Web na resposta serão cobradas por Base com a Pesquisa Google. Os custos do Gemini sempre se aplicam.

Imagen

Com o Imagen na Vertex AI, é possível gerar imagens novas e editar imagens com base nos comandos de texto que você fornecer ou editar apenas partes delas usando uma área de máscara definida por você, além de vários outros recursos.

Modelo Recurso Descrição Entrada Saída Preço
Imagem 3 Geração de imagens Gerar uma imagem Comando de texto Imagem US$ 0,04 por imagem
Imagen 3 rápida Geração de imagens Gerar uma imagem Comando de texto Imagem US$ 0,02 por imagem
Imagen 2, Imagen Geração de imagens Gerar uma imagem Comando de texto Imagem $0,020 por imagem
Edição de imagens Editar uma imagem usando a abordagem sem máscara ou com máscara Solicitação de imagem/texto Imagem $0,020 por imagem
Upscaling Aumenta a resolução de uma imagem gerada para 2K e 4K Imagem Imagem $0,003 por imagem
Ajuste de detalhes Ativa um "assunto" fornecido pelo usuário para ser usado nos comandos do Imagen (treinamento de poucas imagens) Assunto(s) com identificador de texto e de 4 a 8 imagens por assunto Modelo ajustado (após o treinamento com assuntos fornecidos pelo usuário) US$ por hora de uso do nó (preços do treinamento personalizado da Vertex AI)
Legendas visuais Gerar uma legenda de texto curta ou longa para uma imagem Imagem Legenda de texto $0,0015/imagem
Perguntas e respostas visuais Fornecer uma resposta com base em uma pergunta relacionada a uma imagem Solicitação de imagem/texto Resposta em texto $0,0015/imagem

Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Incorporação

Modelo Recurso Descrição Entrada Saída Preço
incorporação multimodal Embeddings para multimodal: texto Gerar embeddings usando texto como entrada Texto Embeddings US$ 0,0002/1.000 caracteres de entrada
Embeddings para multimodal: imagem Gerar embeddings usando imagem como entrada Imagem Embeddings $0,0001/entrada de imagem
Embeddings para multimodal: Video Plus Vídeo Plus Vídeo Embeddings (até 15 embeddings por minuto de vídeo) US$ 0,0020 por segundo de vídeo
Embeddings para multimodal: vídeo padrão Vídeo Standard Vídeo Embeddings (até 8 embeddings por minuto de vídeo) US$ 0,0010 por segundo de vídeo
Embeddings para multimodal: vídeos essenciais Vídeo Essential Vídeo Embeddings (até 4 embeddings por minuto de vídeo) US$ 0,0005 por segundo de vídeo
Modelo Tipo Região Preço por 1.000 caracteres
Embeddings para texto Entrada Global
  • Solicitações on-line: US$ 0,000025
  • Solicitações em lote: US$ 0,00002
Saída Global
  • Solicitações on-line: sem custo financeiro
  • Solicitações em lote: sem cobrança

Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Preenchimento de código

A IA generativa na Vertex AI cobra por 1.000 caracteres de entrada (prompt) e por 1.000 caracteres de saída (resposta). Os caracteres são contados pelos pontos de código UTF-8, e o espaço em branco é excluído da contagem. Durante o estágio de visualização, as cobranças são 100% descontadas. As solicitações de Prediction que levam a respostas filtradas são cobradas somente para a entrada. Ao final de cada ciclo de faturamento, as frações de um centavo (US$ 0,01) são arredondadas em um centavo.

Modelo Tipo Região Preço por 1.000 caracteres
Codey para preenchimento de código Entrada Global
  • Solicitações on-line: US$ 0,00025
Saída Global
  • Solicitações on-line: US$ 0,0005

Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Tradução (texto)

Use a API Vertex AI e o LLM de tradução para traduzir textos. As traduções LLM tendem a ser mais fluentes e que soam mais humanas do que os modelos clássicos, mas têm suporte a idiomas mais limitado. Saiba mais.

Modelo Método Uso Preço por milhão de caracteres
LLM Text Translation (pré-lançamento)* o número de caracteres de entrada por mês;

US$ 10 por milhão de caracteres*

O número de caracteres de saída por mês

US$ 10 por milhão de caracteres*

Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
*O preço é por caractere processado pelo modelo. Para detalhes sobre a contagem de caracteres, consulte Caracteres cobrados.

Armazenamento em cache de contexto

Com o armazenamento em cache de contexto, é possível reduzir o custo do processamento do token de entrada do Gemini em 75% e a latência da geração de conteúdo. Basta armazenar em cache a parte de contexto do texto de entrada ou da mídia nos modelos do Gemini. O tempo em que os dados são armazenados no cache, que pode ser controlado pelo usuário, determina as cobranças do "Armazenamento em cache de contexto". Ao criar um contexto armazenado em cache, o custo padrão do token de entrada será cobrado dos usuários. As ocorrências em cache nos dados de entrada são cobradas a uma taxa reduzida, "Entrada em cache", em vez do custo normal de entrada. O tamanho dos dados para armazenamento e entrada é calculado da mesma forma que o preço de entrada do Gemini.

Modelo Recurso Tipo Preço ( até 128 mil tokens de entrada) Preço (mais de 128 mil tokens de entrada)
Gemini 1.5 Flash Entrada em cache Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
0,000005 / imagem
0,000005 / segundo
0,0000046875 / 1 mil caracteres
0,0000005 / segundo
0,00001 / imagem
0,00001 / segundo
0,000009375 / 1 mil caracteres
0,000001 / segundo
Armazenamento em cache de contexto Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
0,000263 / imagem / hora
0,000263/ segundo / h
0,00025 / 1 mil caracteres / h
0,000025 / segundo / h
Gemini 1.5 Pro Entrada em cache Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
0,0000821875 / imagem
0,0000821875 / segundo
0,000078125 / 1 mil caracteres
0,0000078125 / segundo
0,000164375 / imagem
0,000164375 / segundo
0,00015625 / 1 mil caracteres
0,000015625 / segundo
Armazenamento em cache de contexto Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
0,0011835 / imagem / hora
0,0011835/ segundo / h
0,001125 / 1 mil caracteres / hora
0,0001125 / segundo / hora

Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Exemplo de cálculo de custo em cache

Se um usuário criar um contexto armazenado em cache de 250.000 caracteres com um TTL de 2 horas e depois enviar 20 solicitações separadas para o modelo Gemini 1.5 Pro durante essas 2 horas, e cada solicitação tiver uma consulta de 200 caracteres adicionada ao contexto em cache e 400 caracteres à saída, a cobrança total será calculada da seguinte forma:

Cache Creation cost:
250,000 input characters x ($0.0003125 / 1000) = $0.078125 cached input cost.

Cache Storage cost:
250,000 characters x 2 hours = 500,000 total character hours;
500,000 total character hours x ($0.001125 / 1000) = $0.5625 storage cost.

Requests using cache cost:
200 characters x 20 requests = 4,000 total character inputs
250,000 cached characters * 20 requests = 5,000,000 total cached character inputs
4,000 total character inputs * ($0.0003125 / 1000) = $0.00125 character input cost
5,000,000 total cached character inputs * ($0.000078125 / 1000) = $0.390625 cached input cost
$0.00125 character input cost + $0.390625 cached input cost = $0.391875 total input cost

Output cost:
400 output characters x 20 prompts = 8,000 total output characters;
8,000 total output characters x ($0.00375 / 1000) = $0.03 output cost.

Total cost:
$0.078125 cached input cost + $0.5625 cached storage cost + $0.391875 input cost + $0.03 output cost = $1.0625 total cost.

Exemplo de cálculo de custo

Se um usuário enviar cinco solicitações separadas para o modelo PaLM Text Bison e cada solicitação tiver uma entrada de 200 caracteres e uma saída de 400 caracteres, a cobrança total será calculada da seguinte maneira:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modelos de parceiros

Os modelos de parceiros são uma lista selecionada de modelos de IA generativa desenvolvidos por parceiros do Google. Os modelos de parceiros são oferecidos como APIs gerenciadas. Para mais informações, consulte Visão geral dos modelos de parceiro. As seções a seguir listam detalhes de preços dos modelos de parceiros do Google.

Modelos do AI21 Lab

Modelo Preços
Jamba 1.5 Large Entrada: US$ 2 / milhão de tokens
Saída: US$ 8 / milhão de tokens
Jamba 1.5 Mini Entrada: US$ 0,20 / milhão de tokens
Saída: US$ 0,40 / milhão de tokens

Modelos Claude da Anthropic

Modelo Preços
Haicai claude 3.5 Entrada: US$ 1,00 / milhão de tokens
Saída: US$ 5,00 / milhão de tokens
Sonnet v2 claude 3.5 Entrada: US$ 3 por milhão de tokens
Saída: US$ 15 por milhão de tokens
Claude 3.5 Sonnet Entrada: US$ 3 por milhão de tokens
Saída: US$ 15 por milhão de tokens
Claude 3 Haiku Entrada: US$ 0,25 / milhão de tokens
Saída: US$ 1,25 / milhão de tokens
Claude 3 Sonnet Entrada: US$ 3 por milhão de tokens
Saída: US$ 15 por milhão de tokens
Claude 3 Opus Entrada: US$ 15 / milhão de tokens
Saída: US$ 75 / milhão de tokens

Modelos Llama da Meta

Modelo Preços
Llama 3.1 405B Entrada: US$ 5 / milhão de tokens
Saída: US$ 16 / milhão de tokens

Modelos da Mistral AI

Modelo Preços
Mistral grande (2407) Entrada: US$ 2 / milhão de tokens
Saída: US$ 6 / milhão de tokens
Mistral nemo Entrada: US$ 0,15 / milhão de tokens
Saída: US$ 0,15 / milhão de tokens
Codestral Entrada: US$ 0,20 / milhão de tokens
Saída: US$ 0,60 / milhão de tokens

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato