Preços da Vertex AI

Os preços são indicados em dólares americanos (US$). Se você não paga em dólar americano, são aplicados os preços na sua moeda local listados na página SKUs do Cloud Platform.

Nesta página, você encontra informações sobre os preços da IA generativa na Vertex AI. Para todos os outros preços da Vertex AI, incluindo plataforma de ML e serviços de MLOps, consulte a página de preços da Vertex AI.

Modelos de fundação do Google

Multimodal

Com os modelos multimodais na Vertex AI, é possível inserir texto ou mídia (imagens, vídeos). A entrada de texto é cobrada a cada 1.000 caracteres de entrada (prompt) e a cada 1.000 caracteres de saída (resposta). Os caracteres são contados por pontos de código UTF-8, e o espaço em branco é excluído da contagem, resultando em aproximadamente quatro caracteres por token. As solicitações de previsão que levam a respostas filtradas são cobradas apenas pela entrada. No final de cada ciclo de faturamento, as frações de um centavo (US$ 0,01) são arredondadas para um centavo. A entrada de Mídia é cobrada por imagem ou por segundo (vídeo).

Modelo Engenharia de Tipo Preço
( = janela de contexto menor que 128 mil)
Preço
( janela de contexto > 128 mil)
Gemini 1.5 Flash Multimodal Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
US$ 0,0001315 / imagem
US$0,0001315 / segundo
US$0,000125 / 1.000 caracteres
US$0,0000125 / segundo
US$ 0,000263 / imagem
US$0,000263 / segundo
US$0,00025 / 1.000 caracteres
US$0,000025 / segundo
Saída de texto US$ 0,000375 / 1 mil characters US$ 0,00075 / 1.000 caracteres
Gemini 1.5 Pro Multimodal Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
US$ 0,001315 / imagem
US$0,001315 / segundo
US$0,00125 / 1.000 caracteres
US$0,000125 / segundo
US$ 0,00263 / imagem
US$0,00263 / segundo
US$0,0025 / 1.000 caracteres
US$0,00025 / segundo
Saída de texto US$ 0,00375 / 1.000 caracteres US$ 0,0075 / 1.000 caracteres
Gemini 1.0 Pro Multimodal Entrada de imagem
Entrada de vídeo
Entrada de texto
US$ 0,0025 / imagem
US$ 0,002 / segundo
US$0,000125 / 1 mil caracteres
Saída de texto US$ 0,000375 / 1 mil characters
Embasamento com a Pesquisa Google Textos Solicitações de embasamento US$ 35 / mil solicitações (para até 1 milhão de solicitações por dia).
Entre em contato com sua equipe de conta se você precisar de mais
de 1 milhão de solicitações por dia.

* Os preços estão listados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
* Se um contexto de consulta for maior que 128 mil, todos os tokens serão cobrados em taxas de contexto longas.
* Os modelos do Gemini estão disponíveis no modo em lote com 50% de desconto.
* O Gemini 1.0 Pro só oferece suporte a até 32 mil janelas de contexto.
*Os PDFs são cobrados como entrada de imagem, com uma página PDF equivalente a uma imagem.

Modelo Engenharia de Tipo Preço
Gemini 1.5 Pro Multimodal Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
US$ 0,00265 / imagem
US$0,00265 / segundo
US$0,0025 / 1.000 caracteres
US$0,00025 / segundo
Saída de texto US$ 0,0075 / 1.000 caracteres

Armazenamento em cache de contexto

Com o armazenamento em cache de contexto, é possível reduzir o custo e a latência da geração de conteúdo armazenando em cache a parte de contexto do texto de entrada ou da mídia para os modelos do Gemini. A quantidade de tempo que os dados são armazenados no cache, que pode ser controlada pelo usuário, determina as cobranças do "Armazenamento de cache de contexto". As ocorrências em cache nos dados de entrada são cobradas a uma taxa reduzida, "Entrada em cache", em vez do custo normal de entrada. O tamanho dos dados para armazenamento e entrada é calculado da mesma maneira que o preço de entrada do Gemini.

Modelo Engenharia de Tipo Preço
( = janela de contexto menor que 128 mil)
Preço para contexto longo
(janela de contexto superior a 128 mil)
Gemini 1.5 Pro Entrada
em cache
Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
0,0006575 / imagem
0,0006575 / segundo
0,000625 / 1.000 caracteres
0,0000625 / segundo
0,001315 / imagem
0,001315 / segundo
0,00125 / 1.000 caracteres
0,000125 / segundo
Armazenamento
em cache
de contexto
Entrada de imagem
Entrada de vídeo
Entrada de texto
Entrada de áudio
0,0011835 / imagem / h
0,0011835 / segundo / h
0,001125 / 1.000 caracteres / h
0,0001125 / segundo / h

* Os preços estão listados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
* Se um contexto de consulta for maior que 128 mil, todos os tokens serão cobrados em taxas de contexto longas.
* A saída do modelo é faturada de acordo com uma taxa que não é de armazenamento em cache.
*Os PDFs são cobrados como entrada de imagem, com uma página PDF equivalente a uma imagem.

Geração de imagens

Com o recurso de geração de imagens da Vertex AI, é possível gerar imagens novas e editar com base nas solicitações de texto fornecidas, ou editar apenas partes de imagens usando uma área de máscara definida por você, além de vários outros recursos.

Modelo Recurso Descrição Entrada Saída Price
Imagen Geração de imagens Gerar uma imagem Comando de texto Imagem $0,020 por imagem
Edição de imagens Editar uma imagem usando a abordagem sem máscara ou com máscara Solicitação de imagem/texto Imagem $0,020 por imagem
Upscaling Aumenta a resolução de uma imagem gerada para 2K e 4K Imagem Imagem $0,003 por imagem
Ajuste de detalhes Ativa um "assunto" fornecido pelo usuário para ser usado nos comandos do Imagen (treinamento de poucas imagens) Assunto(s) com identificador de texto e de 4 a 8 imagens por assunto Modelo ajustado (após o treinamento com assuntos fornecidos pelo usuário) US$ por hora de uso do nó (preços do treinamento personalizado da Vertex AI)
Legendas visuais Gerar uma legenda de texto curta ou longa para uma imagem Imagem Legenda de texto $0,0015/imagem
Perguntas e respostas visuais Fornecer uma resposta com base em uma pergunta relacionada a uma imagem Solicitação de imagem/texto Resposta em texto $0,0015/imagem

Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

API Multimodal Embeddings

Modelo Recurso Descrição Entrada Saída Preço
incorporação multimodal Embeddings para multimodal: texto Gerar embeddings usando texto como entrada Texto Embeddings US$ 0,0002/1.000 caracteres de entrada
Embeddings para multimodal: imagem Gerar embeddings usando imagem como entrada Imagem Embeddings $0,0001/entrada de imagem
Embeddings para multimodal: vídeo Vídeo Plus Vídeo Embeddings (até 15 embeddings por minuto de vídeo) US$ 0,0020 por segundo de vídeo
Embeddings para multimodal: vídeo Vídeo Standard Vídeo Embeddings (até 8 embeddings por minuto de vídeo) US$ 0,0010 por segundo de vídeo
Embeddings para multimodal: vídeo Vídeo Essential Vídeo Embeddings (até 4 embeddings por minuto de vídeo) US$ 0,0005 por segundo de vídeo

Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Geração de texto

A IA generativa na Vertex AI cobra por 1.000 caracteres de entrada (prompt) e por 1.000 caracteres de saída (resposta). Os caracteres são contados pelos pontos de código UTF-8, e o espaço em branco é excluído da contagem. Durante o estágio de visualização, as cobranças são 100% descontadas. As solicitações de previsão que levam a respostas filtradas são cobradas apenas pela entrada. No final de cada ciclo de faturamento, as frações de um centavo (US$ 0,01) são arredondadas para um centavo.

Modelo Tipo Região Preço por 1.000 caracteres
PaLM 2 para texto (Bison de texto) Entrada Global
  • Solicitações on-line: US$ 0,00025
  • Solicitações em lote: US$0,00020
Saída Global
  • Solicitações on-line: US$ 0,0005
  • Solicitações em lote: US$ 0,0004
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
Aprendizado por reforço com base no feedback humano us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
PaLM 2 para texto 32k (Text Bison 32k) Entrada Global
  • Solicitações on-line: US$ 0,00025
  • Solicitações em lote: US$0,00020
Saída Global
  • Solicitações on-line: US$ 0,0005
  • Solicitações em lote: US$ 0,0004
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
PaLM 2 para texto
(texto unicórnio)
Entrada Global
  • Solicitações on-line: US$ 0,0025
  • Solicitações em lote: US$ 0,0020
Saída Global
  • Solicitações on-line: US$ 0,0075
  • Solicitações em lote: US$ 0,0060
PaLM 2 para Chat (Chat Bison) Entrada Global
  • Solicitações on-line: US$ 0,00025
Saída Global
  • Solicitações on-line: US$ 0,0005
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
Aprendizado por reforço com base no feedback humano us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
PaLM 2 para Chat 32k (Chat Bison 32k) Entrada Global
  • Solicitações on-line: US$0,00025*
Saída Global
  • Solicitações on-line: US$0,.0005*
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
Embeddings para texto Entrada Global
  • Solicitações on-line: US$ 0,000025
  • Solicitações em lote: US$ 0,00002
Saída Global
  • Solicitações on-line: sem custo financeiro
  • Solicitações em lote: sem cobrança
Codey para geração de código Entrada Global
  • Solicitações on-line: US$ 0,00025
  • Solicitações em lote: US$0,00020
Saída Global
  • Solicitações on-line: US$ 0,0005
  • Solicitações em lote: US$ 0,0004
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
Codey para geração de código 32k Entrada Global
  • Solicitações on-line: US$ 0,00025
Saída Global
  • Solicitações on-line: US$ 0,0005
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
Codey para chat de código Entrada Global
  • Solicitações on-line: US$ 0,00025
Saída Global
  • Solicitações on-line: US$ 0,0005
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó Preços do treinamento personalizado da Vertex AI
Codey para chat de código 32k Entrada Global
  • Solicitações on-line: US$ 0,00025
Saída Global
  • Solicitações on-line: US$ 0,0005
Ajuste supervisionado us-central1
europe-west4
US$ por hora de uso do nó: Preços do treinamento personalizado da Vertex AI
Codey para preenchimento de código Entrada Global
  • Solicitações on-line: US$ 0,00025
Saída Global
  • Solicitações on-line: US$ 0,0005

Os preços são indicados em dólares americanos (USD). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Exemplo de cálculo de custo

Se um usuário enviar cinco solicitações separadas para o modelo PaLM Text Bison e cada solicitação tiver uma entrada de 200 caracteres e uma saída de 400 caracteres, a cobrança total será calculada da seguinte maneira:

Input cost:
200 input characters x 5 prompts = 1,000 total input characters;
1,000 total input characters x ($0.00025 / 1000) = $0.00025 input cost.

Output cost:
400 output characters x 5 prompts = 2,000 total output characters;
2,000 total output characters x ($0.0005 / 1000) = $0.001 output cost.

Total cost:
$0.00025 input cost + $0.001 output cost = $0.00125 total cost.

Modelos de parceiros

Os modelos de parceiros são uma lista selecionada de modelos de IA generativa desenvolvidos pelos parceiros do Google. Modelos de parceiros são oferecidos como APIs gerenciadas. Para mais informações, consulte Visão geral de modelos de parceiros. A tabela a seguir lista detalhes de preços para modelos de parceiros do Google:

Modelos Claude 3 da Anthropic

Modelo Preços
Claude 3 Opus Entrada: US$ 15 / milhão de tokens
Saída: US$ 75 / milhão de tokens
Claude 3 Sonnet Entrada: US$ 3 / milhão de tokens
Saída: US$ 15 / milhão de tokens
Claude 3 Haiku Entrada: US$ 0,25 / milhão de tokens
Saída: US$ 1,25 / milhão de tokens

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Entre em contato com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Entre em contato