Preços da Vertex AI

Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Preços da Vertex AI em comparação com produtos legados

Os custos da Vertex AI permanecem os mesmos dos produtos legados da AI Platform e do AutoML que a Vertex AI substitui, com as seguintes exceções:

As previsões legadas do AI Platform Prediction e do AutoML Tables oferecem suporte a tipos de máquina de baixo custo e baixo desempenho que não recebem suporte da Vertex AI Inference e do AutoML tabular.
O AI Platform Prediction legado oferece suporte à redução da escala a zero, que não é aceita pela Vertex AI Inference.

A Vertex AI também oferece mais maneiras de otimizar custos, como as seguintes:

Ambiente de execução otimizado do TensorFlow.
Suporte a modelos de co-hospedagem.
Não há duração mínima de uso para treinamento e previsão. O uso é cobrado em incrementos de 30 segundos.

Preços da IA generativa na Vertex AI

Para mais informações sobre os preços da IA generativa na Vertex AI, confira Preços da IA generativa na Vertex AI.

Preços para modelos do AutoML

Para modelos do AutoML na Vertex AI, você paga por três atividades principais:

Treinamento do modelo
Implantação do modelo em um endpoint
Uso do modelo para fazer previsões

A Vertex AI usa configurações de máquina predefinidas para modelos do Vertex AutoML, e a taxa por hora dessas atividades reflete o uso dos recursos.

O tempo necessário para treinar o modelo depende do tamanho e da complexidade dos dados de treinamento. É preciso implantar os modelos para que possam fornecer previsões ou explicações on-line.

Você paga por cada modelo implantado em um endpoint, mesmo que nenhuma previsão seja feita. É preciso cancelar a implantação do modelo para suspender cobranças futuras. Modelos que não foram implantados ou que falharam na implantação não serão cobrados.

Você paga apenas pelas horas de computação usadas. Se o treinamento falhar por qualquer motivo que não seja um cancelamento iniciado pelo usuário, você não será cobrado pelo tempo. Se você cancelar a operação, o tempo de treinamento será cobrado.

Selecione um tipo de modelo abaixo para conferir as informações de preço.

Dados de imagem

Operação	Preço (classificação) (USD)	Preço (detecção de objetos) (USD)
Treinamento	US$ 3,465 / 1 hour	US$ 3,465 / 1 hour
Treinamento (modelo no dispositivo AutoML Edge)	US$ 18,00 / 1 hour	US$ 18,00 / 1 hour
Implantação e previsão on-line	US$ 1,375 / 1 hour	US$ 2,002 / 1 hour
Previsão em lote	US$ 2,222 / 1 hour	US$ 2,222 / 1 hour

Dados tabulares

Operação	Preço por hora de uso do nó para classificação/regressão	Preço para estimativas
Treinamento	US$ 21,252 / 1 hour	Consulte a Previsão da Vertex AI
Inferência	Mesmo preço da inferência para modelos treinados personalizados. A Vertex AI realiza inferências em lote usando 40 máquinas n1-highmem-8.	Consulte a Previsão da Vertex AI

Operação

Preço por hora de uso do nó para classificação/regressão

Preço para estimativas

Treinamento

US$ 21,252 / 1 hour

Consulte a Previsão da Vertex AI

Inferência

Mesmo preço da inferência para modelos treinados personalizados.

A Vertex AI realiza inferências em lote usando 40 máquinas n1-highmem-8.

Consulte a Previsão da Vertex AI

Cobranças de inferência para a Vertex Explainable AI

A computação associada à Vertex Explainable AI é cobrada na mesma taxa que a inferência. Contudo, as explicações levam mais tempo para serem processadas do que as inferências normais. Por isso, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de inferência.

Previsão da Vertex AI

AutoML

Fase	Preços
Previsão	0 count to 1,000,000 count US$ 0,20 / 1,000 count, per 1 month / account 1,000,000 count to 50,000,000 count US$ 0,10 / 1,000 count, per 1 month / account 50,000,000 count and above US$ 0,02 / 1,000 count, per 1 month / account
Treinamento	US$ 21,252 / 1 hour
Explainable AI	Explicabilidade usando valores de Shapley. Consulte a página de preços de Inferência e Explicação da Vertex AI.

* Um ponto de dados de previsão é um ponto de tempo do horizonte de previsão. Por exemplo, com granularidade diária, um horizonte de 7 dias é 7 pontos a cada série temporal.

Até 5 quantis de previsão podem ser incluídos sem custos extras.
O número de pontos de dados consumidos por nível é atualizado mensalmente.

ARIMA+

Fase	Preços
Previsão	US$ 5,00 / 1,000 count
Treinamento	US$250,00 por TB x Número de modelos candidatos x Número de janelas de backtesting*
Explainable AI	A explicabilidade com decomposição de séries temporais não gera custos extras. Não há suporte para a explicabilidade usando valores de Shapley.

Consulte a página de preços do BigQuery ML para mais informações. Cada job de treinamento e previsão incorre o custo de 1 execução de pipeline gerenciada, conforme descrito nos preços da Vertex AI.

* Uma janela de backtest é criada para cada período no conjunto de testes. O AUTO_ARIMA_MAX_ORDER usado define o número de modelos candidatos. Esse número varia de 6 a 42 para modelos com diversas séries temporais.

Modelos treinados e personalizados

Treinamento

Confira nas tabelas abaixo o preço por hora aproximado de várias configurações de treinamento. É possível escolher configurações personalizadas de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.

Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela de aceleradores abaixo por quantas horas-máquina de cada tipo de acelerador você utiliza.

Tipos de máquina

É possível usar VMs spot com o treinamento personalizado da Vertex AI. VMs do Spot são cobradas de acordo com os preços das VMs do Spot do Compute Engine. Há taxas de gerenciamento de treinamento personalizado da Vertex AI além do uso da infraestrutura, capturadas nas tabelas a seguir.

É possível usar reservas do Compute Engine com o treinamento personalizado da Vertex AI. Ao usar reservas do Compute Engine, você recebe cobranças de acordo com os preços do Compute Engine, incluindo os descontos por uso contínuo (CUDs) aplicáveis. Há taxas de gerenciamento de treinamento personalizado da Vertex AI além do uso da infraestrutura, capturadas nas tabelas a seguir.

Tipo de máquina	Preço (USD)
g4-standard-48	US$ 5,17508763 / 1 hour
g4-standard-96	US$ 10,35017526 / 1 hour
g4-standard-192	US$ 20,70035052 / 1 hour
g4-standard-384	US$ 41,40070104 / 1 hour
n1-standard-4	US$ 0,21849885 / 1 hour
n1-standard-8	US$ 0,4369977 / 1 hour
n1-standard-16	US$ 0,8739954 / 1 hour
n1-standard-32	US$ 1,7479908 / 1 hour
n1-standard-64	US$ 3,4959816 / 1 hour
n1-standard-96	US$ 5,2439724 / 1 hour
n1-highmem-2	US$ 0,13604845 / 1 hour
n1-highmem-4	US$ 0,2720969 / 1 hour
n1-highmem-8	US$ 0,5441938 / 1 hour
n1-highmem-16	US$ 1,0883876 / 1 hour
n1-highmem-32	US$ 2,1767752 / 1 hour
n1-highmem-64	US$ 4,3535504 / 1 hour
n1-highmem-96	US$ 6,5303256 / 1 hour
n1-highcpu-16	US$ 0,65180712 / 1 hour
n1-highcpu-32	US$ 1,30361424 / 1 hour
n1-highcpu-64	US$ 2,60722848 / 1 hour
n1-highcpu-96	US$ 3,91084272 / 1 hour
a2-highgpu-1g*	US$ 4,425248914 / 1 hour
a2-highgpu-2g*	US$ 8,850497829 / 1 hour
a2-highgpu-4g*	US$ 17,700995658 / 1 hour
a2-highgpu-8g*	US$ 35,401991315 / 1 hour
a2-megagpu-16g*	US$ 65,707278915 / 1 hour
a3-highgpu-8g*	US$ 101,007352 / 1 hour
a3-megagpu-8g*	US$ 106,0464232 / 1 hour
a3-ultragpu-8g*	US$ 99,7739296 / 1 hour
a4-highgpu-8g*	US$ 148,212 / 1 hour
e2-standard-4	US$ 0,154126276 / 1 hour
e2-standard-8	US$ 0,308252552 / 1 hour
e2-standard-16	US$ 0,616505104 / 1 hour
e2-standard-32	US$ 1,233010208 / 1 hour
e2-highmem-2	US$ 0,103959618 / 1 hour
e2-highmem-4	US$ 0,207919236 / 1 hour
e2-highmem-8	US$ 0,415838472 / 1 hour
e2-highmem-16	US$ 0,831676944 / 1 hour
e2-highcpu-16	US$ 0,455126224 / 1 hour
e2-highcpu-32	US$ 0,910252448 / 1 hour
n2-standard-4	US$ 0,2233714 / 1 hour
n2-standard-8	US$ 0,4467428 / 1 hour
n2-standard-16	US$ 0,8934856 / 1 hour
n2-standard-32	US$ 1,7869712 / 1 hour
n2-standard-48	US$ 2,6804568 / 1 hour
n2-standard-64	US$ 3,5739424 / 1 hour
n2-standard-80	US$ 4,467428 / 1 hour
n2-highmem-2	US$ 0,1506661 / 1 hour
n2-highmem-4	US$ 0,3013322 / 1 hour
cloud-tpu	O preço é determinado pelo tipo do acelerador. Consulte "Aceleradores".
n2-highmem-8	US$ 0,6026644 / 1 hour
n2-highmem-16	US$ 1,2053288 / 1 hour
n2-highmem-32	US$ 2,4106576 / 1 hour
n2-highmem-48	US$ 3,6159864 / 1 hour
n2-highmem-64	US$ 4,8213152 / 1 hour
n2-highmem-80	US$ 6,026644 / 1 hour
n2-highcpu-16	US$ 0,6596032 / 1 hour
n2-highcpu-32	US$ 1,3192064 / 1 hour
n2-highcpu-48	US$ 1,9788096 / 1 hour
n2-highcpu-64	US$ 2,6384128 / 1 hour
n2-highcpu-80	US$ 3,298016 / 1 hour
c2-standard-4	US$ 0,2401292 / 1 hour
c2-standard-8	US$ 0,4802584 / 1 hour
c2-standard-16	US$ 0,9605168 / 1 hour
c2-standard-30	US$ 1,800969 / 1 hour
c2-standard-60	US$ 3,601938 / 1 hour
m1-ultramem-40	US$ 7,237065 / 1 hour
m1-ultramem-80	US$ 14,47413 / 1 hour
m1-ultramem-160	US$ 28,94826 / 1 hour
m1-megamem-96	US$ 12,249984 / 1 hour

*Esse valor inclui o preço da GPU, já que esse tipo de instância sempre exige um número fixo de aceleradores de GPU.

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Aceleradores

Tipo de máquina	Preço (USD)	Taxa de gerenciamento da Vertex
NVIDIA_TESLA_A100	US$ 2,933908 / 1 hour	US$ 0,4400862 / 1 hour
NVIDIA_TESLA_A100_80GB	US$ 3,92808 / 1 hour	US$ 0,589212 / 1 hour
NVIDIA_H100_80GB	US$ 9,79655057 / 1 hour	US$ 1,4694826 / 1 hour
NVIDIA_H200_141GB	US$ 10,708501 / 1 hour	Indisponível
NVIDIA_H100_MEGA_80GB	US$ 11,8959171 / 1 hour	Indisponível
NVIDIA_TESLA_L4	US$ 0,644046276 / 1 hour	Indisponível
NVIDIA_TESLA_P4	US$ 0,69 / 1 hour	Indisponível
NVIDIA_TESLA_P100	US$ 1,679 / 1 hour	Indisponível
NVIDIA_TESLA_T4	US$ 0,4025 / 1 hour	Indisponível
NVIDIA_TESLA_V100	US$ 2,852 / 1 hour	Indisponível
TPU_V2 Single (8 núcleos)	US$ 5,175 / 1 hour	Indisponível
Pod de TPU_V2 (32 núcleos)^*	US$ 27,60 / 1 hour	Indisponível
TPU_V3 Single (8 núcleos)	US$ 9,20 / 1 hour	Indisponível
Pod TPU_V3 (32 núcleos)^*	US$ 36,80 / 1 hour	Indisponível
tpu7x-standard-4t (1 chip)	US$ 13,80 / 1 hour	Indisponível

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

* O preço para treinar usando um pod do Cloud TPU é baseado no número de núcleos do pod. O número de núcleos de um pod é sempre um múltiplo de 32. Para determinar o preço de treinar em um pod com mais de 32 núcleos, pegue o preço de um pod de 32 núcleos e multiplique pelo número de núcleos, depois divida por 32. Por exemplo, o preço de um pod de 128 núcleos é (preço do pod de 32 núcleos) * (128/32). Para mais informações sobre quais pods do Cloud TPU estão disponíveis para regiões específicas, consulte Arquitetura do sistema na documentação do Cloud TPU.

Discos

Tipo de máquina	Preço (USD)
pd-standard	US$ 0,000063014 / 1 gibibyte hour
pd-ssd	US$ 0,000267808 / 1 gibibyte hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Todo o uso está sujeito à política de cotas da Vertex AI.
É necessário armazenar seus dados e arquivos de programas nos buckets do Google Cloud Storage durante o ciclo de vida da Vertex AI. Saiba mais sobre o uso do Cloud Storage.

Você recebe cobranças pelo treinamento dos modelos a contar do momento em que os recursos são provisionados para um job até a finalização dele.

Aviso:seus jobs de treinamento são limitados pela política de cotas da Vertex AI. É provável que a escolha de um cluster de alto processamento para os primeiros jobs de treinamento exceda sua cota.

Níveis de escalonamento para configurações predefinidas (AI Platform Training)

Defina o tipo de cluster de processamento que será usado ao treinar seu modelo. A maneira mais simples é escolher uma das configurações predefinidas, chamadas níveis de escalonamento. Saiba mais sobre os níveis de escalonamento.

Tipos de máquinas para configurações personalizadas

Se você usa a Vertex AI ou seleciona PERSONALIZADO como seu nível de escalonamento no AI Platform Training, você tem controle sobre o número e o tipo de máquinas virtuais que serão usadas para o mestre, o worker e o servidor de parâmetros do cluster. Leia mais sobre tipos de máquinas para Vertex AI e tipos de máquinas para AI Platform Training.

O custo do treinamento com um cluster de processamento personalizado será a soma de todas as máquinas que você especificar. A cobrança é baseada no tempo total do job, e não no tempo de processamento ativo de máquinas individuais.

Serviço de avaliação de IA generativa

Para métricas baseadas em modelos, as cobranças são aplicadas apenas aos custos de previsão associados ao modelo de autoavaliação. Eles são cobrados com base nos tokens de entrada que você fornece no conjunto de dados de avaliação e na saída do avaliador automático.

O Serviço de avaliação de IA generativa está disponível para todos os usuários (GA). A mudança de preço entrou em vigor em 14 de abril de 2025.

métrico	Preços
Por pontos	Modelo de avaliação automática padrão Gemini 2.0 Flash
Em pares	Modelo de avaliação automática padrão Gemini 2.0 Flash

métrico

Preços

Por pontos

Modelo de avaliação automática padrão

Gemini 2.0 Flash

Em pares

Modelo de avaliação automática padrão

Gemini 2.0 Flash

As métricas baseadas em computação são cobradas a US $0,00003 por 1.000 caracteres de entrada e US $0,00009 por 1.000 caracteres de saída. Eles são chamados de métricas automáticas no SKU.

Nome da métrica	Tipo
Correspondência exata	Com base em computação
Bleu	Com base em computação
Rouge	Com base em computação
Chamada de ferramenta válida	Com base em computação
Correspondência de nome da ferramenta	Com base em computação
Correspondência de chave de parâmetro da ferramenta	Com base em computação
Correspondência de KV de parâmetro de ferramenta	Com base em computação

As métricas legadas baseadas em modelos são cobradas a US $0,005 por 1.000 caracteres de entrada e US $0,015 por 1.000 caracteres de saída.

Nome da métrica	Tipo
Coerência	Por pontos
Fluência	Por pontos
Fulfillment	Por pontos
Segurança	Por pontos
Embasamento	Por pontos
Qualidade do resumo	Por pontos
Utilidade do resumo	Por pontos
Nível de detalhe do resumo	Por pontos
Qualidade das respostas a perguntas	Por pontos
Relevância das respostas a perguntas	Por pontos
Utilidade das respostas a perguntas	Por pontos
Correção das respostas a perguntas	Por pontos
Qualidade do resumo em pares	Em pares
Qualidade das respostas a perguntas por par	Em pares

Vertex AI Agent Engine

O Vertex AI Agent Engine é um conjunto de serviços para desenvolvedores escalonarem agentes em produção. Os serviços podem ser usados juntos ou separadamente. Você só paga o que usa. Hoje, você paga pelo ambiente de execução do Agent Engine.

A partir de 28 de janeiro de 2026, a cobrança vai começar para a execução de código, sessões e banco de memória.

Ambiente de execução

O preço é baseado nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no ambiente de execução do Agent Engine. O faturamento é arredondado para o segundo de uso mais próximo. O tempo de inatividade de um agente não é cobrado.

Nível gratuito

Para ajudar você a começar a usar o ambiente de execução, oferecemos um nível sem custo financeiro mensal.

vCPU: primeiros 180.000 vCPU-segundos (50 horas) por mês
RAM: primeiros 360.000 GiB-segundos (100 horas) por mês

Preços com base no uso

Quando o uso mensal exceder o nível sem custo financeiro, o faturamento começará de acordo com as taxas abaixo.

Recurso	Preço (USD)
vCPU	0 hour to 50 hour US$ 0,00 (Free) / 3,600 second, per 1 month / project 50 hour and above US$ 0,0864 / 3,600 second, per 1 month / project
RAM	0 gibibyte hour to 100 gibibyte hour US$ 0,00 (Free) / 3,600 gibibyte second, per 1 month / project 100 gibibyte hour and above US$ 0,009 / 3,600 gibibyte second, per 1 month / project

Execução de código

Assim como no ambiente de execução, você paga pela computação e memória necessárias para executar uma sandbox. O faturamento é arredondado para o segundo de uso mais próximo. O tempo ocioso não é cobrado.

Computação:US $0,0864 por hora de vCPU
Memória : US$0,0090 por GiB-hora

Sessões

Você paga com base no número de eventos armazenados no serviço de sessão. Cobramos pelos eventos de sessão armazenados que incluem conteúdo. Isso inclui a solicitação inicial do usuário, as respostas do modelo, as chamadas de função e as respostas de função. Não cobramos por eventos de controle do sistema (como pontos de verificação) armazenados no serviço de sessão.

US$ 0,25 por 1.000 eventos armazenados

Memory Bank

Pague com base no número de memórias armazenadas e retornadas.

Memória armazenada : US$0,25 por 1.000 memórias armazenadas por mês (mais os custos do LLM para gerar memórias, pagos separadamente)
Recuperação de memória:US $0,50 por 1.000 memórias retornadas. As primeiras 1.000 memórias retornadas por mês são gratuitas

Cenários de preço

Para ajudar você a entender o custo de usar os serviços do Agent Engine, oferecemos dois agentes hipotéticos: um agente leve e um agente padrão. Para os dois cenários, fazemos as seguintes suposições:

Níveis gratuitos : para estes cálculos, presumimos que os níveis gratuitos de ambiente de execução e banco de memória já foram usados em um mês para experimentação anterior.
Solicitações de execução por sessão:uma "sessão completa" ou conversa consiste em 10 solicitações de execução.
Sessões:cada solicitação de ambiente de execução gera uma média de 3 eventos de sessão.
Banco de memória:
Armazenamento: ao final de cada sessão completa, 1 memória é extraída e armazenada.
Recuperação:presumimos que 1 memória seja retornada por solicitação de ambiente de execução.
A execução de código é invocada em 30% de todas as solicitações de ambiente de execução.
Mês de faturamento:todos os cálculos mensais são baseados em um mês de 30 dias.

Observações adicionais:

Modularidade do serviço:embora os cenários abaixo mostrem o custo dos serviços do Agent Engine usados juntos, você pode optar por usar os serviços individualmente. Por exemplo, é possível usar os serviços de sessão e banco de memória do Agent Engine sem usar o ambiente de execução do Agent Engine.
Custos adicionais do modelo:os agentes precisam de LLMs para raciocinar e planejar. Os tokens de LLM consumidos por agentes são cobrados separadamente e não estão incluídos nos cenários abaixo.
Custos adicionais de ferramentas:os agentes precisam de ferramentas para realizar ações. As ferramentas usadas pelos agentes (por exemplo, chamadas de API, armazenamento) são cobradas separadamente e não estão incluídas nos cenários abaixo.

Cenários hipotéticos

Cenário 1: agente interno leve

Esse cenário representa agentes que lidam com tráfego esporádico de baixo volume.

Exemplos de casos de uso:um bot de suporte de TI para uma pequena empresa, um agente de produtividade pessoal que escreve e-mails ou um bot do Slack que fornece respostas com base na documentação.
Computação e memória necessárias para execução de código e ambiente de execução:1 vCPU / 1 GiB de RAM.
Tráfego:0,16 consulta por segundo (10 consultas por minuto), totalizando 432.000 solicitações por mês.
Duração média da solicitação : 3 segundos

Serviço	Cálculo	Custo mensal
Ambiente de execução	(432.000 solicitações × 3 s/solicitação ÷ 3.600 s/h) = 360 horas vCPU : (360 horas × 1 vCPU × US $0,0864/hora) = US $31,10 RAM: (360 horas × 1 GiB × US $0,0090/hora) = US $3,24	US$ 34,34
Execução de código	(360 horas de execução × 30% de uso) = 108 horas vCPU: (108 horas × 1 vCPU × US $0,0864/hora) = US $9,33 RAM : (108 horas × 1 GiB × US $0,0090/hora) = US $0,97	US$ 10,30
Sessões	432.000 solicitações x 3 eventos ÷ 1.000 x US $0,25	$ 324
Memory Bank	Armazenado: (432.000 solicitações ÷ 10 solicitações/sessão × 1 memória/sessão ÷ 1.000) × US $0,25 = US $10,80 Recuperação : (432.000 solicitações × 1 memória retornada ÷ 1.000) × US $0,50 = US $216,00	US$ 226,80
Custo mensal total estimado		US$ 595,44

Cenário 2: agente padrão

Esse cenário representa um agente de produção integrado a um aplicativo de negócios, que lida com tráfego de usuários consistente.

Exemplos de casos de uso:um agente de atendimento ao cliente em um site de e-commerce, um bot de qualificação de leads em um site B2B ou um agente interno de análise de dados para equipes de vendas.
Computação:2 vCPUs / 5 GiB de RAM
Tráfego:10 consultas por segundo (600 consultas por minuto), totalizando 25.920.000 solicitações por mês.
Duração média da solicitação : 5 segundos

Serviço	Cálculo	Custo mensal
Ambiente de execução	(25.920.000 solicitações × 5 s/solicitação ÷ 3.600 s/h) = 36.000 horas vCPU: (36.000 horas × 2 vCPUs × US $0,0864/hora) = US $6.220,80 RAM: (36.000 horas × 5 GiB × US $0,0090/hora) = US $1.620,00	US$ 7.840,80
Execução de código	(36.000 horas de execução × 30% de uso) = 10.800 horas vCPU : (10.800 horas × 2 vCPUs × US $0,0864/hora) = US $1.866,24 RAM: (10.800 horas × 5 GiB × US $0,0090/hora) = US $486	US$ 2.352,24
Sessões	25.920.000 solicitações * 3 eventos ÷ 1.000 × US $0,25	US$ 19.440
Memory Bank	Armazenado: (25.920.000 solicitações ÷ 10 solicitações/sessão × 1 memória/sessão ÷ 1.000) × US $0,25 = US $648,00 Recuperação: (25.920.000 solicitações × 1 memória retornada ÷ 1.000) × US $0,50 = US $12.960,00	US$ 13.608
Custo mensal total estimado		US$43.241,04

Ray na Vertex AI

Treinamento

Tipos de máquina

Tipo de máquina	Preço (USD)
n1-standard-4	US$ 0,2279988 / 1 hour
n1-standard-8	US$ 0,4559976 / 1 hour
n1-standard-16	US$ 0,9119952 / 1 hour
n1-standard-32	US$ 1,8239904 / 1 hour
n1-standard-64	US$ 3,6479808 / 1 hour
n1-standard-96	US$ 5,4719712 / 1 hour
n1-highmem-2	US$ 0,1419636 / 1 hour
n1-highmem-4	US$ 0,2839272 / 1 hour
n1-highmem-8	US$ 0,5678544 / 1 hour
n1-highmem-16	US$ 1,1357088 / 1 hour
n1-highmem-32	US$ 2,2714176 / 1 hour
n1-highmem-64	US$ 4,5428352 / 1 hour
n1-highmem-96	US$ 6,8142528 / 1 hour
n1-highcpu-16	US$ 0,68014656 / 1 hour
n1-highcpu-32	US$ 1,36029312 / 1 hour
n1-highcpu-64	US$ 2,72058624 / 1 hour
n1-highcpu-96	US$ 4,08087936 / 1 hour
a2-highgpu-1g*	US$ 4,408062 / 1 hour
a2-highgpu-2g*	US$ 8,816124 / 1 hour
a2-highgpu-4g*	US$ 17,632248 / 1 hour
a2-highgpu-8g*	US$ 35,264496 / 1 hour
a2-highgpu-16g*	US$ 70,528992 / 1 hour
a3-highgpu-8g*	US$ 105,39898088 / 1 hour
a3-megagpu-8g*	US$ 110,65714224 / 1 hour
a4-highgpu-8g*	US$ 148,212 / 1 hour
e2-standard-4	US$ 0,16082748 / 1 hour
e2-standard-4	US$ 0,32165496 / 1 hour
e2-standard-16	US$ 0,64330992 / 1 hour
e2-standard-32	US$ 1,28661984 / 1 hour
e2-highmem-2	US$ 0,10847966 / 1 hour
e2-highmem-4	US$ 0,21695932 / 1 hour
e2-highmem-8	US$ 0,43391864 / 1 hour
e2-highmem-16	US$ 0,86783728 / 1 hour
e2-highcpu-16	US$ 0,4749144 / 1 hour
e2-highcpu-32	US$ 0,9498288 / 1 hour
n2-standard-4	US$ 0,2330832 / 1 hour
n2-standard-8	US$ 0,4661664 / 1 hour
n2-standard-16	US$ 0,9323328 / 1 hour
n2-standard-32	US$ 1,8646656 / 1 hour
n2-standard-48	US$ 2,7969984 / 1 hour
n2-standard-64	US$ 3,7293312 / 1 hour
n2-standard-80	US$ 4,661664 / 1 hour
n2-highmem-2	US$ 0,1572168 / 1 hour
n2-highmem-4	US$ 0,3144336 / 1 hour
n2-highmem-8	US$ 0,6288672 / 1 hour
n2-highmem-16	US$ 1,2577344 / 1 hour
n2-highmem-32	US$ 2,5154688 / 1 hour
n2-highmem-48	US$ 3,7732032 / 1 hour
n2-highmem-64	US$ 5,0309376 / 1 hour
n2-highmem-80	US$ 6,288672 / 1 hour
n2-highcpu-16	US$ 0,6882816 / 1 hour
n2-highcpu-32	US$ 1,3765632 / 1 hour
n2-highcpu-48	US$ 2,0648448 / 1 hour
n2-highcpu-64	US$ 2,7531264 / 1 hour
n2-highcpu-80	US$ 3,441408 / 1 hour
c2-standard-4	US$ 0,2505696 / 1 hour
c2-standard-8	US$ 0,5011392 / 1 hour
c2-standard-16	US$ 1,0022784 / 1 hour
c2-standard-30	US$ 1,879272 / 1 hour
c2-standard-60	US$ 3,758544 / 1 hour
m1-ultramem-40	US$ 7,55172 / 1 hour
m1-ultramem-80	US$ 15,10344 / 1 hour
m1-ultramem-160	US$ 30,20688 / 1 hour
m1-megamem-96	US$ 12,782592 / 1 hour
cloud-tpu	O preço é determinado pelo tipo do acelerador. Consulte "Aceleradores".

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Aceleradores

Tipo de GPU	Preço (USD)
NVIDIA_TESLA_A100	US$ 3,5206896 / 1 hour
NVIDIA_TESLA_A100_80GB	US$ 4,517292 / 1 hour
NVIDIA_H100_80GB	US$ 11,75586073 / 1 hour
NVIDIA_TESLA_P4	US$ 0,72 / 1 hour
NVIDIA_TESLA_P100	US$ 1,752 / 1 hour
NVIDIA_TESLA_T4	US$ 0,42 / 1 hour
NVIDIA_TESLA_V100	US$ 2,976 / 1 hour
TPU_V2 Single (8 núcleos)	US$ 5,40 / 1 hour
Pod de TPU_V2 (32 núcleos)^*	US$ 28,80 / 1 hour
TPU_V3 Single (8 núcleos)	US$ 9,60 / 1 hour
Pod TPU_V3 (32 núcleos)^*	US$ 38,40 / 1 hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Discos

Tipo de disco	Preço (USD)
pd-standard	US$ 0,000065753 / 1 gibibyte hour
pd-ssd	US$ 0,000279452 / 1 gibibyte hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Todo o uso está sujeito à política de cotas da Vertex AI.
É necessário armazenar seus dados e arquivos de programas nos buckets do Google Cloud Storage durante o ciclo de vida da Vertex AI. Saiba mais sobre o uso do Cloud Storage.

Você recebe cobranças pelo treinamento dos modelos a contar do momento em que os recursos são provisionados para um job até a finalização dele.

Previsão e explicação

A tabela a seguir apresenta os preços da previsão em lote, da previsão on-line e da explicação on-line por hora de uso do nó. Uma hora de uso do nó representa o tempo que a máquina virtual leva executando um job de previsão ou aguardando em estado ativo (um endpoint com um ou mais modelos implantados) para lidar com solicitações de explicação ou previsão.

É possível usar VMs spot com a inferência da Vertex AI. VMs do Spot são cobradas de acordo com os preços das VMs do Spot do Compute Engine. Há taxas de gerenciamento da Vertex AI Inference além do uso da infraestrutura, capturadas nas tabelas a seguir.

É possível usar reservas do Compute Engine com a Vertex AI Inference. Ao usar reservas do Compute Engine, você recebe cobranças de acordo com os preços do Compute Engine, incluindo os descontos por uso contínuo (CUDs) aplicáveis. Há taxas de gerenciamento da Vertex AI Inference além do uso da infraestrutura, capturadas nas tabelas a seguir.

Série E2

Tipo de máquina	Preço (USD)
e2-standard-2	US$ 0,0770564 / 1 hour
e2-standard-4	US$ 0,1541128 / 1 hour
e2-standard-8	US$ 0,3082256 / 1 hour
e2-standard-16	US$ 0,6164512 / 1 hour
e2-standard-32	US$ 1,2329024 / 1 hour
e2-highmem-2	US$ 0,1039476 / 1 hour
e2-highmem-4	US$ 0,2078952 / 1 hour
e2-highmem-8	US$ 0,4157904 / 1 hour
e2-highmem-16	US$ 0,8315808 / 1 hour
e2-highcpu-2	US$ 0,056888 / 1 hour
e2-highcpu-4	US$ 0,113776 / 1 hour
e2-highcpu-8	US$ 0,227552 / 1 hour
e2-highcpu-16	US$ 0,455104 / 1 hour
e2-highcpu-32	US$ 0,910208 / 1 hour

Série N1

Tipo de máquina	Preço (USD)
n1-standard-2	US$ 0,1095 / 1 hour
n1-standard-4	US$ 0,219 / 1 hour
n1-standard-8	US$ 0,438 / 1 hour
n1-standard-16	US$ 0,876 / 1 hour
n1-standard-32	US$ 1,752 / 1 hour
n1-highmem-2	US$ 0,137 / 1 hour
n1-highmem-4	US$ 0,274 / 1 hour
n1-highmem-8	US$ 0,548 / 1 hour
n1-highmem-16	US$ 1,096 / 1 hour
n1-highcpu-2	US$ 0,081 / 1 hour
n1-highcpu-4	US$ 0,162 / 1 hour
n1-highcpu-8	US$ 0,324 / 1 hour
n1-highcpu-16	US$ 0,648 / 1 hour
n1-highcpu-32	US$ 1,296 / 1 hour

Série N2

Tipo de máquina	Preço (USD)
n2-standard-2	US$ 0,1116854 / 1 hour
n2-standard-4	US$ 0,2233708 / 1 hour
n2-standard-8	US$ 0,4467416 / 1 hour
n2-standard-16	US$ 0,8934832 / 1 hour
n2-standard-32	US$ 1,7869664 / 1 hour
n2-highmem-2	US$ 0,1506654 / 1 hour
n2-highmem-4	US$ 0,3013308 / 1 hour
n2-highmem-8	US$ 0,6026616 / 1 hour
n2-highmem-16	US$ 1,2053232 / 1 hour
n2-highcpu-2	US$ 0,0824504 / 1 hour
n2-highcpu-4	US$ 0,1649008 / 1 hour
n2-highcpu-8	US$ 0,3298016 / 1 hour
n2-highcpu-16	US$ 0,6596032 / 1 hour
n2-highcpu-32	US$ 1,3192064 / 1 hour

Série N2D

Tipo de máquina	Preço (USD)
n2d-standard-2	US$ 0,0971658 / 1 hour
n2d-standard-4	US$ 0,1943316 / 1 hour
n2d-standard-8	US$ 0,3886632 / 1 hour
n2d-standard-16	US$ 0,7773264 / 1 hour
n2d-standard-32	US$ 1,5546528 / 1 hour
n2d-highmem-2	US$ 0,131077 / 1 hour
n2d-highmem-4	US$ 0,262154 / 1 hour
n2d-highmem-8	US$ 0,524308 / 1 hour
n2d-highmem-16	US$ 1,048616 / 1 hour
n2d-highcpu-2	US$ 0,0717324 / 1 hour
n2d-highcpu-4	US$ 0,1434648 / 1 hour
n2d-highcpu-8	US$ 0,2869296 / 1 hour
n2d-highcpu-16	US$ 0,5738592 / 1 hour
n2d-highcpu-32	US$ 1,1477184 / 1 hour

Série C2

Tipo de máquina	Preço (USD)
c2-standard-4	US$ 0,240028 / 1 hour
c2-standard-8	US$ 0,480056 / 1 hour
c2-standard-16	US$ 0,960112 / 1 hour
c2-standard-30	US$ 1,80021 / 1 hour
c2-standard-60	US$ 3,60042 / 1 hour

Série C2D

Tipo de máquina	Preço (USD)
c2d-standard-2	US$ 0,1044172 / 1 hour
c2d-standard-4	US$ 0,2088344 / 1 hour
c2d-standard-8	US$ 0,4176688 / 1 hour
c2d-standard-16	US$ 0,8353376 / 1 hour
c2d-standard-32	US$ 1,6706752 / 1 hour
c2d-standard-56	US$ 2,9236816 / 1 hour
c2d-standard-112	US$ 5,8473632 / 1 hour
c2d-highmem-2	US$ 0,1408396 / 1 hour
c2d-highmem-4	US$ 0,2816792 / 1 hour
c2d-highmem-8	US$ 0,5633584 / 1 hour
c2d-highmem-16	US$ 1,1267168 / 1 hour
c2d-highmem-32	US$ 2,2534336 / 1 hour
c2d-highmem-56	US$ 3,9435088 / 1 hour
c2d-highmem-112	US$ 7,8870176 / 1 hour
c2d-highcpu-2	US$ 0,086206 / 1 hour
c2d-highcpu-4	US$ 0,172412 / 1 hour
c2d-highcpu-8	US$ 0,344824 / 1 hour
c2d-highcpu-16	US$ 0,689648 / 1 hour
c2d-highcpu-32	US$ 1,379296 / 1 hour
c2d-highcpu-56	US$ 2,413768 / 1 hour
c2d-highcpu-112	US$ 4,827536 / 1 hour

Série C3

Tipo de máquina	Preço (USD)
C3 highcpu 4	US$ 0,19824 / 1 hour
C3 highcpu 8	US$ 0,39648 / 1 hour
C3 highcpu 22	US$ 1,09032 / 1 hour
C3 highcpu 44	US$ 2,18064 / 1 hour
C3 highcpu 88	US$ 4,36128 / 1 hour
C3 highcpu 176	US$ 8,72256 / 1 hour

Série A2

Tipo de máquina	Preço (USD)
a2-highgpu-1g	US$ 4,2244949 / 1 hour
a2-highgpu-2g	US$ 8,4489898 / 1 hour
a2-highgpu-4g	US$ 16,8979796 / 1 hour
a2-highgpu-8g	US$ 33,7959592 / 1 hour
a2-megagpu-16g	US$ 64,1020592 / 1 hour
a2-ultragpu-1g	US$ 5,7818474 / 1 hour
a2-ultragpu-2g	US$ 11,5636948 / 1 hour
a2-ultragpu-4g	US$ 23,1273896 / 1 hour
a2-ultragpu-8g	US$ 46,2547792 / 1 hour

Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.

Série A3

Tipo de máquina	Preço (USD)
a3-ultragpu-8g	US$ 96,015616 / 1 hour
a3-megagpu-8g	US$ 106,65474 / 1 hour

Série A4

Tipo de máquina	Preço (USD)
a4-highgpu-8g	US$ 148,212 / 1 hour

Série A4X

Tipo de máquina	Preço (USD)
a4x-highgpu-4g	US$ 74,75 / 1 hour

a4x-highgpu-4g requer pelo menos 18 VMs.

Série G2

Tipo de máquina	Preço (USD)
g2-standard-4	US$ 0,81293 / 1 hour
g2-standard-8	US$ 0,98181 / 1 hour
g2-standard-12	US$ 1,15069 / 1 hour
g2-standard-16	US$ 1,31957 / 1 hour
g2-standard-24	US$ 2,30138 / 1 hour
g2-standard-32	US$ 1,99509 / 1 hour
g2-standard-48	US$ 4,60276 / 1 hour
g2-standard-96	US$ 9,20552 / 1 hour

Série G4

Tipo de máquina	Preço (USD)
g4-standard-48	US$ 5,17508763 / 1 hour
g4-standard-96	US$ 10,35017526 / 1 hour
g4-standard-192	US$ 20,70035052 / 1 hour
g4-standard-384	US$ 41,40070104 / 1 hour

Preços da TPU v5e

Tipo de máquina	Preço (USD)
ct5lp-hightpu-1t	US$ 1,38 / 1 hour
ct5lp-hightpu-4t	US$ 5,52 / 1 hour
ct5lp-hightpu-8t	US$ 5,52 / 1 hour

Preços da TPU v6e

Tipo de máquina	Preço (USD)
ct6e-standard-1t	US$ 3,105 / 1 hour
ct6e-standard-4t	US$ 12,42 / 1 hour
ct6e-standard-8t	US$ 24,84 / 1 hour

Cada tipo de máquina é cobrado como os seguintes SKUs na sua fatura do Google Cloud:

Custo de vCPU, calculado por vCPU/hora
Custo de RAM, calculado por GB/hora
Custo de GPU:quer seja integrado à máquina ou configurado opcionalmente, calculado por GPU/hora

Os preços por tipo de máquina são usados para aproximar o custo horário total para cada nó de previsão de uma versão do modelo que usa aquele tipo de máquina.

Por exemplo, um tipo de máquina n1-highcpu-32 inclui 32 vCPUs e 32 GB de RAM. Portanto, o preço por hora é igual a 32 vCPU/hora + 32 GB/hora.

Série E2

Item	Preço (USD)
vCPU	US$ 0,0250826 / 1 hour
RAM	US$ 0,0033614 / 1 gibibyte hour

Série N1

Item	Preço (USD)
vCPU	US$ 0,036 / 1 hour
RAM	US$ 0,005 / 1 gibibyte hour

Série N2

Item	Preço (USD)
vCPU	US$ 0,0363527 / 1 hour
RAM	US$ 0,0048725 / 1 gibibyte hour

Série N2D

Item	Preço (USD)
vCPU	US$ 0,0316273 / 1 hour
RAM	US$ 0,0042389 / 1 gibibyte hour

Série C2

Item	Preço (USD)
vCPU	US$ 0,039077 / 1 hour
RAM	US$ 0,0052325 / 1 gibibyte hour

Série C2D

Item	Preço (USD)
vCPU	US$ 0,0339974 / 1 hour
RAM	US$ 0,0045528 / 1 gibibyte hour

Série C3

Item	Preço (USD)
vCPU	US$ 0,03908 / 1 hour
RAM	US$ 0,00524 / 1 gibibyte hour

Série A2

Item	Preço (USD)
vCPU	US$ 0,0363527 / 1 hour
RAM	US$ 0,0048725 / 1 gibibyte hour
GPU (A100 40 GB)	US$ 3,3741 / 1 hour
GPU (A100 80 GB)	US$ 4,51729 / 1 hour

Série A3

Item	Preço (USD)
vCPU	US$ 0,0293227 / 1 hour
RAM	US$ 0,0025534 / 1 gibibyte hour
GPU (H100 80 GB)	US$ 11,2660332 / 1 hour
GPU (H200)	US$ 10,708501 / 1 hour

Série G2

Item	Preço (USD)
vCPU	US$ 0,02874 / 1 hour
RAM	US$ 0,00337 / 1 gibibyte hour
GPU (L4)	US$ 0,64405 / 1 hour

Alguns tipos de máquinas permitem adicionar aceleradores de GPU opcionais para previsão. As GPUs opcionais geram outras cobranças, separadas daquelas descritas na tabela anterior. Veja cada tabela de preços, que descreve os preços de cada tipo de GPU opcional.

Aceleradores: preço por hora

Tipo de GPU	Preço (USD)
NVIDIA_TESLA_P4	US$ 0,69 / 1 hour
NVIDIA_TESLA_P100	US$ 1,679 / 1 hour
NVIDIA_TESLA_T4	US$ 0,402 / 1 hour
NVIDIA_TESLA_V100	US$ 2,852 / 1 hour

O preço é por GPU. Se você usar várias GPUs por nó de previsão (ou se fizer escalonamento da versão para utilizar diversos nós),os custos serão escalonados proporcionalmente.

O AI Platform Prediction disponibiliza previsões a partir do seu modelo executando várias máquinas virtuais ("nós"). Por padrão, a Vertex AI escalona automaticamente o número de nós em execução a qualquer momento. Para previsão on-line, o número de nós é escalonado para atender à demanda. Cada nó pode responder a várias solicitações de previsão. Para previsão em lote, o número de nós é escalonado para reduzir o tempo total necessário para executar um job. Personalize a maneira como os nós de previsão são escalonados.

Você é cobrado pelo tempo que cada nó é executado para seu modelo, incluindo:

Quando o nó está processando um job de previsão em lote.
Quando o nó está processando uma solicitação de previsão on-line.
Quando o nó está em um estado pronto para cumprir as previsões on-line.

O custo de um nó em execução por uma hora é uma hora de uso do nó. A tabela de preços de previsão descreve o preço de uma hora do nó, que varia entre as regiões e entre a previsão on-line e a previsão em lote.

As horas de uso do nó podem ser consumidas em incrementos fracionários. Por exemplo, um nó em execução por 30 minutos custa 0,5 hora do nó.

Cálculo de custo dos tipos de máquina do Compute Engine (N1)

O tempo de execução de um nó é cobrado em incrementos de 30 segundos. Isso significa que, a cada 30 segundos, seu projeto é cobrado por 30 segundos de uso de qualquer recurso, como vCPU, RAM ou GPU, que o nó esteja usando no momento.

Mais sobre escalonamento automático de nós de previsão

Previsão on-line	Previsão em lote
A prioridade do escalonamento é reduzir a latência das solicitações individuais. O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após atender a uma solicitação.	A prioridade do escalonamento é reduzir o tempo total decorrido do job.
O escalonamento afeta suas taxas totais a cada mês: quanto mais numerosas e frequentes forem suas solicitações, mais nós serão usados.	O escalonamento provavelmente não terá muito efeito sobre o preço do seu job, ainda que haja alguns gastos indiretos envolvidos na criação de um novo nó.
Você pode escolher deixar o serviço ser escalonado em resposta ao tráfego (escalonamento automático) ou especificar vários nós para execução constante para evitar latência (escalonamento manual). Se você escolher o escalonamento automático, o número de nós será escalonado automaticamente. Para implantações do tipo de máquina legado da AI Platform Prediction (MLS1), o número de nós pode reduzir escala vertical para zero em períodos sem tráfego. As implantações da Vertex AI e outros tipos de implantações do AI Platform Prediction não podem reduzir escala vertical para zero nós. Se escolher o escalonamento manual, você especifica que alguns nós continuem em execução sempre. Você é cobrado por todo o tempo em que eles estão em execução, começando no momento da implantação e continuando até você excluir a versão do modelo.	É possível influenciar o escalonamento definindo um número máximo de nós a ser usado para um job de previsão em lote e definindo o número de nós que continuarão em execução para um modelo quando ele for implantado.

Previsão on-line

Previsão em lote

A prioridade do escalonamento é reduzir a latência das solicitações individuais. O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após atender a uma solicitação.

A prioridade do escalonamento é reduzir o tempo total decorrido do job.

O escalonamento afeta suas taxas totais a cada mês: quanto mais numerosas e frequentes forem suas solicitações, mais nós serão usados.

O escalonamento provavelmente não terá muito efeito sobre o preço do seu job, ainda que haja alguns gastos indiretos envolvidos na criação de um novo nó.

Você pode escolher deixar o serviço ser escalonado em resposta ao tráfego (escalonamento automático) ou especificar vários nós para execução constante para evitar latência (escalonamento manual).

Se você escolher o escalonamento automático, o número de nós será escalonado automaticamente. Para implantações do tipo de máquina legado da AI Platform Prediction (MLS1), o número de nós pode reduzir escala vertical para zero em períodos sem tráfego. As implantações da Vertex AI e outros tipos de implantações do AI Platform Prediction não podem reduzir escala vertical para zero nós.
Se escolher o escalonamento manual, você especifica que alguns nós continuem em execução sempre. Você é cobrado por todo o tempo em que eles estão em execução, começando no momento da implantação e continuando até você excluir a versão do modelo.

É possível influenciar o escalonamento definindo um número máximo de nós a ser usado para um job de previsão em lote e definindo o número de nós que continuarão em execução para um modelo quando ele for implantado.

Jobs de predição em lote são cobrados após a conclusão do job

Os jobs de previsão em lote são cobrados após a conclusão do job, e não de forma incremental durante o job. Os alertas de orçamento do Cloud Billing que você configurou não são acionados enquanto um job está em execução. Antes de iniciar um job grande, primeiro execute alguns jobs de comparação de custos com pequenos dados de entrada.

Exemplo de um cálculo de previsão

Uma empresa imobiliária em uma região das Américas realiza uma previsão semanal de valores de habitação nas áreas em que atende. Em um mês, realiza previsões para quatro semanas em lotes de 3920, 4277, 3849 e 3961. Os jobs são limitados a um nó, e cada instância leva uma média de 0,72 segundos de processamento.

Primeiro, calcule o período de tempo que cada job foi executado:

Carregando...

Cada job foi executado por mais de dez minutos, portanto, a cobrança é feita por cada minuto de processamento:

Carregando...

A cobrança total do mês é de US$ 0,26.

Este exemplo considera que os jobs foram executados em um único nó e demoraram um período consistente de tempo por instância de entrada. No uso real, certifique-se de contabilizar vários nós e usar o tempo real que cada nó gasta em execução para os seus cálculos.

Cobranças pela Vertex Explainable AI

Explicações baseadas em atributos

As explicações baseadas em recursos não têm custo extra sobre os preços de previsão. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais. Por isso, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de previsão.

Explicações baseadas em exemplos

O preço das explicações baseadas em exemplos consiste no seguinte:

Ao fazer upload de um modelo ou atualizar o conjunto de dados de um modelo, você será cobrado:
por hora de uso do nó para o job de previsão em lote usado para gerar as representações espaciais latentes de exemplos. Isso é cobrado à mesma taxa da previsão.
um custo para construir ou atualizar índices. Esse custo é igual aos custos de indexação da Pesquisa Vetorial, que é o número de exemplos * número de dimensões * 4 bytes por ponto flutuante * US$ 3,00 por GB. Por exemplo, se você tiver 1 milhão de exemplos e 1.000 dimensões de espaço latente, o custo será de US $12 (1.000.000 * 1.000 * 4 * 3,00 / 1.000.000.000).
Ao implantar em um endpoint, você será cobrado por hora de uso do nó para cada nó no endpoint. Toda a computação associada ao endpoint é cobrada à mesma taxa da previsão. No entanto, como as explicações baseadas em exemplos exigem recursos de computação adicionais para servir o índice da Pesquisa vetorial, isso resulta na inicialização de mais nós, o que aumenta as cobranças de previsão.

Pesquisa de arquitetura neural do Vertex AI

As tabelas a seguir resumem os preços em cada região em que a pesquisa de arquitetura neural está disponível.

Preços

As tabelas a seguir mostram o preço por hora de várias configurações.

É possível escolher um nível de escalonamento predefinido ou uma configuração personalizada de tipos de máquinas selecionados. Se você escolher uma configuração personalizada, some os custos das máquinas virtuais que você usa.

Tipos de máquinas legadas compatíveis com aceleradores incluem o custo dos aceleradores no preço. Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela a seguir de aceleradores pelo número de cada tipo de acelerador usado.

Tipos de máquina

Tipo de máquina	Preço (USD)
n1-standard-4	US$ 0,2849985 / 1 hour
n1-standard-8	US$ 0,569997 / 1 hour
n1-standard-16	US$ 1,139994 / 1 hour
n1-standard-32	US$ 2,279988 / 1 hour
n1-standard-64	US$ 4,559976 / 1 hour
n1-standard-96	US$ 6,839964 / 1 hour
n1-highmem-2	US$ 0,1774545 / 1 hour
n1-highmem-4	US$ 0,1774545 / 1 hour
n1-highmem-8	US$ 0,709818 / 1 hour
n1-highmem-16	US$ 1,419636 / 1 hour
n1-highmem-32	US$ 2,839272 / 1 hour
n1-highmem-64	US$ 5,678544 / 1 hour
n1-highmem-96	US$ 8,517816 / 1 hour
n1-highcpu-16	US$ 0,8501832 / 1 hour
n1-highcpu-32	US$ 1,7003664 / 1 hour
n1-highcpu-64	US$ 3,4007328 / 1 hour
n1-highcpu-96	US$ 5,1010992 / 1 hour
a2-highgpu-1g	US$ 5,641070651 / 1 hour
a2-highgpu-2g	US$ 11,282141301 / 1 hour
a2-highgpu-4g	US$ 22,564282603 / 1 hour
a2-highgpu-8g	US$ 45,128565205 / 1 hour
a2-highgpu-16g	US$ 90,257130411 / 1 hour
e2-standard-4	US$ 0,20103426 / 1 hour
e2-standard-8	US$ 0,40206852 / 1 hour
e2-standard-16	US$ 0,80413704 / 1 hour
e2-standard-32	US$ 1,60827408 / 1 hour
e2-highmem-2	US$ 0,13559949 / 1 hour
e2-highmem-4	US$ 0,27119898 / 1 hour
e2-highmem-8	US$ 0,54239796 / 1 hour
e2-highmem-16	US$ 1,08479592 / 1 hour
e2-highcpu-16	US$ 0,59364288 / 1 hour
e2-highcpu-32	US$ 1,18728576 / 1 hour
n2-standard-4	US$ 0,291354 / 1 hour
n2-standard-8	US$ 0,582708 / 1 hour
n2-standard-16	US$ 1,165416 / 1 hour
n2-standard-32	US$ 2,330832 / 1 hour
n2-standard-48	US$ 3,496248 / 1 hour
n2-standard-64	US$ 4,661664 / 1 hour
n2-standard-80	US$ 5,82708 / 1 hour
n2-highmem-2	US$ 0,196521 / 1 hour
n2-highmem-4	US$ 0,393042 / 1 hour
n2-highmem-8	US$ 0,786084 / 1 hour
n2-highmem-16	US$ 1,572168 / 1 hour
n2-highmem-32	US$ 3,144336 / 1 hour
n2-highmem-48	US$ 4,716504 / 1 hour
n2-highmem-64	US$ 6,288672 / 1 hour
n2-highmem-80	US$ 7,86084 / 1 hour
n2-highcpu-16	US$ 0,860352 / 1 hour
n2-highcpu-32	US$ 1,720704 / 1 hour
n2-highcpu-64	US$ 3,441408 / 1 hour
n2-highcpu-80	US$ 4,30176 / 1 hour
c2-standard-4	US$ 0,313212 / 1 hour
c2-standard-8	US$ 0,626424 / 1 hour
c2-standard-16	US$ 1,252848 / 1 hour
c2-standard-30	US$ 2,34909 / 1 hour
c2-standard-60	US$ 4,69818 / 1 hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Os preços das instâncias a2-highgpu incluem os encargos dos aceleradores NVIDIA_TESLA_A100 anexados.

Aceleradores

Tipo de GPU	Preço (USD)
NVIDIA_TESLA_A100	US$ 4,400862 / 1 hour
NVIDIA_TESLA_P4	US$ 0,90 / 1 hour
NVIDIA_TESLA_P100	US$ 2,19 / 1 hour
NVIDIA_TESLA_T4	US$ 0,525 / 1 hour
NVIDIA_TESLA_V100	US$ 3,72 / 1 hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Discos

Tipo de disco	Preço (USD)
pd-standard	US$ 0,000082192 / 1 gibibyte hour
pd-ssd	US$ 0,000349315 / 1 gibibyte hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Observações:

Todo o uso está sujeito à política de cotas da pesquisa de arquitetura neural.
É necessário armazenar seus dados e arquivos de programas em buckets do Cloud Storage durante o ciclo de vida da pesquisa de arquitetura neural. Saiba mais sobre o uso do Cloud Storage.
Para saber sobre descontos baseados em volume, entre em contato com a equipe de vendas.
O preço do disco só é cobrado quando você configura o tamanho do disco de cada VM para mais de 100 GB. Não há cobrança para os primeiros 100 GB (o tamanho padrão do disco) de disco para cada VM. Por exemplo, se você configurar cada VM para ter 105 GB de disco, será cobrado por 5 GB de disco para cada VM.

Uso obrigatório do Cloud Storage

Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida da pesquisa de arquitetura neural. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

preparação do pacote do aplicativo de treinamento;
armazenamento dos dados de entrada do treinamento

Observação:você pode usar outro serviço do Google Cloud para armazenar seus dados de entrada, como o BigQuery, que tem o próprio preço.

Armazenando a saída dos seus jobs. A pesquisa de arquitetura neural não exige armazenamento a longo prazo desses itens. Remova os arquivos assim que a operação for concluída.

Operações sem custo financeiro para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pela pesquisa de arquitetura neural estão disponíveis sem custo financeiro. A política de cotas da pesquisa de arquitetura neural limita algumas dessas operações.

Recurso	Operações gratuitas
empregos	get, list, cancel
operações	get, list, cancel, delete

Vertex AI Pipelines

O Vertex AI Pipelines tem uma taxa de execução de US$ 0,03 por pipeline. Não há cobranças pela taxa de execução durante a versão de pré-lançamento. Você também paga pelos recursos do Google Cloud usados com o Vertex AI Pipelines, como os componentes do Compute Engine consumidos por pipelines. O preço deles é igual ao do treinamento da Vertex AI. Por fim, você é responsável pelo custo de todos os serviços (como o Dataflow) chamados pelo seu pipeline.

Vertex AI Feature Store

O Vertex AI Feature Store está em disponibilidade geral (GA) desde novembro de 2023. Para obter informações sobre a versão anterior do produto, acesse Vertex AI Feature Store (legado).

Novo Vertex AI Feature Store

O novo Vertex AI Feature Store oferece suporte à funcionalidade em dois tipos de operações:

Operações off-line são operações para transferir, armazenar, recuperar e transformar dados no repositório off-line (BigQuery)
Operações on-line são operações para transferir dados para a(s) loja(s) on-line e operações sobre dados enquanto eles estão na(s) loja(s) on-line.

Preços das operações off-line

Como o BigQuery é usado para operações off-line, consulte os preços do BigQuery para funcionalidades como ingestão no repositório off-line, consulta ao repositório off-line e armazenamento off-line.

Preços das operações on-line

Para operações on-line, o Vertex AI Feature Store cobra por quaisquer recursos em GA para transferir dados para a loja on-line, fornecer ou armazenar dados. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta para concluir uma operação, cobrado por minuto.

Operação	Preço (USD)
Nó de processamento de dados Processamento de dados (por exemplo, ingestão em qualquer armazenamento, monitoramento etc.)	US$ 0,08 / 1 hour
Nó de veiculação on-line otimizado Disponibilização de baixa latência e disponibilização de embeddings Cada nó inclui 200 GB de armazenamento	US$ 0,30 / 1 hour
Nó de veiculação on-line do Bigtable Serving with Cloud Bigtable	US$ 0,94 / 1 hour
Armazenamento de veiculação on-line do Bigtable Armazenamento para veiculação com o Cloud Bigtable	US$ 0,000342466 / 1 gibibyte hour

A veiculação on-line otimizada e a veiculação on-line do Bigtable usam arquiteturas diferentes, portanto, seus nós não são comparáveis.

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Estimativas de carga de trabalho das operações on-line

Considere as diretrizes a seguir ao estimar suas cargas de trabalho. O número de nós necessários para determinada carga de trabalho pode diferir em cada abordagem de serviço.

Processamento de dados:
Ingestão: um nó pode ingerir aproximadamente um mínimo de 100 MiB de dados por hora em um repositório on-line do Bigtable ou em um repositório on-line otimizado se nenhuma função analítica for usada.
Veiculação on-line do Bigtable: cada nó pode suportar aproximadamente 15.000 QPS e até 5 TB de armazenamento.
Serviço on-line otimizado: o desempenho é baseado no tipo de máquina e nas réplicas, que são configuradas automaticamente para minimizar os custos sujeitos à carga de trabalho. Cada nó pode ter um mínimo de 2 e um máximo de 6 réplicas para alta disponibilidade e escalonamento automático. Você paga pelo número de réplicas. Para mais detalhes, consulte os exemplos de cenários mensais.
Para cargas de trabalho não relacionadas a embeddings, cada nó pode suportar aproximadamente 500 QPS e até 200 GB de armazenamento.
Para cargas de trabalho relacionadas a embeddings, cada nó pode oferecer suporte a aproximadamente 500 QPS e até 4 GB de armazenamento de dados dimensionais de 512.

É possível visualizar o número de nós (com réplicas) no Metrics Explorer:

Metrics Explorer para descobrir o número de nós que estão sendo usados.

Exemplo de cenários mensais (considerando us-central1)

Carga de trabalho de fluxo de dados: veiculação on-line do Bigtable com 2,5 TB de dados (1 GB atualizado diariamente) e 1.200 QPS

Operações	Uso mensal	Custo mensal
Nó de processamento de dados	(1 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 300 horas de uso do nó	300 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $24
Nó de veiculação on-line otimizado	N/D	N/D
Nó de veiculação on-line do Bigtable	(1 nó) * (24 horas/dia) * (30 dias/mês) = 720 horas de uso do nó	720 horas de uso do nó * (US$ 0,94 por hora de uso do nó) = US $677
Armazenamento de veiculação on-line do Bigtable	(2,5 TB por mês) * (1.000 GB/TB) = 2.500 GB por mês	2.500 GB por mês * (US$ 0,25 por GB por mês) = US $625
Total		US$ 1,326

Carga de trabalho de QPS alto: veiculação on-line otimizada com 10 GB de dados sem incorporação (5 GB atualizados diariamente) e 2.000 QPS

Operações	Uso mensal	Custo mensal
Nó de processamento de dados	(5 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 1.500 horas de uso do nó	1.500 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $120
Nó de veiculação on-line otimizado	Arredondamento(10 GB * (1 nó / 200 GB)) = 1 * máx.(2 réplicas padrão, 2.000 QPS * (1 réplica / 500 QPS)) = 4 nós no total * (24 horas/dia) * (30 dias/mês) =2.880 horas de uso do nó	2.880 horas de uso do nó * (US$ 0,30 por hora de uso do nó) = US$ 864
Nó de veiculação on-line do Bigtable	N/D	N/D
Armazenamento de veiculação on-line do Bigtable	N/D	N/D
Total		US$984

Carga de trabalho de veiculação de embeddings: veiculação on-line otimizada com 20 GB de dados de embeddings (2 GB atualizados diariamente) e 800 QPS

Operações	Uso mensal	Custo mensal
Nó de processamento de dados	(2 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 600 horas de uso do nó	600 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $48
Nó de veiculação on-line otimizado	Arredondamento(20 GB* (1 nó / 4 GB) = 5 * max(2 réplicas padrão, 800 QPS * (1 réplica / 500 QPS)) = 10 nós no total * (24 horas/dia) * (30 dias/mês) = 7.200 horas de uso do nó	7.200 horas de uso do nó * (US$ 0,30 por hora de uso do nó) = US$ 2.160
Nó de veiculação on-line do Bigtable	N/D	N/D
Armazenamento de veiculação on-line do Bigtable	N/D	N/D
Total		US$2.208

Feature Store da Vertex AI (legado)

Os preços do Vertex AI Feature Store (legado) dependem da quantidade de dados de recursos armazenados on-line e off-line, bem como da disponibilidade para veiculação on-line. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta exibindo dados do recurso ou aguardando em estado de prontidão para lidar com as solicitações de dados do recurso.

Operação	Preço (USD)
Armazenamento on-line	US$ 0,25 por GB/mês
Armazenamento off-line	US$ 0,023 por GB/mês
Exibição on-line	US$ 0,94 por nó/hora
Exportação em lote	US$ 0,005 por GB
Ingestão de streaming	US$ 0,10 por GB de ingestão

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Quando você ativa o monitoramento do valor do recurso, o faturamento inclui os encargos aplicáveis acima, além dos encargos aplicáveis a seguir:

US$ 3,50 por GB para todos os dados analisados. Com a análise de snapshots ativada, os snapshots obtidos para dados no Vertex AI Feature Store (legado) são incluídos. Com a análise de recursos de importação habilitada, lotes de dados ingeridos são incluídos.
As cobranças adicionais para outras operações do Vertex AI Feature Store (legado) usadas com o monitoramento do valor do recurso incluem o seguinte:
O recurso de análise de snapshot captura periodicamente um snapshot dos valores de recurso com base na sua configuração de intervalo de monitoramento.
A cobrança por uma exportação de snapshot é a mesma de uma operação normal de exportação em lote.

Exemplo de análise de snapshot

Um cientista de dados permite o monitoramento do valor do recurso para seu Vertex AI Feature Store (legado) e ativa o monitoramento para uma análise diária de snapshots. Um pipeline é executado diariamente para monitoramento de tipos da entidade. O pipeline verifica 2 GB de dados no Vertex AI Feature Store (legado) e exporta um snapshot contendo 0,1 GB de dados. A cobrança total de um dia de análise é:

(0,1 GB * US$ 3,50) + (2 GB * US$ 0,005) = US $0,36

Exemplo de análise de ingestão

Um cientista de dados permite o monitoramento do valor do recurso para seu Vertex AI Feature Store (legado) e ativa o monitoramento para operações de ingestão. Uma operação de ingestão importa 1 GB de dados para o Vertex AI Feature Store (legado). A cobrança total referente ao monitoramento do valor do recurso é:

(1 GB * US$ 3,50) = US $3,50

Vertex ML Metadata

O armazenamento de metadados é medido em gigabytes binários (GiB), sendo que 1 GiB é igual a 1.073.741.824 bytes. Essa unidade de medida também é conhecida como gibibyte.

O Vertex ML Metadata cobra US $10 por gibibyte (GiB) por mês pelo armazenamento de metadados. Os preços são rateados por megabyte (MB). Por exemplo, se você armazena 10 MB de metadados, será cobrado US $0,10 por mês por esses 10 MB de metadados.

Os preços são os mesmos em todas as regiões com suporte ao Vertex ML Metadata.

Vertex AI TensorBoard

Para usar o Vertex AI TensorBoard, solicite que o administrador do IAM do projeto atribua a você o papel "Usuário do app da Web do Vertex AI TensorBoard". A função de administrador da Vertex AI também tem acesso.

A partir de agosto de 2023, o preço do Vertex AI TensorBoard mudou de uma licença mensal por usuário de US $300/mês para US $10 GiB/mês para armazenamento de dados de registros e métricas. Isso significa que não há mais taxas de assinatura. Você pagará apenas pelo armazenamento que usar. Consulte o tutorial Vertex AI TensorBoard: excluir experimentos desatualizados do TensorBoard para saber como gerenciar o armazenamento.

Vertex AI Vizier

O Vertex AI Vizier é um serviço de otimização de caixa preta dentro do Vertex AI. O modelo de preços do Vertex AI Vizier consiste no seguinte:

Não há custo financeiro para testes que usam RANDOM_SEARCH e GRID_SEARCH. Saiba mais sobre os algoritmos de pesquisa.
Os primeiros 100 testes do Vertex AI Vizier por mês estão disponíveis sem custos financeiros. Os testes com RANDOM_SEARCH e GRID_SEARCH não contam para esse total.
Após os 100 testes do Vertex AI Vizier, os testes subsequentes durante o mesmo mês serão cobrados a US $1,00 por teste (testes que usam RANDOM_SEARCH ou GRID_SEARCH não geram custo financeiro).

Vector Search

O preço do serviço de Pesquisa Vetorial de vizinho mais próximo aproximado consiste em:

Preço de hora de uso do nó para cada VM usada na hospedagem de um índice implantado.
Um custo para criar novos índices, atualizar índices e usar atualizações de índices de streaming.

Os dados processados durante a criação e atualização dos índices são medidos em gigabytes (GiB) binários, em que 1 GiB é 1.073.741.824 bytes. Essa unidade de medida também é conhecida como gibibyte.

A Pesquisa Vetorial cobra US $3,00 por gibibyte (GiB) de dados processados em todas as regiões. A Pesquisa Vetorial cobra US $0,45/GiB ingerido para inserções de atualização de streaming.

As tabelas a seguir resumem o preço de um índice veiculado em cada região onde a Pesquisa Vetorial está disponível. O preço corresponde ao tipo de máquina, por região, e é cobrado por hora de uso do nó.

Tipo de máquina	Preço (USD)
e2-standard-2	US$ 0,0938084 / 1 hour
e2-standard-16	US$ 0,7504672 / 1 hour
e2-highmem-16	US$ 1,012368 / 1 hour
n2d-standard-32	US$ 1,8926208 / 1 hour
n1-standard-16	US$ 1,0639944 / 1 hour
n1-standard-32	US$ 2,1279888 / 1 hour

Exemplos de preços da Pesquisa Vetorial

O preço da Pesquisa Vetorial é determinado pelo tamanho dos seus dados, pela quantidade de consultas por segundo (QPS) que você quer executar e pelo número de nós que você usa. Para obter o custo estimado de veiculação, você precisa calcular o tamanho total dos dados. O tamanho dos dados é o número de embeddings/vetores* o número de dimensões que você tem* 4 bytes por dimensão. Depois de ter o tamanho dos seus dados, você pode calcular o custo de veiculação e o custo de criação. O custo de veiculação mais o custo de criação é igual ao custo total mensal.

Custo de veiculação: nº réplicas/fragmento * nº fragmentos (~tamanho dos dados/tamanho do fragmento) * custo por hora * 730 horas
Custo de criação: tamanho dos dados(em GiB) * US$ 3/GiB * nº de atualizações/mês

Atualização de streaming:a pesquisa de vetores usa métricas baseadas em heurística para determinar quando acionar a compactação. Se os dados não compactados mais antigos tiverem cinco dias, a compactação será sempre acionada. Você será cobrado pelo custo de recriar o índice pela mesma taxa de uma atualização em lote, além dos custos da atualização de streaming.

Número de embeddings/vetores	Número de dimensões	Consultas por segundo (QPS)	Tipo de máquina	Nós	Custo estimado de veiculação mensal (USD)
2 milhões	128	100	e2-standard-2	1	US$ 68
20 milhões	256	1.000	e2-standard-16	1	US$ 547
20 milhões	256	3.000	e2-standard-16	3	US$ 1.642
100 milhões	256	500	e2-highmem-16	2	US$ 1.477
1 bilhão	100	500	e2-highmem-16	8	US$ 5.910

Todos os exemplos são baseados em tipos de máquinas em us-central1. O custo gerado vai variar de acordo com a taxa de recall e os requisitos de latência. O custo estimado de veiculação mensal está diretamente relacionado ao número de nós usados no console. Para saber mais sobre os parâmetros de configuração que afetam o custo, consulte Parâmetros de configuração que afetam o recall e a latência.

Se você tiver um alto número de consultas por segundo (QPS), agrupar essas consultas em lote pode reduzir os custos totais em até 30%-40%.

Nível de pesquisa vetorial otimizado para armazenamento

Em vez de gerenciar e pagar por VMs individuais e jobs de compactação separados, há duas SKUs:

Unidades de capacidade (CUs): essa é a principal métrica para a disponibilização. Uma CU é uma unidade agrupada de computação e armazenamento SSD ativo, até 1 TiB cada, com preço de US $2,30 por CU, por hora, por réplica. Essa taxa única inclui o custo de veiculação e o gerenciamento contínuo do índice. O serviço é escalonado automaticamente e outras CUs são adicionadas conforme o tamanho do índice aumenta.
Unidades de gravação: para adicionar dados, há uma cobrança de US $0,45 por GiB. A cobrança se aplica a atualizações de índice em lote e de streaming.

Unidade	Preço
Unidade de capacidade otimizada para armazenamento	US$ 2,30 / 1 hour
Unidade de gravação	US$ 0,45 / 1 gibibyte

Vertex AI Model Registry

O Vertex AI Model Registry é um repositório central que rastreia e lista seus modelos e versões de modelos. Você pode importar modelos para a Vertex AI e eles aparecem no Vertex AI Model Registry. Não há nenhum custo associado a ter seus modelos no Model Registry. Os custos só são gerados quando você implanta o modelo em um endpoint ou executa uma previsão em lote no modelo. Esse custo é determinado pelo tipo de modelo que você está implantando.

Para saber mais sobre preços para implantação de modelos personalizados do Vertex AI Model Registry, consulte Modelos treinados de maneira personalizada. Para saber mais sobre preços para implantação de modelos AutoML, consulte Preços para modelos AutoML.

Monitoramento de modelos com a Vertex AI

Com a Vertex AI, é possível monitorar a eficácia contínua do seu modelo depois de implantá-lo na produção. Para mais informações, consulte Introdução ao Monitoramento de modelos com a Vertex AI.

Ao usar o Monitoramento de modelos da Vertex AI, você recebe cobranças da seguinte forma:

US$ 3,50 por GB para todos os dados analisados, incluindo os dados de treinamento fornecidos e os dados de previsão registrados em uma tabela do BigQuery.
Cobranças por outros produtos do Google Cloud que você usa com o Monitoramento de Modelos, como o armazenamento do BigQuery ou o Batch Explain, quando o monitoramento de atribuição está ativado.

O Vertex AI Model Monitoring é compatível com as seguintes regiões: us-central1, europe-west4, asia-east1 e asia-southeast1. Os preços são os mesmos em todas as regiões.

Os tamanhos dos dados são medidos depois de serem convertidos para o formato TfRecord.

Conjuntos de dados de treinamento geram uma cobrança única quando você configura um job de Monitoramento de Modelos da Vertex AI.

Os conjuntos de dados de previsão são registros coletados do serviço de previsão on-line. Conforme as solicitações de previsão chegam durante janelas de tempo diferentes, os dados de cada janela são coletados e a soma das informações analisadas em cada janela de previsão é usada para calcular a cobrança.

Exemplo: um cientista de dados executa o monitoramento de modelo no tráfego de previsão que pertence ao modelo.

O modelo é treinado com um conjunto de dados do BigQuery. O tamanho dos dados após a conversão para TfRecord é de 1,5 GB.
Os dados de previsão registrados entre 13h e 14h são de 0,1 GB, entre 15h e 16h é de 0,2 GB.
O preço total para configurar o job de monitoramento de modelo é:
(1,5 GB * US$ 3,50) + ((0,1 GB + 0,2 GB) * US$ 3,50) = US $6,30

Vertex AI Workbench

Selecione instâncias, notebooks gerenciados ou notebooks gerenciados pelo usuário para informações sobre preços.

Instâncias

Veja nas tabelas abaixo o preço por hora aproximado de várias configurações de VM. É possível escolher uma configuração personalizada de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.

CPUs

Tipo de máquina	Preço por vCPU (USD)
N1	US$ 0,0379332 / 1 hour
N2	US$ 0,0379332 / 1 hour
E2	US$ 0,026173908 / 1 hour
A2	US$ 0,0379332 / 1 hour

Memória

Tipo de máquina	Preço (USD)
N1	US$ 0,0050844 / 1 gibibyte hour
N2	US$ 0,0050844 / 1 gibibyte hour
E2	US$ 0,003508236 / 1 gibibyte hour
A2	US$ 0,0050844 / 1 gibibyte hour

Aceleradores

Tipo de máquina	Preço (USD)
Nvidia Tesla A100	US$ 4,400862 / 1 hour
Nvidia Tesla A100 80GB	US$ 4,51729 / 1 hour
Nvidia Tesla T4	US$ 0,525 / 1 hour
Nvidia Tesla V100	US$ 3,72 / 1 hour
Nvidia Tesla P100	US$ 2,19 / 1 hour

Discos

Tipo de máquina	Preço (USD)
Espaço provisionado extremo do Hyperdisk	US$ 0,000205479 / 1 gibibyte hour
Espaço provisionado balanceado	US$ 0,000164384 / 1 gibibyte hour
Espaço provisionado extremo	US$ 0,000205479 / 1 gibibyte hour
Espaço provisionado em SSD	US$ 0,000279452 / 1 gibibyte hour
Espaço provisionado padrão	US$ 0,000065753 / 1 gibibyte hour

Sua instância do Vertex AI Workbench gera cobranças da seguinte forma:

No caso do uso de CPU e acelerador, você recebe cobranças quando a instância está nos seguintes estados:
INICIANDO
PROVISIONANDO
ATIVOS
UPGRADE
REVERTENDO
RESTAURANDO
INTERROMPENDO
SUSPENDENDO
No caso do armazenamento em disco, você é cobrado quando a instância está nos seguintes estados:
INICIANDO
PROVISIONANDO
ATIVOS
UPGRADE
REVERTENDO
RESTAURANDO
INTERROMPENDO
PARADO
SUSPENDENDO
SUSPENSO

Notebooks gerenciados

O preço é composto pelos recursos de computação e armazenamento que você usa, as taxas de gerenciamento das instâncias do Vertex AI Workbench e eventuais recursos adicionais do Google Cloud que você adota. Consulte as seções a seguir para mais detalhes.

Recursos de computação e armazenamento

Os recursos de computação e armazenamento são cobrados usando a mesma taxa que você atualmente paga pelo Compute Engine e o Cloud Storage.

Taxas de administração

Existem taxas de administração do Vertex AI Workbench além do uso da infraestrutura, capturadas nas tabelas abaixo.

SKU	Preço (USD)
vCPU	US$ 0,05 por vCPU
T4 e P4 (GPU padrão)	US$ 0,35 por GPU
GPU P100, V100, L4 e A100 (GPU Premium)	US$ 2,48 por GPU

Notebooks gerenciados pelo usuário

Recursos de computação e armazenamento

Os recursos de computação e armazenamento são cobrados usando a mesma taxa que você atualmente paga pelo Compute Engine e o Cloud Storage.

Taxas de administração

Existem taxas de administração do Vertex AI Workbench além do uso da infraestrutura, capturadas nas tabelas abaixo.

SKU	Preço (USD)
vCPU	US$ 0,005 por vCPU
T4 e P4 (GPU padrão)	US$ 0,035 por GPU
GPU P100, V100 e A100 (GPU Premium)	US$ 0,25 por GPU

Recursos adicionais do Google Cloud

Além dos custos mencionados anteriormente, você também paga por eventuais recursos do Google Cloud que usar. Exemplo:

Serviços de análise de dados: os custos do BigQuery são gerados ao emitir consultas SQL em um notebook (consulte os Preços do BigQuery).
Chaves de criptografia gerenciadas pelo cliente: você está sujeito a cobranças pelo uso. Sempre que os notebooks gerenciados ou a instância de notebooks gerenciados pelo usuário usam uma chave do Cloud Key Management Service, a operação será cobrada de acordo com a taxa das operações de chave do Cloud KMS (consulte Preços do Cloud Key Management Service).

Colab Enterprise

Para informações sobre preços do Colab Enterprise, consulte Preços do Colab Enterprise.

Deep Learning Containers, VM de aprendizado profundo e pipelines da AI Platform

No caso dos Deep Learning Containers, Deep Learning VM Images e AI Platform Pipelines, o preço é calculado com base nos recursos de computação e de armazenamento que você usa. Esses recursos são cobrados usando a mesma taxa que você paga atualmente pelo Compute Engine e pelo Cloud Storage.

Além dos custos de computação e armazenamento, você também paga pelos recursos do Google Cloud que usar. Exemplo:

Serviços de análise de dados: os custos do BigQuery são gerados ao emitir consultas SQL em um notebook (consulte os Preços do BigQuery).
Chaves de criptografia gerenciadas pelo cliente: você está sujeito a cobranças pelo uso. Sempre que os notebooks gerenciados ou a instância de notebooks gerenciados pelo usuário usam uma chave do Cloud Key Management Service, a operação será cobrada de acordo com a taxa das operações de chave do Cloud KMS (consulte Preços do Cloud Key Management Service).

Rotulagem de dados

Com a Vertex AI, é possível solicitar a rotulagem humana de uma coleção de dados que você planeja usar para treinar um modelo de machine learning personalizado. Os preços do serviço são calculados com base no tipo de tarefa de rotulagem.

Para tarefas de rotulagem regular, os preços são determinados pelo número de unidades de anotação.
Em uma tarefa de classificação de imagem, as unidades são determinadas com base no número de imagens e na quantidade de rotuladores humanos. Por exemplo, uma imagem com três rotuladores humanos será contabilizada como 1 * 3 = 3 unidades. O preço da classificação de rótulo único e de vários rótulos é o mesmo.
Em uma tarefa de caixa delimitadora de imagem, as unidades são determinadas pelo número de caixas delimitadoras identificadas nas imagens e pelo número de rotuladores humanos. Por exemplo, uma imagem com duas caixas delimitadoras e três rotuladores humanos será contabilizada como 2 * 3 = 6 unidades. Imagens sem caixas delimitadoras não geram cobrança.
Em uma segmentação de imagens/caixa rotacionada/linha poligonal/tarefa poligonal, as unidades são determinadas da mesma forma que uma tarefa de caixa delimitadora de imagem.
Em uma tarefa de classificação de vídeo, as unidades são determinadas pela duração do vídeo (cinco segundos equivalem a uma unidade de preço) e pelo número de rotuladores humanos. Por exemplo, um vídeo de 25 segundos com três rotuladores humanos é contabilizado como 25 / 5 * 3 = 15 unidades. O preço da classificação de rótulo único e de vários rótulos é o mesmo.
Em uma tarefa de rastreamento de objetos em vídeo, a unidade é determinada pelo número de objetos identificados no vídeo e pelo número de rotuladores humanos. Por exemplo, um vídeo com dois objetos e três rotuladores humanos é contabilizado como 2 * 3 = 6 unidades. Vídeos sem objetos não geram cobrança.
Em uma tarefa de reconhecimento de ação em vídeo, as unidades são determinadas da mesma maneira que em uma tarefa de rastreamento de objetos de vídeo.
Em uma tarefa de classificação de texto, as unidades são determinadas pelo tamanho do texto (cada 50 palavras equivalem a uma unidade de preço) e pelo número de rotuladores humanos. Por exemplo, um trecho de texto com 100 palavras e três rotuladores humanos é contabilizado como 100 / 50 * 3 = 6 unidades. O preço da classificação de rótulo único e vários rótulos é o mesmo.
Em uma tarefa de sentimento de texto, as unidades são determinadas da mesma maneira que uma tarefa de classificação de texto.
Em uma tarefa de extração de entidade de texto, as unidades são determinadas pelo comprimento do texto (cada 50 palavras equivalem a uma unidade de preço), o número de entidades identificadas e o número de rotuladores humanos. Por exemplo, um trecho de texto com 100 palavras, duas entidades identificadas e três rotuladores humanos é contabilizado como 100 / 50 * 2 * 3 = 12 unidades. Textos sem entidades não geram cobrança.
Nas tarefas de classificação de imagem/vídeo/texto e de sentimento de texto, é possível que os rotuladores humanos percam o controle das classes se o tamanho do conjunto de rótulos for muito grande. Como resultado, enviamos no máximo 20 classes para os rotuladores humanos de cada vez. Por exemplo, se o tamanho do conjunto de rótulos de uma tarefa de rotulagem for 40, cada item de dados será enviado para revisão humana 40 / 20 = 2 vezes e cobraremos duas vezes o preço (calculado acima) conforme adequado.
Para uma tarefa de rotulagem que ativa o recurso de rotulador personalizado, cada item de dados é contabilizado como uma unidade de rotulador personalizado.
Em uma tarefa de rotulagem de aprendizagem ativa para itens de dados com anotações geradas por modelos (sem a ajuda de um rotulador humano), cada item de dados é contabilizado como uma unidade de aprendizagem ativa.
Para uma tarefa de rotulagem de aprendizagem ativa para itens de dados com anotações geradas por rotuladores humanos, cada item de dados é contabilizado como uma tarefa de rotulagem regular conforme descrito acima.

Na tabela abaixo, veja o preço por 1.000 unidades por rotulador humano com base na unidade listada para cada objetivo. Os preços do nível 1 se aplicam às primeiras 50 mil unidades por mês em cada projeto do Google Cloud. Os do nível 2 se aplicam às 950 mil unidades seguintes por mês no projeto, com um máximo de um milhão de unidades. Entre em contato conosco para saber os preços acima de um milhão de unidades por mês.

Tipo de dado	Objetivo	Unidade	Preço do nível 1 (USD)	Preço do nível 2 (USD)
Imagem	Classificação	Imagem	US$ 35	US$ 25
	Caixa delimitadora	Caixa delimitadora	US$ 63	US$ 49
	Segmentação	Segmento	US$ 870	US$ 850
	Caixa rotacionada	Caixa delimitadora	US$ 86	US$ 60
	Polígono/linha poligonal	Polígono/linha poligonal	US$ 257	US$ 180
Vídeo	Classificação	Vídeo de 5 segundos	US$ 86	US$ 60
	Rastreamento de objetos	Caixa delimitadora	US$ 86	US$ 60
	Reconhecimento de ação	Evento em vídeo de 30 segundos	US$ 214	US$ 150
Texto	Classificação	50 palavras	US$ 129	US$ 90
	Sentimento	50 palavras	US$ 200	US$ 140
	Extração de entidades	Entidade	US$ 86	US$ 60
Aprendizagem ativa	Todos	Item de dados	US$ 80	US$ 56
Rotulador personalizado	Todos	Item de dados	US$ 80	US$ 56

Uso obrigatório do Cloud Storage

Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida da Vertex AI. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

Preparação do pacote de aplicativo de treinamento para modelos treinados personalizados.
Armazenamento dos dados de entrada do treinamento.
Armazenamento do resultado dos jobs de treinamento. A Vertex AI não requer armazenamento a longo prazo desses itens. Remova os arquivos assim que a operação for concluída.

Operações gratuitas para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pelo AI Platform estão disponíveis sem custo financeiro. A política de cotas do AI Platform limita algumas dessas operações.

Recurso	Operações gratuitas
modelos	create, get, list, delete
versões	create, get, list, delete, setDefault
empregos	get, list, cancel
operações	get, list, cancel, delete

Custos do Google Cloud

Se você armazenar imagens para serem analisadas no Cloud Storage ou usar outros recursos do Google Cloud com a Vertex AI, então também receberá cobrança pelo uso desses serviços.

Para ver seu status atual de faturamento no console do Google Cloud, inclusive o uso e a fatura atual, consulte a página "Faturamento". Para mais detalhes sobre o gerenciamento da sua conta, consulte a documentação do Cloud Billing ou o suporte de faturamento e pagamentos.

A seguir

Leia a documentação da Vertex AI.
Saiba mais sobre soluções e casos de uso da Vertex AI.

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Fale com nossa equipe de vendas e receba uma cotação personalizada para sua organização.