Preços da Vertex AI

Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Preços da Vertex AI em comparação com produtos legados

Os custos da Vertex AI permanecem os mesmos dos produtos legados da AI Platform e do AutoML que a Vertex AI substitui, com as seguintes exceções:

  • As previsões legadas do AI Platform Prediction e do AutoML Tables oferecem suporte a tipos de máquina de baixo custo e baixo desempenho que não recebem suporte da Vertex AI Inference e do AutoML tabular.
  • O AI Platform Prediction legado oferece suporte à redução da escala a zero, que não é aceita pela Vertex AI Inference.

A Vertex AI também oferece mais maneiras de otimizar custos, como as seguintes:

Preços da IA generativa na Vertex AI

Para mais informações sobre os preços da IA generativa na Vertex AI, confira Preços da IA generativa na Vertex AI.

Preços para modelos do AutoML

Para modelos do AutoML na Vertex AI, você paga por três atividades principais:

  • Treinamento do modelo
  • Implantação do modelo em um endpoint
  • Uso do modelo para fazer previsões

A Vertex AI usa configurações de máquina predefinidas para modelos do Vertex AutoML, e a taxa por hora dessas atividades reflete o uso dos recursos.

O tempo necessário para treinar o modelo depende do tamanho e da complexidade dos dados de treinamento. É preciso implantar os modelos para que possam fornecer previsões ou explicações on-line.

Você paga por cada modelo implantado em um endpoint, mesmo que nenhuma previsão seja feita. É preciso cancelar a implantação do modelo para suspender cobranças futuras. Modelos que não foram implantados ou que falharam na implantação não serão cobrados.

Você paga apenas pelas horas de computação usadas. Se o treinamento falhar por qualquer motivo que não seja um cancelamento iniciado pelo usuário, você não será cobrado pelo tempo. Se você cancelar a operação, o tempo de treinamento será cobrado.

Selecione um tipo de modelo abaixo para conferir as informações de preço.

Dados de imagem

Operação

Preço (classificação) (USD)

Preço (detecção de objetos) (USD)

Treinamento

US$ 3,465 / 1 hourUS$ 3,465 / 1 hour

Treinamento (modelo no dispositivo AutoML Edge)

US$ 18,00 / 1 hourUS$ 18,00 / 1 hour

Implantação e previsão on-line

US$ 1,375 / 1 hourUS$ 2,002 / 1 hour

Previsão em lote

US$ 2,222 / 1 hourUS$ 2,222 / 1 hour

Dados tabulares

Operação

Preço por hora de uso do nó para classificação/regressão

Preço para estimativas

Treinamento

US$ 21,252 / 1 hour

Consulte a Previsão da Vertex AI

Previsão

Mesmo preço das previsões para modelos treinados personalizados.

A Vertex AI realiza previsões em lote usando 40 máquinas n1-highmem-8.

Consulte a Previsão da Vertex AI

Cobranças de previsão para Vertex Explainable AI

A computação associada à Vertex Explainable AI é cobrada na mesma taxa que a previsão. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais. Por isso, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de previsão.

Previsão da Vertex AI

AutoML

Fase

Preços

Previsão

0 count to 1,000,000 count
US$ 0,20 / 1,000 count, per 1 month / account
1,000,000 count to 50,000,000 count
US$ 0,10 / 1,000 count, per 1 month / account
50,000,000 count and above
US$ 0,02 / 1,000 count, per 1 month / account

Treinamento

US$ 21,252 / 1 hour

Explainable AI

Explicabilidade usando valores de Shapley. Consulte a página de preços de Inferência e Explicação da Vertex AI.

* Um ponto de dados de previsão é um ponto de tempo do horizonte de previsão. Por exemplo, com granularidade diária, um horizonte de 7 dias é 7 pontos a cada série temporal.

  • Até 5 quantis de previsão podem ser incluídos sem custos extras.
  • O número de pontos de dados consumidos por nível é atualizado mensalmente.

ARIMA+

Fase

Preços

Previsão

US$ 5,00 / 1,000 count

Treinamento

US$250,00 por TB x Número de modelos candidatos x Número de janelas de backtesting*

Explainable AI

A explicabilidade com decomposição de séries temporais não gera custos extras. Não há suporte para a explicabilidade usando valores de Shapley.

Consulte a página de preços do BigQuery ML para mais informações. Cada job de treinamento e previsão incorre o custo de 1 execução de pipeline gerenciada, conforme descrito nos preços da Vertex AI.

* Uma janela de backtest é criada para cada período no conjunto de testes. O AUTO_ARIMA_MAX_ORDER usado define o número de modelos candidatos. Esse número varia de 6 a 42 para modelos com diversas séries temporais.

Modelos treinados e personalizados

Treinamento

Confira nas tabelas abaixo o preço por hora aproximado de várias configurações de treinamento. É possível escolher configurações personalizadas de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.

Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela de aceleradores abaixo por quantas horas-máquina de cada tipo de acelerador você utiliza.

Tipos de máquina

É possível usar VMs spot com o treinamento personalizado da Vertex AI.As VMs do Spot são cobradas de acordo com os preços das VMs do Spot do Compute Engine. Há taxas de gerenciamento de treinamento personalizado da Vertex AI além do uso da infraestrutura, capturadas nas tabelas a seguir.

É possível usar reservas do Compute Engine com o treinamento personalizado da Vertex AI. Ao usar reservas do Compute Engine, você recebe cobranças de acordo com os preços do Compute Engine, incluindo os descontos por uso contínuo (CUDs) aplicáveis. Há taxas de gerenciamento de treinamento personalizado da Vertex AI além do uso da infraestrutura, capturadas nas tabelas a seguir.

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Delhi (asia-south2)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

n1-standard-4

US$ 0,21849885 / 1 hour

n1-standard-8

US$ 0,4369977 / 1 hour

n1-standard-16

US$ 0,8739954 / 1 hour

n1-standard-32

US$ 1,7479908 / 1 hour

n1-standard-64

US$ 3,4959816 / 1 hour

n1-standard-96

US$ 5,2439724 / 1 hour

n1-highmem-2

US$ 0,13604845 / 1 hour

n1-highmem-4

US$ 0,2720969 / 1 hour

n1-highmem-8

US$ 0,5441938 / 1 hour

n1-highmem-16

US$ 1,0883876 / 1 hour

n1-highmem-32

US$ 2,1767752 / 1 hour

n1-highmem-64

US$ 4,3535504 / 1 hour

n1-highmem-96

US$ 6,5303256 / 1 hour

n1-highcpu-16

US$ 0,65180712 / 1 hour

n1-highcpu-32

US$ 1,30361424 / 1 hour

n1-highcpu-64

US$ 2,60722848 / 1 hour

n1-highcpu-96

US$ 3,91084272 / 1 hour

a2-highgpu-1g*

US$ 4,425248914 / 1 hour

a2-highgpu-2g*

US$ 8,850497829 / 1 hour

a2-highgpu-4g*

US$ 17,700995658 / 1 hour

a2-highgpu-8g*

US$ 35,401991315 / 1 hour

a2-megagpu-16g*

US$ 65,707278915 / 1 hour

a3-highgpu-8g*

US$ 101,007352 / 1 hour

a3-megagpu-8g*

US$ 106,0464232 / 1 hour

a3-ultragpu-8g*

US$ 99,7739296 / 1 hour

a4-highgpu-8g*

-

e2-standard-4

US$ 0,154126276 / 1 hour

e2-standard-8

US$ 0,308252552 / 1 hour

e2-standard-16

US$ 0,616505104 / 1 hour

e2-standard-32

US$ 1,233010208 / 1 hour

e2-highmem-2

US$ 0,103959618 / 1 hour

e2-highmem-4

US$ 0,207919236 / 1 hour

e2-highmem-8

US$ 0,415838472 / 1 hour

e2-highmem-16

US$ 0,831676944 / 1 hour

e2-highcpu-16

US$ 0,455126224 / 1 hour

e2-highcpu-32

US$ 0,910252448 / 1 hour

n2-standard-4

US$ 0,2233714 / 1 hour

n2-standard-8

US$ 0,4467428 / 1 hour

n2-standard-16

US$ 0,8934856 / 1 hour

n2-standard-32

US$ 1,7869712 / 1 hour

n2-standard-48

US$ 2,6804568 / 1 hour

n2-standard-64

US$ 3,5739424 / 1 hour

n2-standard-80

US$ 4,467428 / 1 hour

n2-highmem-2

US$ 0,1506661 / 1 hour

n2-highmem-4

US$ 0,3013322 / 1 hour

n2-highmem-8

US$ 0,6026644 / 1 hour

n2-highmem-16

US$ 1,2053288 / 1 hour

n2-highmem-32

US$ 2,4106576 / 1 hour

n2-highmem-48

US$ 3,6159864 / 1 hour

n2-highmem-64

US$ 4,8213152 / 1 hour

n2-highmem-80

US$ 6,026644 / 1 hour

n2-highcpu-16

US$ 0,6596032 / 1 hour

n2-highcpu-32

US$ 1,3192064 / 1 hour

n2-highcpu-48

US$ 1,9788096 / 1 hour

n2-highcpu-64

US$ 2,6384128 / 1 hour

n2-highcpu-80

US$ 3,298016 / 1 hour

c2-standard-4

US$ 0,2401292 / 1 hour

c2-standard-8

US$ 0,4802584 / 1 hour

c2-standard-16

US$ 0,9605168 / 1 hour

c2-standard-30

US$ 1,800969 / 1 hour

c2-standard-60

US$ 3,601938 / 1 hour

m1-ultramem-40

US$ 7,237065 / 1 hour

m1-ultramem-80

US$ 14,47413 / 1 hour

m1-ultramem-160

US$ 28,94826 / 1 hour

m1-megamem-96

US$ 12,249984 / 1 hour

cloud-tpu

O preço é determinado pelo tipo do acelerador. Consulte "Aceleradores".

*Esse valor inclui o preço da GPU, porque esse tipo de instância sempre exige um número fixo de aceleradores de GPU.

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Aceleradores

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Delhi (asia-south2)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Berlin (europe-west10)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)
  • Phoenix (us-west8)

Tipo de máquina

Preço (US$)

Taxa de gerenciamento da Vertex

NVIDIA_TESLA_A100

US$ 2,933908 / 1 hourUS$ 0,4400862 / 1 hour

NVIDIA_TESLA_A100_80GB

US$ 3,92808 / 1 hourUS$ 0,589212 / 1 hour

NVIDIA_H100_80GB

US$ 9,79655057 / 1 hourUS$ 1,4694826 / 1 hour

NVIDIA_H200_141GB

US$ 10,708501 / 1 hour

Indisponível

NVIDIA_H100_MEGA_80GB

US$ 11,8959171 / 1 hour

Indisponível

NVIDIA_TESLA_L4

US$ 0,644046276 / 1 hour

Indisponível

NVIDIA_TESLA_P4

US$ 0,69 / 1 hour

Indisponível

NVIDIA_TESLA_P100

US$ 1,679 / 1 hour

Indisponível

NVIDIA_TESLA_T4

US$ 0,4025 / 1 hour

Indisponível

NVIDIA_TESLA_V100

US$ 2,852 / 1 hour

Indisponível

TPU_V2 Single (8 núcleos)

US$ 5,175 / 1 hour

Indisponível

Pod TPU_V2 (32 núcleos)*

US$ 27,60 / 1 hour

Indisponível

TPU_V3 Single (8 núcleos)

US$ 9,20 / 1 hour

Indisponível

Pod TPU_V3 (32 núcleos)*

US$ 36,80 / 1 hour

Indisponível

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

* O preço para treinar usando um pod do Cloud TPU é baseado no número de núcleos do pod. O número de núcleos de um pod é sempre um múltiplo de 32. Para determinar o preço de treinar em um pod com mais de 32 núcleos, pegue o preço de um pod de 32 núcleos e multiplique pelo número de núcleos, depois divida por 32. Por exemplo, o preço de um pod de 128 núcleos é (preço do pod de 32 núcleos) * (128/32). Para mais informações sobre quais pods do Cloud TPU estão disponíveis para regiões específicas, consulte Arquitetura do sistema na documentação do Cloud TPU.

Discos

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Delhi (asia-south2)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

pd-standard

US$ 0,000063014 / 1 gibibyte hour

pd-ssd

US$ 0,000267808 / 1 gibibyte hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Você recebe cobranças pelo treinamento dos modelos a contar do momento em que os recursos são provisionados para um job até a finalização dele.

Aviso:seus jobs de treinamento são limitados pela política de cotas da Vertex AI. É provável que a escolha de um cluster de alto processamento para os primeiros jobs de treinamento exceda sua cota.

Níveis de escalonamento para configurações predefinidas (AI Platform Training)

Defina o tipo de cluster de processamento que será usado ao treinar seu modelo. A maneira mais simples é escolher uma das configurações predefinidas, chamadas níveis de escalonamento. Saiba mais sobre os níveis de escalonamento.

Tipos de máquinas para configurações personalizadas

Se você usa a Vertex AI ou seleciona PERSONALIZADO como seu nível de escalonamento no AI Platform Training, você tem controle sobre o número e o tipo de máquinas virtuais que serão usadas para o mestre, o worker e o servidor de parâmetros do cluster. Leia mais sobre tipos de máquinas para Vertex AI e tipos de máquinas para AI Platform Training.

O custo do treinamento com um cluster de processamento personalizado será a soma de todas as máquinas que você especificar. A cobrança é baseada no tempo total do job, e não no tempo de processamento ativo de máquinas individuais.

Serviço de avaliação de IA generativa

Para métricas baseadas em modelos, as cobranças são aplicadas apenas aos custos de previsão associados ao modelo de autoavaliação. Eles são cobrados com base nos tokens de entrada que você fornece no conjunto de dados de avaliação e na saída do avaliador automático.

O Serviço de avaliação de IA generativa está disponível para todos os usuários (GA). A mudança de preço entrou em vigor em 14 de abril de 2025.

métrico

Preços

Por pontos

Modelo de avaliação automática padrão

Gemini 2.0 Flash

Em pares

Modelo de avaliação automática padrão

Gemini 2.0 Flash

As métricas baseadas em computação são cobradas a US $0,00003 por 1.000 caracteres de entrada e US $0,00009 por 1.000 caracteres de saída. Eles são chamados de métrica automática no SKU.

Nome da métrica

Tipo

Correspondência exata

Baseado em computação

Bleu

Baseado em computação

Rouge

Baseado em computação

Chamada de ferramenta válida

Baseado em computação

Correspondência de nome da ferramenta

Baseado em computação

Correspondência de chave de parâmetro da ferramenta

Baseado em computação

Correspondência de KV de parâmetro de ferramenta

Baseado em computação

Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

As métricas legadas baseadas em modelo são cobradas a US $0,005 por 1.000 caracteres de entrada e US $0,015 por 1.000 caracteres de saída.

Nome da métrica

Tipo

Coerência

Por pontos

Fluência

Por pontos

Fulfillment

Por pontos

Segurança

Por pontos

Embasamento

Por pontos

Qualidade do resumo

Por pontos

Utilidade do resumo

Por pontos

Nível de detalhe do resumo

Por pontos

Qualidade das respostas a perguntas

Por pontos

Relevância das respostas a perguntas

Por pontos

Utilidade das respostas a perguntas

Por pontos

Correção das respostas a perguntas

Por pontos

Qualidade do resumo em pares

Em pares

Qualidade das respostas a perguntas por par

Em pares

Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Vertex AI Agent Engine

O preço é baseado nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no ambiente de execução gerenciado do Agent Engine.

Recurso

Preço (US$)

vCPU

US$ 0,0994 / 1 hour

RAM

US$ 0,0105 / 1 gibibyte hour

Ray na Vertex AI

Treinamento

Confira nas tabelas abaixo o preço por hora aproximado de várias configurações de treinamento. É possível escolher configurações personalizadas de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.

Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela de aceleradores abaixo por quantas horas-máquina de cada tipo de acelerador você utiliza.

Tipos de máquina

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

n1-standard-4

US$ 0,2279988 / 1 hour

n1-standard-8

US$ 0,4559976 / 1 hour

n1-standard-16

US$ 0,9119952 / 1 hour

n1-standard-32

US$ 1,8239904 / 1 hour

n1-standard-64

US$ 3,6479808 / 1 hour

n1-standard-96

US$ 5,4719712 / 1 hour

n1-highmem-2

US$ 0,1419636 / 1 hour

n1-highmem-4

US$ 0,2839272 / 1 hour

n1-highmem-8

US$ 0,5678544 / 1 hour

n1-highmem-16

US$ 1,1357088 / 1 hour

n1-highmem-32

US$ 2,2714176 / 1 hour

n1-highmem-64

US$ 4,5428352 / 1 hour

n1-highmem-96

US$ 6,8142528 / 1 hour

n1-highcpu-16

US$ 0,68014656 / 1 hour

n1-highcpu-32

US$ 1,36029312 / 1 hour

n1-highcpu-64

US$ 2,72058624 / 1 hour

n1-highcpu-96

US$ 4,08087936 / 1 hour

a2-highgpu-1g*

US$ 4,408062 / 1 hour

a2-highgpu-2g*

US$ 8,816124 / 1 hour

a2-highgpu-4g*

US$ 17,632248 / 1 hour

a2-highgpu-8g*

US$ 35,264496 / 1 hour

a2-highgpu-16g*

US$ 70,528992 / 1 hour

a3-highgpu-8g*

US$ 105,39898088 / 1 hour

a3-megagpu-8g*

US$ 110,65714224 / 1 hour

a4-highgpu-8g*

US$ 148,212 / 1 hour

e2-standard-4

US$ 0,16082748 / 1 hour

e2-standard-4

US$ 0,32165496 / 1 hour

e2-standard-16

US$ 0,64330992 / 1 hour

e2-standard-32

US$ 1,28661984 / 1 hour

e2-highmem-2

US$ 0,10847966 / 1 hour

e2-highmem-4

US$ 0,21695932 / 1 hour

e2-highmem-8

US$ 0,43391864 / 1 hour

e2-highmem-16

US$ 0,86783728 / 1 hour

e2-highcpu-16

US$ 0,4749144 / 1 hour

e2-highcpu-32

US$ 0,9498288 / 1 hour

n2-standard-4

US$ 0,2330832 / 1 hour

n2-standard-8

US$ 0,4661664 / 1 hour

n2-standard-16

US$ 0,9323328 / 1 hour

n2-standard-32

US$ 1,8646656 / 1 hour

n2-standard-48

US$ 2,7969984 / 1 hour

n2-standard-64

US$ 3,7293312 / 1 hour

n2-standard-80

US$ 4,661664 / 1 hour

n2-highmem-2

US$ 0,1572168 / 1 hour

n2-highmem-4

US$ 0,3144336 / 1 hour

n2-highmem-8

US$ 0,6288672 / 1 hour

n2-highmem-16

US$ 1,2577344 / 1 hour

n2-highmem-32

US$ 2,5154688 / 1 hour

n2-highmem-48

US$ 3,7732032 / 1 hour

n2-highmem-64

US$ 5,0309376 / 1 hour

n2-highmem-80

US$ 6,288672 / 1 hour

n2-highcpu-16

US$ 0,6882816 / 1 hour

n2-highcpu-32

US$ 1,3765632 / 1 hour

n2-highcpu-48

US$ 2,0648448 / 1 hour

n2-highcpu-64

US$ 2,7531264 / 1 hour

n2-highcpu-80

US$ 3,441408 / 1 hour

c2-standard-4

US$ 0,2505696 / 1 hour

c2-standard-8

US$ 0,5011392 / 1 hour

c2-standard-16

US$ 1,0022784 / 1 hour

c2-standard-30

US$ 1,879272 / 1 hour

c2-standard-60

US$ 3,758544 / 1 hour

m1-ultramem-40

US$ 7,55172 / 1 hour

m1-ultramem-80

US$ 15,10344 / 1 hour

m1-ultramem-160

US$ 30,20688 / 1 hour

m1-megamem-96

US$ 12,782592 / 1 hour

cloud-tpu

O preço é determinado pelo tipo do acelerador. Consulte "Aceleradores".

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Aceleradores

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de GPU

Preço (US$)

NVIDIA_TESLA_A100

US$ 3,5206896 / 1 hour

NVIDIA_TESLA_A100_80GB

US$ 4,517292 / 1 hour

NVIDIA_H100_80GB

US$ 11,75586073 / 1 hour

NVIDIA_TESLA_P4

US$ 0,72 / 1 hour

NVIDIA_TESLA_P100

US$ 1,752 / 1 hour

NVIDIA_TESLA_T4

US$ 0,42 / 1 hour

NVIDIA_TESLA_V100

US$ 2,976 / 1 hour

TPU_V2 Single (8 núcleos)

US$ 5,40 / 1 hour

Pod TPU_V2 (32 núcleos)*

US$ 28,80 / 1 hour

TPU_V3 Single (8 núcleos)

US$ 9,60 / 1 hour

Pod TPU_V3 (32 núcleos)*

US$ 38,40 / 1 hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

* O preço para treinar usando um pod do Cloud TPU é baseado no número de núcleos do pod. O número de núcleos de um pod é sempre um múltiplo de 32. Para determinar o preço de treinar em um pod com mais de 32 núcleos, pegue o preço de um pod de 32 núcleos e multiplique pelo número de núcleos, depois divida por 32. Por exemplo, o preço de um pod de 128 núcleos é (preço do pod de 32 núcleos) * (128/32). Para mais informações sobre quais pods do Cloud TPU estão disponíveis para regiões específicas, consulte Arquitetura do sistema na documentação do Cloud TPU.

Discos

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de disco

Preço (US$)

pd-standard

US$ 0,000065753 / 1 gibibyte hour

pd-ssd

US$ 0,000279452 / 1 gibibyte hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.


Você recebe cobranças pelo treinamento dos modelos a contar do momento em que os recursos são provisionados para um job até a finalização dele.

Aviso:seus jobs de treinamento são limitados pela política de cotas da Vertex AI. É provável que a escolha de um cluster de alto processamento para os primeiros jobs de treinamento exceda sua cota.

Previsão e explicação

A tabela a seguir apresenta os preços da previsão em lote, da previsão on-line e da explicação on-line por hora de uso do nó. Uma hora de uso do nó representa o tempo que a máquina virtual leva executando um job de previsão ou aguardando em estado ativo (um endpoint com um ou mais modelos implantados) para lidar com solicitações de explicação ou previsão.

É possível usar VMs spot com a inferência da Vertex AI.As VMs do Spot são cobradas de acordo com os preços das VMs do Spot do Compute Engine. Há taxas de gerenciamento da Vertex AI Inference além do uso da infraestrutura, capturadas nas tabelas a seguir.

É possível usar reservas do Compute Engine com a Vertex AI Inference. Ao usar reservas do Compute Engine, você recebe cobranças de acordo com os preços do Compute Engine, incluindo os descontos por uso contínuo (CUDs) aplicáveis. Há taxas de gerenciamento da Vertex AI Inference além do uso da infraestrutura, capturadas nas tabelas a seguir.

Série E2

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

e2-standard-2

US$ 0,0770564 / 1 hour

e2-standard-4

US$ 0,1541128 / 1 hour

e2-standard-8

US$ 0,3082256 / 1 hour

e2-standard-16

US$ 0,6164512 / 1 hour

e2-standard-32

US$ 1,2329024 / 1 hour

e2-highmem-2

US$ 0,1039476 / 1 hour

e2-highmem-4

US$ 0,2078952 / 1 hour

e2-highmem-8

US$ 0,4157904 / 1 hour

e2-highmem-16

US$ 0,8315808 / 1 hour

e2-highcpu-2

US$ 0,056888 / 1 hour

e2-highcpu-4

US$ 0,113776 / 1 hour

e2-highcpu-8

US$ 0,227552 / 1 hour

e2-highcpu-16

US$ 0,455104 / 1 hour

e2-highcpu-32

US$ 0,910208 / 1 hour

Série N1

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

n1-standard-2

US$ 0,1095 / 1 hour

n1-standard-4

US$ 0,219 / 1 hour

n1-standard-8

US$ 0,438 / 1 hour

n1-standard-16

US$ 0,876 / 1 hour

n1-standard-32

US$ 1,752 / 1 hour

n1-highmem-2

US$ 0,137 / 1 hour

n1-highmem-4

US$ 0,274 / 1 hour

n1-highmem-8

US$ 0,548 / 1 hour

n1-highmem-16

US$ 1,096 / 1 hour

n1-highcpu-2

US$ 0,081 / 1 hour

n1-highcpu-4

US$ 0,162 / 1 hour

n1-highcpu-8

US$ 0,324 / 1 hour

n1-highcpu-16

US$ 0,648 / 1 hour

n1-highcpu-32

US$ 1,296 / 1 hour

Série N2

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

n2-standard-2

US$ 0,1116854 / 1 hour

n2-standard-4

US$ 0,2233708 / 1 hour

n2-standard-8

US$ 0,4467416 / 1 hour

n2-standard-16

US$ 0,8934832 / 1 hour

n2-standard-32

US$ 1,7869664 / 1 hour

n2-highmem-2

US$ 0,1506654 / 1 hour

n2-highmem-4

US$ 0,3013308 / 1 hour

n2-highmem-8

US$ 0,6026616 / 1 hour

n2-highmem-16

US$ 1,2053232 / 1 hour

n2-highcpu-2

US$ 0,0824504 / 1 hour

n2-highcpu-4

US$ 0,1649008 / 1 hour

n2-highcpu-8

US$ 0,3298016 / 1 hour

n2-highcpu-16

US$ 0,6596032 / 1 hour

n2-highcpu-32

US$ 1,3192064 / 1 hour

Série N2D

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

n2d-standard-2

US$ 0,0971658 / 1 hour

n2d-standard-4

US$ 0,1943316 / 1 hour

n2d-standard-8

US$ 0,3886632 / 1 hour

n2d-standard-16

US$ 0,7773264 / 1 hour

n2d-standard-32

US$ 1,5546528 / 1 hour

n2d-highmem-2

US$ 0,131077 / 1 hour

n2d-highmem-4

US$ 0,262154 / 1 hour

n2d-highmem-8

US$ 0,524308 / 1 hour

n2d-highmem-16

US$ 1,048616 / 1 hour

n2d-highcpu-2

US$ 0,0717324 / 1 hour

n2d-highcpu-4

US$ 0,1434648 / 1 hour

n2d-highcpu-8

US$ 0,2869296 / 1 hour

n2d-highcpu-16

US$ 0,5738592 / 1 hour

n2d-highcpu-32

US$ 1,1477184 / 1 hour

Série C2

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Sydney (australia-southeast1)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

c2-standard-4

US$ 0,240028 / 1 hour

c2-standard-8

US$ 0,480056 / 1 hour

c2-standard-16

US$ 0,960112 / 1 hour

c2-standard-30

US$ 1,80021 / 1 hour

c2-standard-60

US$ 3,60042 / 1 hour

Série C2D

  • Taiwan (asia-east1)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

c2d-standard-2

US$ 0,1044172 / 1 hour

c2d-standard-4

US$ 0,2088344 / 1 hour

c2d-standard-8

US$ 0,4176688 / 1 hour

c2d-standard-16

US$ 0,8353376 / 1 hour

c2d-standard-32

US$ 1,6706752 / 1 hour

c2d-standard-56

US$ 2,9236816 / 1 hour

c2d-standard-112

US$ 5,8473632 / 1 hour

c2d-highmem-2

US$ 0,1408396 / 1 hour

c2d-highmem-4

US$ 0,2816792 / 1 hour

c2d-highmem-8

US$ 0,5633584 / 1 hour

c2d-highmem-16

US$ 1,1267168 / 1 hour

c2d-highmem-32

US$ 2,2534336 / 1 hour

c2d-highmem-56

US$ 3,9435088 / 1 hour

c2d-highmem-112

US$ 7,8870176 / 1 hour

c2d-highcpu-2

US$ 0,086206 / 1 hour

c2d-highcpu-4

US$ 0,172412 / 1 hour

c2d-highcpu-8

US$ 0,344824 / 1 hour

c2d-highcpu-16

US$ 0,689648 / 1 hour

c2d-highcpu-32

US$ 1,379296 / 1 hour

c2d-highcpu-56

US$ 2,413768 / 1 hour

c2d-highcpu-112

US$ 4,827536 / 1 hour

Série C3

  • Singapore (asia-southeast1)
  • Belgium (europe-west1)
  • Netherlands (europe-west4)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)

Tipo de máquina

Preço (US$)

C3 highcpu 4

US$ 0,19824 / 1 hour

C3 highcpu 8

US$ 0,39648 / 1 hour

C3 highcpu 22

US$ 1,09032 / 1 hour

C3 highcpu 44

US$ 2,18064 / 1 hour

C3 highcpu 88

US$ 4,36128 / 1 hour

C3 highcpu 176

US$ 8,72256 / 1 hour

Série A2

  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Singapore (asia-southeast1)
  • Netherlands (europe-west4)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Oregon (us-west1)
  • Salt Lake City (us-west3)

Tipo de máquina

Preço (US$)

a2-highgpu-1g

US$ 4,2244949 / 1 hour

a2-highgpu-2g

US$ 8,4489898 / 1 hour

a2-highgpu-4g

US$ 16,8979796 / 1 hour

a2-highgpu-8g

US$ 33,7959592 / 1 hour

a2-megagpu-16g

US$ 64,1020592 / 1 hour

a2-ultragpu-1g

US$ 5,7818474 / 1 hour

a2-ultragpu-2g

US$ 11,5636948 / 1 hour

a2-ultragpu-4g

US$ 23,1273896 / 1 hour

a2-ultragpu-8g

US$ 46,2547792 / 1 hour

Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.

Série A3

  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Delhi (asia-south2)
  • Singapore (asia-southeast1)
  • Sydney (australia-southeast1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Toronto (northamerica-northeast2)
  • Iowa (us-central1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

a3-ultragpu-8g

US$ 96,015616 / 1 hour

a3-megagpu-8g

US$ 106,65474 / 1 hour

Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.

Série A4

  • Singapore (asia-southeast1)
  • Iowa (us-central1)
  • Los Angeles (us-west2)

Tipo de máquina

Preço (US$)

a4-highgpu-8g

US$ 148,212 / 1 hour

Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.

Série A4X

  • Netherlands (europe-west4)
  • Iowa (us-central1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)

Tipo de máquina

Preço (US$)

a4x-highgpu-4g

US$ 74,75 / 1 hour

Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.

a4x-highgpu-4g requer pelo menos 18 VMs.

Série G2

  • Taiwan (asia-east1)
  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Dammam (me-central2)
  • Toronto (northamerica-northeast2)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

g2-standard-4

US$ 0,81293 / 1 hour

g2-standard-8

US$ 0,98181 / 1 hour

g2-standard-12

US$ 1,15069 / 1 hour

g2-standard-16

US$ 1,31957 / 1 hour

g2-standard-24

US$ 2,30138 / 1 hour

g2-standard-32

US$ 1,99509 / 1 hour

g2-standard-48

US$ 4,60276 / 1 hour

g2-standard-96

US$ 9,20552 / 1 hour

Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.

Preços da TPU v5e

  • Singapore (asia-southeast1)
  • Netherlands (europe-west4)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Oregon (us-west1)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

ct5lp-hightpu-1t

US$ 1,38 / 1 hour

ct5lp-hightpu-4t

US$ 5,52 / 1 hour

ct5lp-hightpu-8t

US$ 5,52 / 1 hour

Cada tipo de máquina é cobrado como os seguintes SKUs na sua fatura do Google Cloud:

  • Custo de vCPU, calculado por vCPU/hora
  • Custo de RAM, calculado por GB/hora
  • Custo de GPU:quer seja integrado à máquina ou configurado opcionalmente, calculado por GPU/hora

Os preços por tipo de máquina são usados para aproximar o custo horário total para cada nó de previsão de uma versão do modelo que usa aquele tipo de máquina.

Por exemplo, um tipo de máquina n1-highcpu-32 inclui 32 vCPUs e 32 GB de RAM. Portanto, o preço por hora é igual a 32 vCPU/hora + 32 GB/hora.

Série E2

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,0250826 / 1 hour

RAM

US$ 0,0033614 / 1 gibibyte hour

Série N1

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,036 / 1 hour

RAM

US$ 0,005 / 1 gibibyte hour

Série N2

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,0363527 / 1 hour

RAM

US$ 0,0048725 / 1 gibibyte hour

Série N2D

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Melbourne (australia-southeast2)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Paris (europe-west9)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,0316273 / 1 hour

RAM

US$ 0,0042389 / 1 gibibyte hour

Série C2

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Sydney (australia-southeast1)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,039077 / 1 hour

RAM

US$ 0,0052325 / 1 gibibyte hour

Série C2D

  • Taiwan (asia-east1)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,0339974 / 1 hour

RAM

US$ 0,0045528 / 1 gibibyte hour

Série C3

  • Singapore (asia-southeast1)
  • Belgium (europe-west1)
  • Netherlands (europe-west4)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
Item

Preço (US$)

vCPU

US$ 0,03908 / 1 hour

RAM

US$ 0,00524 / 1 gibibyte hour

Série A2

  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Singapore (asia-southeast1)
  • Netherlands (europe-west4)
  • Tel Aviv (me-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Oregon (us-west1)
  • Salt Lake City (us-west3)
Item

Preço (US$)

vCPU

US$ 0,0363527 / 1 hour

RAM

US$ 0,0048725 / 1 gibibyte hour

GPU (A100 40 GB)

US$ 3,3741 / 1 hour

GPU (A100 80 GB)

US$ 4,51729 / 1 hour

Série A3

  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Delhi (asia-south2)
  • Singapore (asia-southeast1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Toronto (northamerica-northeast2)
  • Iowa (us-central1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,0293227 / 1 hour

RAM

US$ 0,0025534 / 1 gibibyte hour

GPU (H100 80 GB)

US$ 11,2660332 / 1 hour

GPU (H200)

US$ 10,708501 / 1 hour

Série G2

  • Taiwan (asia-east1)
  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Dammam (me-central2)
  • Toronto (northamerica-northeast2)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Las Vegas (us-west4)
Item

Preço (US$)

vCPU

US$ 0,02874 / 1 hour

RAM

US$ 0,00337 / 1 gibibyte hour

GPU (L4)

US$ 0,64405 / 1 hour

Alguns tipos de máquinas permitem adicionar aceleradores de GPU opcionais para previsão. As GPUs opcionais geram outras cobranças, separadas daquelas descritas na tabela anterior. Veja cada tabela de preços, que descreve os preços de cada tipo de GPU opcional.

Aceleradores: preço por hora

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de GPU

Preço (US$)

NVIDIA_TESLA_P4

US$ 0,69 / 1 hour

NVIDIA_TESLA_P100

US$ 1,679 / 1 hour

NVIDIA_TESLA_T4

US$ 0,402 / 1 hour

NVIDIA_TESLA_V100

US$ 2,852 / 1 hour

O preço é por GPU. Se você usar várias GPUs por nó de previsão (ou se fizer escalonamento da versão para utilizar diversos nós),os custos serão escalonados proporcionalmente.

O AI Platform Prediction disponibiliza previsões a partir do seu modelo executando várias máquinas virtuais ("nós"). Por padrão, a Vertex AI escalona automaticamente o número de nós em execução a qualquer momento. Para previsão on-line, o número de nós é escalonado para atender à demanda. Cada nó pode responder a várias solicitações de previsão. Para previsão em lote, o número de nós é escalonado para reduzir o tempo total necessário para executar um job. Personalize a maneira como os nós de previsão são escalonados.

Você é cobrado pelo tempo que cada nó é executado para seu modelo, incluindo:

  • Quando o nó está processando um job de previsão em lote.
  • Quando o nó está processando uma solicitação de previsão on-line.
  • Quando o nó está em um estado pronto para cumprir as previsões on-line.

O custo de um nó em execução por uma hora é uma hora de uso do nó. A tabela de preços de previsão descreve o preço de uma hora do nó, que varia entre as regiões e entre a previsão on-line e a previsão em lote.

As horas de uso do nó podem ser consumidas em incrementos fracionários. Por exemplo, um nó em execução por 30 minutos custa 0,5 hora do nó.

Cálculo de custo dos tipos de máquina do Compute Engine (N1)

  • O tempo de execução de um nó é cobrado em incrementos de 30 segundos. Isso significa que, a cada 30 segundos, seu projeto é cobrado por 30 segundos de uso de qualquer recurso, como vCPU, RAM ou GPU, que o nó esteja usando no momento.

Mais sobre escalonamento automático de nós de previsão

Previsão on-line

Previsão em lote

A prioridade do escalonamento é reduzir a latência das solicitações individuais. O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após atender a uma solicitação.

A prioridade do escalonamento é reduzir o tempo total decorrido do job.

O escalonamento afeta suas taxas totais a cada mês: quanto mais numerosas e frequentes forem suas solicitações, mais nós serão usados.

O escalonamento provavelmente não terá muito efeito sobre o preço do seu job, ainda que haja alguns gastos indiretos envolvidos na criação de um novo nó.

Você pode escolher deixar o serviço ser escalonado em resposta ao tráfego (escalonamento automático) ou especificar vários nós para execução constante para evitar latência (escalonamento manual).

  • Se você escolher o escalonamento automático, o número de nós será escalonado automaticamente. Para implantações do tipo de máquina legado da AI Platform Prediction (MLS1), o número de nós pode reduzir escala vertical para zero em períodos sem tráfego. As implantações da Vertex AI e outros tipos de implantações do AI Platform Prediction não podem reduzir escala vertical para zero nós.
  • Se escolher o escalonamento manual, você especifica que alguns nós continuem em execução sempre. Você é cobrado por todo o tempo em que eles estão em execução, começando no momento da implantação e continuando até você excluir a versão do modelo.

É possível influenciar o escalonamento definindo um número máximo de nós a ser usado para um job de previsão em lote e definindo o número de nós que continuarão em execução para um modelo quando ele for implantado.

Jobs de predição em lote são cobrados após a conclusão do job

Os jobs de previsão em lote são cobrados após a conclusão do job, e não de forma incremental durante o job. Os alertas de orçamento do Cloud Billing que você configurou não são acionados enquanto um job está em execução. Antes de iniciar um job grande, primeiro execute alguns jobs de comparação de custos com pequenos dados de entrada.

Exemplo de um cálculo de previsão

Uma empresa imobiliária em uma região das Américas realiza uma previsão semanal de valores de habitação nas áreas em que atende. Em um mês, realiza previsões para quatro semanas em lotes de 3920, 4277, 3849 e 3961. Os jobs são limitados a um nó, e cada instância leva uma média de 0,72 segundos de processamento.

Primeiro, calcule o período de tempo que cada job foi executado:

  • Cálculos
Carregando...

Cada job foi executado por mais de dez minutos, portanto, a cobrança é feita por cada minuto de processamento:

  • Cálculos
Carregando...

A cobrança total do mês é de US$ 0,26.

Este exemplo considera que os jobs foram executados em um único nó e demoraram um período consistente de tempo por instância de entrada. No uso real, certifique-se de contabilizar vários nós e usar o tempo real que cada nó gasta em execução para os seus cálculos.

Cobranças pela Vertex Explainable AI

Explicações baseadas em atributos

As explicações baseadas em recursos não têm custo extra sobre os preços de previsão. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais. Por isso, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de previsão.

Explicações baseadas em exemplos

O preço das explicações baseadas em exemplos consiste no seguinte:

  • Ao fazer upload de um modelo ou atualizar o conjunto de dados de um modelo, você será cobrado:
  • por hora de uso do nó para o job de previsão em lote usado para gerar as representações espaciais latentes de exemplos. Isso é cobrado à mesma taxa da previsão.
  • um custo para construir ou atualizar índices. Esse custo é igual aos custos de indexação da Pesquisa Vetorial, que é o número de exemplos * número de dimensões * 4 bytes por ponto flutuante * US$ 3,00 por GB. Por exemplo, se você tiver 1 milhão de exemplos e 1.000 dimensões de espaço latente, o custo será de US $12 (1.000.000 * 1.000 * 4 * 3,00 / 1.000.000.000).
  • Ao implantar em um endpoint, você será cobrado por hora de uso do nó para cada nó no endpoint. Toda a computação associada ao endpoint é cobrada à mesma taxa da previsão. No entanto, como as explicações baseadas em exemplos exigem recursos de computação adicionais para servir o índice da Pesquisa vetorial, isso resulta na inicialização de mais nós, o que aumenta as cobranças de previsão.

Pesquisa de arquitetura neural do Vertex AI

As tabelas a seguir resumem os preços em cada região em que a pesquisa de arquitetura neural está disponível.

Preços

As tabelas a seguir mostram o preço por hora de várias configurações.

É possível escolher um nível de escalonamento predefinido ou uma configuração personalizada de tipos de máquinas selecionados. Se você escolher uma configuração personalizada, some os custos das máquinas virtuais que você usa.

Tipos de máquinas legadas compatíveis com aceleradores incluem o custo dos aceleradores no preço. Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela a seguir de aceleradores pelo número de cada tipo de acelerador usado.

Tipos de máquina

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

n1-standard-4

US$ 0,2849985 / 1 hour

n1-standard-8

US$ 0,569997 / 1 hour

n1-standard-16

US$ 1,139994 / 1 hour

n1-standard-32

US$ 2,279988 / 1 hour

n1-standard-64

US$ 4,559976 / 1 hour

n1-standard-96

US$ 6,839964 / 1 hour

n1-highmem-2

US$ 0,1774545 / 1 hour

n1-highmem-4

US$ 0,1774545 / 1 hour

n1-highmem-8

US$ 0,709818 / 1 hour

n1-highmem-16

US$ 1,419636 / 1 hour

n1-highmem-32

US$ 2,839272 / 1 hour

n1-highmem-64

US$ 5,678544 / 1 hour

n1-highmem-96

US$ 8,517816 / 1 hour

n1-highcpu-16

US$ 0,8501832 / 1 hour

n1-highcpu-32

US$ 1,7003664 / 1 hour

n1-highcpu-64

US$ 3,4007328 / 1 hour

n1-highcpu-96

US$ 5,1010992 / 1 hour

a2-highgpu-1g

US$ 5,641070651 / 1 hour

a2-highgpu-2g

US$ 11,282141301 / 1 hour

a2-highgpu-4g

US$ 22,564282603 / 1 hour

a2-highgpu-8g

US$ 45,128565205 / 1 hour

a2-highgpu-16g

US$ 90,257130411 / 1 hour

e2-standard-4

US$ 0,20103426 / 1 hour

e2-standard-8

US$ 0,40206852 / 1 hour

e2-standard-16

US$ 0,80413704 / 1 hour

e2-standard-32

US$ 1,60827408 / 1 hour

e2-highmem-2

US$ 0,13559949 / 1 hour

e2-highmem-4

US$ 0,27119898 / 1 hour

e2-highmem-8

US$ 0,54239796 / 1 hour

e2-highmem-16

US$ 1,08479592 / 1 hour

e2-highcpu-16

US$ 0,59364288 / 1 hour

e2-highcpu-32

US$ 1,18728576 / 1 hour

n2-standard-4

US$ 0,291354 / 1 hour

n2-standard-8

US$ 0,582708 / 1 hour

n2-standard-16

US$ 1,165416 / 1 hour

n2-standard-32

US$ 2,330832 / 1 hour

n2-standard-48

US$ 3,496248 / 1 hour

n2-standard-64

US$ 4,661664 / 1 hour

n2-standard-80

US$ 5,82708 / 1 hour

n2-highmem-2

US$ 0,196521 / 1 hour

n2-highmem-4

US$ 0,393042 / 1 hour

n2-highmem-8

US$ 0,786084 / 1 hour

n2-highmem-16

US$ 1,572168 / 1 hour

n2-highmem-32

US$ 3,144336 / 1 hour

n2-highmem-48

US$ 4,716504 / 1 hour

n2-highmem-64

US$ 6,288672 / 1 hour

n2-highmem-80

US$ 7,86084 / 1 hour

n2-highcpu-16

US$ 0,860352 / 1 hour

n2-highcpu-32

US$ 1,720704 / 1 hour

n2-highcpu-64

US$ 3,441408 / 1 hour

n2-highcpu-80

US$ 4,30176 / 1 hour

c2-standard-4

US$ 0,313212 / 1 hour

c2-standard-8

US$ 0,626424 / 1 hour

c2-standard-16

US$ 1,252848 / 1 hour

c2-standard-30

US$ 2,34909 / 1 hour

c2-standard-60

US$ 4,69818 / 1 hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Os preços das instâncias a2-highgpu incluem os encargos dos aceleradores NVIDIA_TESLA_A100 anexados.

Aceleradores

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de GPU

Preço (US$)

NVIDIA_TESLA_A100

US$ 4,400862 / 1 hour

NVIDIA_TESLA_P4

US$ 0,90 / 1 hour

NVIDIA_TESLA_P100

US$ 2,19 / 1 hour

NVIDIA_TESLA_T4

US$ 0,525 / 1 hour

NVIDIA_TESLA_V100

US$ 3,72 / 1 hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Discos

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de disco

Preço (US$)

pd-standard

US$ 0,000082192 / 1 gibibyte hour

pd-ssd

US$ 0,000349315 / 1 gibibyte hour

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Observações:

  1. Todo o uso está sujeito à política de cotas da pesquisa de arquitetura neural.
  2. É necessário armazenar seus dados e arquivos de programas em buckets do Cloud Storage durante o ciclo de vida da pesquisa de arquitetura neural. Saiba mais sobre o uso do Cloud Storage.
  3. Para saber sobre descontos baseados em volume, entre em contato com a equipe de vendas.
  4. O preço do disco só é cobrado quando você configura o tamanho do disco de cada VM para mais de 100 GB. Não há cobrança para os primeiros 100 GB (o tamanho padrão do disco) de disco para cada VM. Por exemplo, se você configurar cada VM para ter 105 GB de disco, será cobrado por 5 GB de disco para cada VM.

Uso obrigatório do Cloud Storage

Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida da pesquisa de arquitetura neural. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

  • preparação do pacote do aplicativo de treinamento;
  • armazenamento dos dados de entrada do treinamento

Observação:você pode usar outro serviço do Google Cloud para armazenar seus dados de entrada, como o BigQuery, que tem o próprio preço.

  • Armazenando a saída dos seus jobs. A pesquisa de arquitetura neural não exige armazenamento a longo prazo desses itens. Remova os arquivos assim que a operação for concluída.

Operações gratuitas para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pela pesquisa de arquitetura neural estão disponíveis sem custo financeiro. A política de cotas da pesquisa de arquitetura neural limita algumas dessas operações.

Recurso

Operações gratuitas

empregos

get, list, cancel

operações

get, list, cancel, delete

Pipelines da Vertex AI

O Vertex AI Pipelines tem uma taxa de execução de US$ 0,03 por pipeline. Não há cobranças pela taxa de execução durante a versão de pré-lançamento. Você também paga pelos recursos do Google Cloud usados com o Vertex AI Pipelines, como os componentes do Compute Engine consumidos por pipelines. O preço deles é igual ao do treinamento da Vertex AI. Por fim, você é responsável pelo custo de todos os serviços (como o Dataflow) chamados pelo seu pipeline.

Vertex AI Feature Store

O Vertex AI Feature Store está em disponibilidade geral (GA) desde novembro de 2023. Para obter informações sobre a versão anterior do produto, acesse Vertex AI Feature Store (legado).

Novo Vertex AI Feature Store

O novo Vertex AI Feature Store oferece suporte à funcionalidade em dois tipos de operações:

  • Operações off-line são operações para transferir, armazenar, recuperar e transformar dados no repositório off-line (BigQuery)
  • Operações on-line são operações para transferir dados para a(s) loja(s) on-line e operações sobre dados enquanto eles estão na(s) loja(s) on-line.

Preços das operações off-line

Como o BigQuery é usado para operações off-line, consulte os preços do BigQuery para funcionalidades como ingestão no repositório off-line, consulta ao repositório off-line e armazenamento off-line.

Preços das operações on-line

Para operações on-line, o Vertex AI Feature Store cobra por quaisquer recursos em GA para transferir dados para a loja on-line, fornecer ou armazenar dados. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta para concluir uma operação, cobrado por minuto.

  • Johannesburg (africa-south1)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Warsaw (europe-central2)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Milan (europe-west8)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)

Operação

Preço (US$)

Nó de processamento de dados

Processamento de dados (por exemplo, ingestão em qualquer

armazenamento, monitoramento etc.)

US$ 0,08 / 1 hour

Nó de veiculação on-line otimizado

Serviços de baixa latência e serviços de embeddings

Cada nó inclui 200 GB de armazenamento

US$ 0,30 / 1 hour

Nó de veiculação on-line do Bigtable

Serving with Cloud Bigtable

US$ 0,94 / 1 hour

Armazenamento de veiculação on-line do Bigtable

Armazenamento para veiculação com o Cloud Bigtable

US$ 0,000342466 / 1 gibibyte hour

A veiculação on-line otimizada e a veiculação on-line do Bigtable usam arquiteturas diferentes, portanto, seus nós não são comparáveis.

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Estimativas de carga de trabalho das operações on-line

Considere as diretrizes a seguir ao estimar suas cargas de trabalho. O número de nós necessários para determinada carga de trabalho pode diferir em cada abordagem de serviço.

  • Processamento de dados:
  • Ingestão: um nó pode ingerir aproximadamente um mínimo de 100 MiB de dados por hora em um repositório on-line do Bigtable ou em um repositório on-line otimizado se nenhuma função analítica for usada.
  • Veiculação on-line do Bigtable: cada nó pode suportar aproximadamente 15.000 QPS e até 5 TB de armazenamento.
  • Serviço on-line otimizado: o desempenho é baseado no tipo de máquina e nas réplicas, que são configuradas automaticamente para minimizar os custos sujeitos à carga de trabalho. Cada nó pode ter um mínimo de 2 e um máximo de 6 réplicas para alta disponibilidade e escalonamento automático. Você paga pelo número de réplicas. Para mais detalhes, consulte os exemplos de cenários mensais.
  • Para cargas de trabalho não relacionadas a embeddings, cada nó pode suportar aproximadamente 500 QPS e até 200 GB de armazenamento.
  • Para cargas de trabalho relacionadas a embeddings, cada nó pode oferecer suporte a aproximadamente 500 QPS e até 4 GB de armazenamento de dados dimensionais de 512.

É possível visualizar o número de nós (com réplicas) no Metrics Explorer:

Metrics Explorer para descobrir o número de nós que estão sendo usados.
Metrics Explorer para descobrir o número de nós que estão sendo usados.

Exemplo de cenários mensais (considerando us-central1)

Carga de trabalho de fluxo de dados: veiculação on-line do Bigtable com 2,5 TB de dados (1 GB atualizado diariamente) e 1.200 QPS

Operações

Uso mensal

Custo mensal

Nó de processamento de dados

(1 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 300 horas de uso do nó

300 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $24

Nó de veiculação on-line otimizado

N/A

N/A

Nó de veiculação on-line do Bigtable

(1 nó) * (24 horas/dia) * (30 dias/mês) = 720 horas de uso do nó

720 horas de uso do nó * (US$ 0,94 por hora de uso do nó) = US $677

Armazenamento de veiculação on-line do Bigtable

(2,5 TB por mês) * (1.000 GB/TB) = 2.500 GB por mês

2.500 GB por mês * (US$ 0,25 por GB por mês) = US $625

Total

US$ 1,326

Carga de trabalho de QPS alto: veiculação on-line otimizada com 10 GB de dados sem incorporação (5 GB atualizados diariamente) e 2.000 QPS

Operações

Uso mensal

Custo mensal

Nó de processamento de dados

(5 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 1.500 horas de uso do nó

1.500 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $120

Nó de veiculação on-line otimizado

Arredondamento(10 GB * (1 nó / 200 GB)) = 1 * máx.(2 réplicas padrão, 2.000 QPS * (1 réplica / 500 QPS)) = 4 nós no total * (24 horas/dia) * (30 dias/mês) =2.880 horas de uso do nó

2.880 horas de uso do nó * (US$ 0,30 por hora de uso do nó) = US$ 864

Nó de veiculação on-line do Bigtable

N/A

N/A

Armazenamento de veiculação on-line do Bigtable

N/A

N/A

Total

US$984

Carga de trabalho de veiculação de embeddings: veiculação on-line otimizada com 20 GB de dados de embeddings (2 GB atualizados diariamente) e 800 QPS

Operações

Uso mensal

Custo mensal

Nó de processamento de dados

(2 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 600 horas de uso do nó

600 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $48

Nó de veiculação on-line otimizado

Arredondamento(20 GB* (1 nó / 4 GB) = 5 * max(2 réplicas padrão, 800 QPS * (1 réplica / 500 QPS)) = 10 nós no total * (24 horas/dia) * (30 dias/mês) = 7.200 horas de uso do nó

7.200 horas de uso do nó * (US$ 0,30 por hora de uso do nó) = US$ 2.160

Nó de veiculação on-line do Bigtable

N/A

N/A

Armazenamento de veiculação on-line do Bigtable

N/A

N/A

Total

US$2.208

Feature Store da Vertex AI (legado)

Os preços do Vertex AI Feature Store (legado) dependem da quantidade de dados de recursos armazenados on-line e off-line, bem como da disponibilidade para veiculação on-line. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta exibindo dados do recurso ou aguardando em estado de prontidão para lidar com as solicitações de dados do recurso.

Operação

Preço (US$)

Armazenamento on-line

US$ 0,25 por GB/mês

Armazenamento off-line

US$ 0,023 por GB/mês

Exibição on-line

US$ 0,94 por nó/hora

Exportação em lote

US$ 0,005 por GB

Ingestão de streaming

US$ 0,10 por GB de ingestão

Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.

Quando você ativa o monitoramento do valor do recurso, o faturamento inclui os encargos aplicáveis acima, além dos encargos aplicáveis a seguir:

  • US$ 3,50 por GB para todos os dados analisados. Com a análise de snapshots ativada, os snapshots obtidos para dados no Vertex AI Feature Store (legado) são incluídos. Com a análise de recursos de importação habilitada, lotes de dados ingeridos são incluídos.
  • As cobranças adicionais para outras operações do Vertex AI Feature Store (legado) usadas com o monitoramento do valor do recurso incluem o seguinte:
  • O recurso de análise de snapshot captura periodicamente um snapshot dos valores de recurso com base na sua configuração de intervalo de monitoramento.
  • A cobrança por uma exportação de snapshot é a mesma de uma operação normal de exportação em lote.

Exemplo de análise de snapshot

Um cientista de dados permite o monitoramento do valor do recurso para seu Vertex AI Feature Store (legado) e ativa o monitoramento para uma análise diária de snapshots. Um pipeline é executado diariamente para monitoramento de tipos da entidade. O pipeline verifica 2 GB de dados no Vertex AI Feature Store (legado) e exporta um snapshot contendo 0,1 GB de dados. A cobrança total de um dia de análise é:

(0,1 GB * US$ 3,50) + (2 GB * US$ 0,005) = US $0,36

Exemplo de análise de ingestão

Um cientista de dados permite o monitoramento do valor do recurso para seu Vertex AI Feature Store (legado) e ativa o monitoramento para operações de ingestão. Uma operação de ingestão importa 1 GB de dados para o Vertex AI Feature Store (legado). A cobrança total referente ao monitoramento do valor do recurso é:

(1 GB * US$ 3,50) = US $3,50

Vertex ML Metadata

O armazenamento de metadados é medido em gigabytes binários (GiB), sendo que 1 GiB é igual a 1.073.741.824 bytes. Essa unidade de medida também é conhecida como gibibyte.

O Vertex ML Metadata cobra US $10 por gibibyte (GiB) por mês pelo armazenamento de metadados. Os preços são rateados por megabyte (MB). Por exemplo, se você armazena 10 MB de metadados, será cobrado US $0,10 por mês por esses 10 MB de metadados.

Os preços são os mesmos em todas as regiões com suporte ao Vertex ML Metadata.

Vertex AI TensorBoard

Para usar o Vertex AI TensorBoard, solicite que o administrador do IAM do projeto atribua a você o papel "Usuário do app da Web do Vertex AI TensorBoard". A função de administrador da Vertex AI também tem acesso.

A partir de agosto de 2023, o preço do Vertex AI TensorBoard mudou de uma licença mensal por usuário de US $300/mês para US $10 GiB/mês para armazenamento de dados de registros e métricas. Isso significa que não há mais taxas de assinatura. Você pagará apenas pelo armazenamento que usar. Consulte o tutorial Vertex AI TensorBoard: excluir experimentos desatualizados do TensorBoard para saber como gerenciar o armazenamento.

Vertex AI Vizier

O Vertex AI Vizier é um serviço de otimização de caixa preta dentro do Vertex AI. O modelo de preços do Vertex AI Vizier consiste no seguinte:

  • Não há custo financeiro para testes que usam RANDOM_SEARCH e GRID_SEARCH. Saiba mais sobre os algoritmos de pesquisa.
  • Os primeiros 100 testes do Vertex AI Vizier por mês estão disponíveis sem custos financeiros. Os testes com RANDOM_SEARCH e GRID_SEARCH não contam para esse total.
  • Após os 100 testes do Vertex AI Vizier, os testes subsequentes durante o mesmo mês serão cobrados a US $1,00 por teste (testes que usam RANDOM_SEARCH ou GRID_SEARCH não geram custo financeiro).

Vertex AI Model Registry

O Vertex AI Model Registry é um repositório central que rastreia e lista seus modelos e versões de modelos. Você pode importar modelos para a Vertex AI e eles aparecem no Vertex AI Model Registry. Não há nenhum custo associado a ter seus modelos no Model Registry. Os custos só são gerados quando você implanta o modelo em um endpoint ou executa uma previsão em lote no modelo. Esse custo é determinado pelo tipo de modelo que você está implantando.

Para saber mais sobre preços para implantação de modelos personalizados do Vertex AI Model Registry, consulte Modelos treinados de maneira personalizada. Para saber mais sobre preços para implantação de modelos AutoML, consulte Preços para modelos AutoML.

Monitoramento de modelos com a Vertex AI

Com a Vertex AI, é possível monitorar a eficácia contínua do seu modelo depois de implantá-lo na produção. Para mais informações, consulte Introdução ao Monitoramento de modelos com a Vertex AI.

Ao usar o Monitoramento de modelos da Vertex AI, você recebe cobranças da seguinte forma:

  • US$ 3,50 por GB para todos os dados analisados, incluindo os dados de treinamento fornecidos e os dados de previsão registrados em uma tabela do BigQuery.
  • Cobranças por outros produtos do Google Cloud que você usa com o Monitoramento de Modelos, como o armazenamento do BigQuery ou o Batch Explain, quando o monitoramento de atribuição está ativado.

O Vertex AI Model Monitoring é compatível com as seguintes regiões: us-central1, europe-west4, asia-east1 e asia-southeast1. Os preços são os mesmos em todas as regiões.

Os tamanhos dos dados são medidos depois de serem convertidos para o formato TfRecord.

Conjuntos de dados de treinamento geram uma cobrança única quando você configura um job de Monitoramento de Modelos da Vertex AI.

Os conjuntos de dados de previsão são registros coletados do serviço de previsão on-line. Conforme as solicitações de previsão chegam durante janelas de tempo diferentes, os dados de cada janela são coletados e a soma das informações analisadas em cada janela de previsão é usada para calcular a cobrança.

Exemplo: um cientista de dados executa o monitoramento de modelo no tráfego de previsão que pertence ao modelo.

  • O modelo é treinado com um conjunto de dados do BigQuery. O tamanho dos dados após a conversão para TfRecord é de 1,5 GB.
  • Os dados de previsão registrados entre 13h e 14h são de 0,1 GB, entre 15h e 16h é de 0,2 GB.
  • O preço total para configurar o job de monitoramento de modelo é:
  • (1,5 GB * US$ 3,50) + ((0,1 GB + 0,2 GB) * US$ 3,50) = US $6,30

Vertex AI Workbench

Selecione instâncias, notebooks gerenciados ou notebooks gerenciados pelo usuário para informações sobre preços.

Instâncias

Veja nas tabelas abaixo o preço por hora aproximado de várias configurações de VM. É possível escolher uma configuração personalizada de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.

Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela de aceleradores abaixo por quantas horas-máquina de cada tipo de acelerador você utiliza.

CPUs

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Warsaw (europe-central2)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço por vCPU (USD)

N1

US$ 0,0379332 / 1 hour

N2

US$ 0,0379332 / 1 hour

E2

US$ 0,026173908 / 1 hour

A2

US$ 0,0379332 / 1 hour

Memória

  • Johannesburg (africa-south1)
  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Warsaw (europe-central2)
  • Finland (europe-north1)
  • Madrid (europe-southwest1)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Milan (europe-west8)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

N1

US$ 0,0050844 / 1 gibibyte hour

N2

US$ 0,0050844 / 1 gibibyte hour

E2

US$ 0,003508236 / 1 gibibyte hour

A2

US$ 0,0050844 / 1 gibibyte hour

Aceleradores

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Osaka (asia-northeast2)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Finland (europe-north1)
  • Belgium (europe-west1)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Sao Paulo (southamerica-east1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

Nvidia Tesla A100

US$ 4,400862 / 1 hour

Nvidia Tesla A100 80GB

US$ 4,51729 / 1 hour

Nvidia Tesla T4

US$ 0,525 / 1 hour

Nvidia Tesla V100

US$ 3,72 / 1 hour

Nvidia Tesla P100

US$ 2,19 / 1 hour

Discos

  • Taiwan (asia-east1)
  • Hong Kong (asia-east2)
  • Tokyo (asia-northeast1)
  • Seoul (asia-northeast3)
  • Mumbai (asia-south1)
  • Singapore (asia-southeast1)
  • Jakarta (asia-southeast2)
  • Sydney (australia-southeast1)
  • Warsaw (europe-central2)
  • Belgium (europe-west1)
  • Turin (europe-west12)
  • London (europe-west2)
  • Frankfurt (europe-west3)
  • Netherlands (europe-west4)
  • Zurich (europe-west6)
  • Doha (me-central1)
  • Dammam (me-central2)
  • Tel Aviv (me-west1)
  • Montreal (northamerica-northeast1)
  • Toronto (northamerica-northeast2)
  • Sao Paulo (southamerica-east1)
  • Santiago (southamerica-west1)
  • Iowa (us-central1)
  • South Carolina (us-east1)
  • Northern Virginia (us-east4)
  • Columbus (us-east5)
  • Dallas (us-south1)
  • Oregon (us-west1)
  • Los Angeles (us-west2)
  • Salt Lake City (us-west3)
  • Las Vegas (us-west4)

Tipo de máquina

Preço (US$)

Espaço provisionado extremo do Hyperdisk

US$ 0,000205479 / 1 gibibyte hour

Espaço provisionado balanceado

US$ 0,000164384 / 1 gibibyte hour

Espaço provisionado extremo

US$ 0,000205479 / 1 gibibyte hour

Espaço provisionado em SSD

US$ 0,000279452 / 1 gibibyte hour

Espaço provisionado padrão

US$ 0,000065753 / 1 gibibyte hour

Sua instância do Vertex AI Workbench gera cobranças da seguinte forma:

  • No caso do uso de CPU e acelerador, você recebe cobranças quando a instância está nos seguintes estados:
  • INICIANDO
  • PROVISIONANDO
  • ATIVOS
  • UPGRADE
  • REVERTENDO
  • RESTAURANDO
  • INTERROMPENDO
  • SUSPENDENDO
  • No caso do armazenamento em disco, você é cobrado quando a instância está nos seguintes estados:
  • INICIANDO
  • PROVISIONANDO
  • ATIVOS
  • UPGRADE
  • REVERTENDO
  • RESTAURANDO
  • INTERROMPENDO
  • PARADO
  • SUSPENDENDO
  • SUSPENSO

Notebooks gerenciados

O preço é composto pelos recursos de computação e armazenamento que você usa, as taxas de gerenciamento das instâncias do Vertex AI Workbench e eventuais recursos adicionais do Google Cloud que você adota. Consulte as seções a seguir para mais detalhes.

Recursos de computação e armazenamento

Os recursos de computação e armazenamento são cobrados usando a mesma taxa que você atualmente paga pelo Compute Engine e o Cloud Storage.

Taxas de administração

Existem taxas de administração do Vertex AI Workbench além do uso da infraestrutura, capturadas nas tabelas abaixo.

SKU

Preço (US$)

vCPU

US$ 0,05 por vCPU

T4 e P4 (GPU padrão)

US$ 0,35 por GPU

GPU P100, V100, L4 e A100 (GPU Premium)

US$ 2,48 por GPU

Notebooks gerenciados pelo usuário

O preço é composto pelos recursos de computação e armazenamento que você usa, as taxas de gerenciamento das instâncias do Vertex AI Workbench e eventuais recursos adicionais do Google Cloud que você adota. Consulte as seções a seguir para mais detalhes.

Recursos de computação e armazenamento

Os recursos de computação e armazenamento são cobrados usando a mesma taxa que você atualmente paga pelo Compute Engine e o Cloud Storage.

Taxas de administração

Existem taxas de administração do Vertex AI Workbench além do uso da infraestrutura, capturadas nas tabelas abaixo.

SKU

Preço (US$)

vCPU

US$ 0,005 por vCPU

T4 e P4 (GPU padrão)

US$ 0,035 por GPU

GPU P100, V100 e A100 (GPU Premium)

US$ 0,25 por GPU

Recursos adicionais do Google Cloud

Além dos custos mencionados anteriormente, você também paga por eventuais recursos do Google Cloud que usar. Exemplo:

  • Serviços de análise de dados: os custos do BigQuery são gerados ao emitir consultas SQL em um notebook (consulte os Preços do BigQuery).
  • Chaves de criptografia gerenciadas pelo cliente: você está sujeito a cobranças pelo uso. Sempre que os notebooks gerenciados ou a instância de notebooks gerenciados pelo usuário usam uma chave do Cloud Key Management Service, a operação será cobrada de acordo com a taxa das operações de chave do Cloud KMS (consulte Preços do Cloud Key Management Service).

Colab Enterprise

Para informações sobre preços do Colab Enterprise, consulte Preços do Colab Enterprise.

Deep Learning Containers, VM de aprendizado profundo e pipelines da AI Platform

No caso dos Deep Learning Containers, Deep Learning VM Images e AI Platform Pipelines, o preço é calculado com base nos recursos de computação e de armazenamento que você usa. Esses recursos são cobrados usando a mesma taxa que você paga atualmente pelo Compute Engine e pelo Cloud Storage.

Além dos custos de computação e armazenamento, você também paga pelos recursos do Google Cloud que usar. Exemplo:

  • Serviços de análise de dados: os custos do BigQuery são gerados ao emitir consultas SQL em um notebook (consulte os Preços do BigQuery).
  • Chaves de criptografia gerenciadas pelo cliente: você está sujeito a cobranças pelo uso. Sempre que os notebooks gerenciados ou a instância de notebooks gerenciados pelo usuário usam uma chave do Cloud Key Management Service, a operação será cobrada de acordo com a taxa das operações de chave do Cloud KMS (consulte Preços do Cloud Key Management Service).

Rotulagem de dados

Com a Vertex AI, é possível solicitar a rotulagem humana de uma coleção de dados que você planeja usar para treinar um modelo de machine learning personalizado. Os preços do serviço são calculados com base no tipo de tarefa de rotulagem.

  • Para tarefas de rotulagem regular, os preços são determinados pelo número de unidades de anotação.
  • Em uma tarefa de classificação de imagem, as unidades são determinadas com base no número de imagens e na quantidade de rotuladores humanos. Por exemplo, uma imagem com três rotuladores humanos será contabilizada como 1 * 3 = 3 unidades. O preço da classificação de rótulo único e de vários rótulos é o mesmo.
  • Em uma tarefa de caixa delimitadora de imagem, as unidades são determinadas pelo número de caixas delimitadoras identificadas nas imagens e pelo número de rotuladores humanos. Por exemplo, uma imagem com duas caixas delimitadoras e três rotuladores humanos será contabilizada como 2 * 3 = 6 unidades. Imagens sem caixas delimitadoras não geram cobrança.
  • Em uma segmentação de imagens/caixa rotacionada/linha poligonal/tarefa poligonal, as unidades são determinadas da mesma forma que uma tarefa de caixa delimitadora de imagem.
  • Em uma tarefa de classificação de vídeo, as unidades são determinadas pela duração do vídeo (cinco segundos equivalem a uma unidade de preço) e pelo número de rotuladores humanos. Por exemplo, um vídeo de 25 segundos com três rotuladores humanos é contabilizado como 25 / 5 * 3 = 15 unidades. O preço da classificação de rótulo único e de vários rótulos é o mesmo.
  • Em uma tarefa de rastreamento de objetos em vídeo, a unidade é determinada pelo número de objetos identificados no vídeo e pelo número de rotuladores humanos. Por exemplo, um vídeo com dois objetos e três rotuladores humanos é contabilizado como 2 * 3 = 6 unidades. Vídeos sem objetos não geram cobrança.
  • Em uma tarefa de reconhecimento de ação em vídeo, as unidades são determinadas da mesma maneira que em uma tarefa de rastreamento de objetos de vídeo.
  • Em uma tarefa de classificação de texto, as unidades são determinadas pelo tamanho do texto (cada 50 palavras equivalem a uma unidade de preço) e pelo número de rotuladores humanos. Por exemplo, um trecho de texto com 100 palavras e três rotuladores humanos é contabilizado como 100 / 50 * 3 = 6 unidades. O preço da classificação de rótulo único e vários rótulos é o mesmo.
  • Em uma tarefa de sentimento de texto, as unidades são determinadas da mesma maneira que uma tarefa de classificação de texto.
  • Em uma tarefa de extração de entidade de texto, as unidades são determinadas pelo comprimento do texto (cada 50 palavras equivalem a uma unidade de preço), o número de entidades identificadas e o número de rotuladores humanos. Por exemplo, um trecho de texto com 100 palavras, duas entidades identificadas e três rotuladores humanos é contabilizado como 100 / 50 * 2 * 3 = 12 unidades. Textos sem entidades não geram cobrança.
  • Nas tarefas de classificação de imagem/vídeo/texto e de sentimento de texto, é possível que os rotuladores humanos percam o controle das classes se o tamanho do conjunto de rótulos for muito grande. Como resultado, enviamos no máximo 20 classes para os rotuladores humanos de cada vez. Por exemplo, se o tamanho do conjunto de rótulos de uma tarefa de rotulagem for 40, cada item de dados será enviado para revisão humana 40 / 20 = 2 vezes e cobraremos duas vezes o preço (calculado acima) conforme adequado.
  • Para uma tarefa de rotulagem que ativa o recurso de rotulador personalizado, cada item de dados é contabilizado como uma unidade de rotulador personalizado.
  • Em uma tarefa de rotulagem de aprendizagem ativa para itens de dados com anotações geradas por modelos (sem a ajuda de um rotulador humano), cada item de dados é contabilizado como uma unidade de aprendizagem ativa.
  • Para uma tarefa de rotulagem de aprendizagem ativa para itens de dados com anotações geradas por rotuladores humanos, cada item de dados é contabilizado como uma tarefa de rotulagem regular conforme descrito acima.

Na tabela abaixo, veja o preço por 1.000 unidades por rotulador humano com base na unidade listada para cada objetivo. Os preços do nível 1 se aplicam às primeiras 50 mil unidades por mês em cada projeto do Google Cloud. Os do nível 2 se aplicam às 950 mil unidades seguintes por mês no projeto, com um máximo de um milhão de unidades. Entre em contato conosco para saber os preços acima de um milhão de unidades por mês.

Tipo de dado

Objetivo

Unidade

Preço do nível 1 (USD)

Preço do nível 2 (USD)

Imagem

Classificação

Imagem

US$ 35

US$ 25

Caixa delimitadora

Caixa delimitadora

US$ 63

US$ 49

Segmentação

Segmento

US$ 870

US$ 850

Caixa rotacionada

Caixa delimitadora

US$ 86

US$ 60

Polígono/linha poligonal

Polígono/linha poligonal

US$ 257

US$ 180

Vídeo

Classificação

Vídeo de 5 segundos

US$ 86

US$ 60

Rastreamento de objetos

Caixa delimitadora

US$ 86

US$ 60

Reconhecimento de ação

Evento em vídeo de 30 segundos

US$ 214

US$ 150

Texto

Classificação

50 palavras

US$ 129

US$ 90

Sentimento

50 palavras

US$ 200

US$ 140

Extração de entidades

Entidade

US$ 86

US$ 60

Aprendizagem ativa

Todos

Item de dados

US$ 80

US$ 56

Rotulador personalizado

Todos

Item de dados

US$ 80

US$ 56

Uso obrigatório do Cloud Storage

Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida da Vertex AI. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

  • Preparação do pacote de aplicativo de treinamento para modelos treinados personalizados.
  • Armazenamento dos dados de entrada do treinamento.
  • Armazenamento do resultado dos jobs de treinamento. A Vertex AI não requer armazenamento a longo prazo desses itens. Remova os arquivos assim que a operação for concluída.

Operações gratuitas para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pelo AI Platform estão disponíveis sem custo financeiro. A política de cotas do AI Platform limita algumas dessas operações.

Recurso

Operações gratuitas

modelos

create, get, list, delete

versões

create, get, list, delete, setDefault

empregos

get, list, cancel

operações

get, list, cancel, delete

Custos do Google Cloud

Se você armazenar imagens para serem analisadas no Cloud Storage ou usar outros recursos do Google Cloud com a Vertex AI, então também receberá cobrança pelo uso desses serviços.

Para ver seu status atual de faturamento no console do Google Cloud, inclusive o uso e a fatura atual, consulte a página "Faturamento". Para mais detalhes sobre o gerenciamento da sua conta, consulte a documentação do Cloud Billing ou o suporte de faturamento e pagamentos.

Solicite uma cotação personalizada

Com o sistema de pagamento por uso do Google Cloud, você paga apenas pelos serviços que usa. Fale com nossa equipe de vendas e receba uma cotação personalizada para sua organização.
Google Cloud