Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Os custos da Vertex AI permanecem os mesmos dos produtos legados da AI Platform e do AutoML que a Vertex AI substitui, com as seguintes exceções:
A Vertex AI também oferece mais maneiras de otimizar custos, como as seguintes:
Para mais informações sobre os preços da IA generativa na Vertex AI, confira Preços da IA generativa na Vertex AI.
Para modelos do AutoML na Vertex AI, você paga por três atividades principais:
A Vertex AI usa configurações de máquina predefinidas para modelos do Vertex AutoML, e a taxa por hora dessas atividades reflete o uso dos recursos.
O tempo necessário para treinar o modelo depende do tamanho e da complexidade dos dados de treinamento. É preciso implantar os modelos para que possam fornecer previsões ou explicações on-line.
Você paga por cada modelo implantado em um endpoint, mesmo que nenhuma previsão seja feita. É preciso cancelar a implantação do modelo para suspender cobranças futuras. Modelos que não foram implantados ou que falharam na implantação não serão cobrados.
Você paga apenas pelas horas de computação usadas. Se o treinamento falhar por qualquer motivo que não seja um cancelamento iniciado pelo usuário, você não será cobrado pelo tempo. Se você cancelar a operação, o tempo de treinamento será cobrado.
Selecione um tipo de modelo abaixo para conferir as informações de preço.
Dados de imagem
Operação | Preço (classificação) (USD) | Preço (detecção de objetos) (USD) |
---|---|---|
Treinamento | US$ 3,465 / 1 hour | US$ 3,465 / 1 hour |
Treinamento (modelo no dispositivo AutoML Edge) | US$ 18,00 / 1 hour | US$ 18,00 / 1 hour |
Implantação e previsão on-line | US$ 1,375 / 1 hour | US$ 2,002 / 1 hour |
Previsão em lote | US$ 2,222 / 1 hour | US$ 2,222 / 1 hour |
Dados tabulares
Operação | Preço por hora de uso do nó para classificação/regressão | Preço para estimativas |
---|---|---|
Treinamento | US$ 21,252 / 1 hour | Consulte a Previsão da Vertex AI |
Previsão | Mesmo preço das previsões para modelos treinados personalizados. A Vertex AI realiza previsões em lote usando 40 máquinas n1-highmem-8. | Consulte a Previsão da Vertex AI |
Cobranças de previsão para Vertex Explainable AI
A computação associada à Vertex Explainable AI é cobrada na mesma taxa que a previsão. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais. Por isso, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de previsão.
AutoML
Fase | Preços |
---|---|
Previsão | 0 count to 1,000,000 count US$ 0,20 / 1,000 count, per 1 month / account 1,000,000 count to 50,000,000 count US$ 0,10 / 1,000 count, per 1 month / account 50,000,000 count and above US$ 0,02 / 1,000 count, per 1 month / account |
Treinamento | US$ 21,252 / 1 hour |
Explainable AI | Explicabilidade usando valores de Shapley. Consulte a página de preços de Inferência e Explicação da Vertex AI. |
* Um ponto de dados de previsão é um ponto de tempo do horizonte de previsão. Por exemplo, com granularidade diária, um horizonte de 7 dias é 7 pontos a cada série temporal.
ARIMA+
Fase | Preços |
---|---|
Previsão | US$ 5,00 / 1,000 count |
Treinamento | US$250,00 por TB x Número de modelos candidatos x Número de janelas de backtesting* |
Explainable AI | A explicabilidade com decomposição de séries temporais não gera custos extras. Não há suporte para a explicabilidade usando valores de Shapley. |
Consulte a página de preços do BigQuery ML para mais informações. Cada job de treinamento e previsão incorre o custo de 1 execução de pipeline gerenciada, conforme descrito nos preços da Vertex AI.
* Uma janela de backtest é criada para cada período no conjunto de testes. O AUTO_ARIMA_MAX_ORDER usado define o número de modelos candidatos. Esse número varia de 6 a 42 para modelos com diversas séries temporais.
Treinamento
Confira nas tabelas abaixo o preço por hora aproximado de várias configurações de treinamento. É possível escolher configurações personalizadas de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.
Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela de aceleradores abaixo por quantas horas-máquina de cada tipo de acelerador você utiliza.
Tipos de máquina
É possível usar VMs spot com o treinamento personalizado da Vertex AI.As VMs do Spot são cobradas de acordo com os preços das VMs do Spot do Compute Engine. Há taxas de gerenciamento de treinamento personalizado da Vertex AI além do uso da infraestrutura, capturadas nas tabelas a seguir.
É possível usar reservas do Compute Engine com o treinamento personalizado da Vertex AI. Ao usar reservas do Compute Engine, você recebe cobranças de acordo com os preços do Compute Engine, incluindo os descontos por uso contínuo (CUDs) aplicáveis. Há taxas de gerenciamento de treinamento personalizado da Vertex AI além do uso da infraestrutura, capturadas nas tabelas a seguir.
Tipo de máquina | Preço (US$) |
---|---|
n1-standard-4 | US$ 0,21849885 / 1 hour |
n1-standard-8 | US$ 0,4369977 / 1 hour |
n1-standard-16 | US$ 0,8739954 / 1 hour |
n1-standard-32 | US$ 1,7479908 / 1 hour |
n1-standard-64 | US$ 3,4959816 / 1 hour |
n1-standard-96 | US$ 5,2439724 / 1 hour |
n1-highmem-2 | US$ 0,13604845 / 1 hour |
n1-highmem-4 | US$ 0,2720969 / 1 hour |
n1-highmem-8 | US$ 0,5441938 / 1 hour |
n1-highmem-16 | US$ 1,0883876 / 1 hour |
n1-highmem-32 | US$ 2,1767752 / 1 hour |
n1-highmem-64 | US$ 4,3535504 / 1 hour |
n1-highmem-96 | US$ 6,5303256 / 1 hour |
n1-highcpu-16 | US$ 0,65180712 / 1 hour |
n1-highcpu-32 | US$ 1,30361424 / 1 hour |
n1-highcpu-64 | US$ 2,60722848 / 1 hour |
n1-highcpu-96 | US$ 3,91084272 / 1 hour |
a2-highgpu-1g* | US$ 4,425248914 / 1 hour |
a2-highgpu-2g* | US$ 8,850497829 / 1 hour |
a2-highgpu-4g* | US$ 17,700995658 / 1 hour |
a2-highgpu-8g* | US$ 35,401991315 / 1 hour |
a2-megagpu-16g* | US$ 65,707278915 / 1 hour |
a3-highgpu-8g* | US$ 101,007352 / 1 hour |
a3-megagpu-8g* | US$ 106,0464232 / 1 hour |
a3-ultragpu-8g* | US$ 99,7739296 / 1 hour |
a4-highgpu-8g* | - |
e2-standard-4 | US$ 0,154126276 / 1 hour |
e2-standard-8 | US$ 0,308252552 / 1 hour |
e2-standard-16 | US$ 0,616505104 / 1 hour |
e2-standard-32 | US$ 1,233010208 / 1 hour |
e2-highmem-2 | US$ 0,103959618 / 1 hour |
e2-highmem-4 | US$ 0,207919236 / 1 hour |
e2-highmem-8 | US$ 0,415838472 / 1 hour |
e2-highmem-16 | US$ 0,831676944 / 1 hour |
e2-highcpu-16 | US$ 0,455126224 / 1 hour |
e2-highcpu-32 | US$ 0,910252448 / 1 hour |
n2-standard-4 | US$ 0,2233714 / 1 hour |
n2-standard-8 | US$ 0,4467428 / 1 hour |
n2-standard-16 | US$ 0,8934856 / 1 hour |
n2-standard-32 | US$ 1,7869712 / 1 hour |
n2-standard-48 | US$ 2,6804568 / 1 hour |
n2-standard-64 | US$ 3,5739424 / 1 hour |
n2-standard-80 | US$ 4,467428 / 1 hour |
n2-highmem-2 | US$ 0,1506661 / 1 hour |
n2-highmem-4 | US$ 0,3013322 / 1 hour |
n2-highmem-8 | US$ 0,6026644 / 1 hour |
n2-highmem-16 | US$ 1,2053288 / 1 hour |
n2-highmem-32 | US$ 2,4106576 / 1 hour |
n2-highmem-48 | US$ 3,6159864 / 1 hour |
n2-highmem-64 | US$ 4,8213152 / 1 hour |
n2-highmem-80 | US$ 6,026644 / 1 hour |
n2-highcpu-16 | US$ 0,6596032 / 1 hour |
n2-highcpu-32 | US$ 1,3192064 / 1 hour |
n2-highcpu-48 | US$ 1,9788096 / 1 hour |
n2-highcpu-64 | US$ 2,6384128 / 1 hour |
n2-highcpu-80 | US$ 3,298016 / 1 hour |
c2-standard-4 | US$ 0,2401292 / 1 hour |
c2-standard-8 | US$ 0,4802584 / 1 hour |
c2-standard-16 | US$ 0,9605168 / 1 hour |
c2-standard-30 | US$ 1,800969 / 1 hour |
c2-standard-60 | US$ 3,601938 / 1 hour |
m1-ultramem-40 | US$ 7,237065 / 1 hour |
m1-ultramem-80 | US$ 14,47413 / 1 hour |
m1-ultramem-160 | US$ 28,94826 / 1 hour |
m1-megamem-96 | US$ 12,249984 / 1 hour |
cloud-tpu | O preço é determinado pelo tipo do acelerador. Consulte "Aceleradores". |
*Esse valor inclui o preço da GPU, porque esse tipo de instância sempre exige um número fixo de aceleradores de GPU.
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Aceleradores
Tipo de máquina | Preço (US$) | Taxa de gerenciamento da Vertex |
---|---|---|
NVIDIA_TESLA_A100 | US$ 2,933908 / 1 hour | US$ 0,4400862 / 1 hour |
NVIDIA_TESLA_A100_80GB | US$ 3,92808 / 1 hour | US$ 0,589212 / 1 hour |
NVIDIA_H100_80GB | US$ 9,79655057 / 1 hour | US$ 1,4694826 / 1 hour |
NVIDIA_H200_141GB | US$ 10,708501 / 1 hour | Indisponível |
NVIDIA_H100_MEGA_80GB | US$ 11,8959171 / 1 hour | Indisponível |
NVIDIA_TESLA_L4 | US$ 0,644046276 / 1 hour | Indisponível |
NVIDIA_TESLA_P4 | US$ 0,69 / 1 hour | Indisponível |
NVIDIA_TESLA_P100 | US$ 1,679 / 1 hour | Indisponível |
NVIDIA_TESLA_T4 | US$ 0,4025 / 1 hour | Indisponível |
NVIDIA_TESLA_V100 | US$ 2,852 / 1 hour | Indisponível |
TPU_V2 Single (8 núcleos) | US$ 5,175 / 1 hour | Indisponível |
Pod TPU_V2 (32 núcleos)* | US$ 27,60 / 1 hour | Indisponível |
TPU_V3 Single (8 núcleos) | US$ 9,20 / 1 hour | Indisponível |
Pod TPU_V3 (32 núcleos)* | US$ 36,80 / 1 hour | Indisponível |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
* O preço para treinar usando um pod do Cloud TPU é baseado no número de núcleos do pod. O número de núcleos de um pod é sempre um múltiplo de 32. Para determinar o preço de treinar em um pod com mais de 32 núcleos, pegue o preço de um pod de 32 núcleos e multiplique pelo número de núcleos, depois divida por 32. Por exemplo, o preço de um pod de 128 núcleos é (preço do pod de 32 núcleos) * (128/32). Para mais informações sobre quais pods do Cloud TPU estão disponíveis para regiões específicas, consulte Arquitetura do sistema na documentação do Cloud TPU.
Discos
Tipo de máquina | Preço (US$) |
---|---|
pd-standard | US$ 0,000063014 / 1 gibibyte hour |
pd-ssd | US$ 0,000267808 / 1 gibibyte hour |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Você recebe cobranças pelo treinamento dos modelos a contar do momento em que os recursos são provisionados para um job até a finalização dele.
Aviso:seus jobs de treinamento são limitados pela política de cotas da Vertex AI. É provável que a escolha de um cluster de alto processamento para os primeiros jobs de treinamento exceda sua cota.
Níveis de escalonamento para configurações predefinidas (AI Platform Training)
Defina o tipo de cluster de processamento que será usado ao treinar seu modelo. A maneira mais simples é escolher uma das configurações predefinidas, chamadas níveis de escalonamento. Saiba mais sobre os níveis de escalonamento.
Tipos de máquinas para configurações personalizadas
Se você usa a Vertex AI ou seleciona PERSONALIZADO como seu nível de escalonamento no AI Platform Training, você tem controle sobre o número e o tipo de máquinas virtuais que serão usadas para o mestre, o worker e o servidor de parâmetros do cluster. Leia mais sobre tipos de máquinas para Vertex AI e tipos de máquinas para AI Platform Training.
O custo do treinamento com um cluster de processamento personalizado será a soma de todas as máquinas que você especificar. A cobrança é baseada no tempo total do job, e não no tempo de processamento ativo de máquinas individuais.
Para métricas baseadas em modelos, as cobranças são aplicadas apenas aos custos de previsão associados ao modelo de autoavaliação. Eles são cobrados com base nos tokens de entrada que você fornece no conjunto de dados de avaliação e na saída do avaliador automático.
O Serviço de avaliação de IA generativa está disponível para todos os usuários (GA). A mudança de preço entrou em vigor em 14 de abril de 2025.
métrico | Preços |
---|---|
Por pontos | Modelo de avaliação automática padrão Gemini 2.0 Flash |
Em pares | Modelo de avaliação automática padrão Gemini 2.0 Flash |
As métricas baseadas em computação são cobradas a US $0,00003 por 1.000 caracteres de entrada e US $0,00009 por 1.000 caracteres de saída. Eles são chamados de métrica automática no SKU.
Nome da métrica | Tipo |
---|---|
Correspondência exata | Baseado em computação |
Bleu | Baseado em computação |
Rouge | Baseado em computação |
Chamada de ferramenta válida | Baseado em computação |
Correspondência de nome da ferramenta | Baseado em computação |
Correspondência de chave de parâmetro da ferramenta | Baseado em computação |
Correspondência de KV de parâmetro de ferramenta | Baseado em computação |
Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
As métricas legadas baseadas em modelo são cobradas a US $0,005 por 1.000 caracteres de entrada e US $0,015 por 1.000 caracteres de saída.
Nome da métrica | Tipo |
---|---|
Coerência | Por pontos |
Fluência | Por pontos |
Fulfillment | Por pontos |
Segurança | Por pontos |
Embasamento | Por pontos |
Qualidade do resumo | Por pontos |
Utilidade do resumo | Por pontos |
Nível de detalhe do resumo | Por pontos |
Qualidade das respostas a perguntas | Por pontos |
Relevância das respostas a perguntas | Por pontos |
Utilidade das respostas a perguntas | Por pontos |
Correção das respostas a perguntas | Por pontos |
Qualidade do resumo em pares | Em pares |
Qualidade das respostas a perguntas por par | Em pares |
Os preços são indicados em dólares americanos (USD). Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
O preço é baseado nos recursos de computação (horas de vCPU) e memória (horas de GiB) usados pelos agentes implantados no ambiente de execução gerenciado do Agent Engine.
Recurso | Preço (US$) |
---|---|
vCPU | US$ 0,0994 / 1 hour |
RAM | US$ 0,0105 / 1 gibibyte hour |
Treinamento
Confira nas tabelas abaixo o preço por hora aproximado de várias configurações de treinamento. É possível escolher configurações personalizadas de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.
Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela de aceleradores abaixo por quantas horas-máquina de cada tipo de acelerador você utiliza.
Tipos de máquina
Tipo de máquina | Preço (US$) |
---|---|
n1-standard-4 | US$ 0,2279988 / 1 hour |
n1-standard-8 | US$ 0,4559976 / 1 hour |
n1-standard-16 | US$ 0,9119952 / 1 hour |
n1-standard-32 | US$ 1,8239904 / 1 hour |
n1-standard-64 | US$ 3,6479808 / 1 hour |
n1-standard-96 | US$ 5,4719712 / 1 hour |
n1-highmem-2 | US$ 0,1419636 / 1 hour |
n1-highmem-4 | US$ 0,2839272 / 1 hour |
n1-highmem-8 | US$ 0,5678544 / 1 hour |
n1-highmem-16 | US$ 1,1357088 / 1 hour |
n1-highmem-32 | US$ 2,2714176 / 1 hour |
n1-highmem-64 | US$ 4,5428352 / 1 hour |
n1-highmem-96 | US$ 6,8142528 / 1 hour |
n1-highcpu-16 | US$ 0,68014656 / 1 hour |
n1-highcpu-32 | US$ 1,36029312 / 1 hour |
n1-highcpu-64 | US$ 2,72058624 / 1 hour |
n1-highcpu-96 | US$ 4,08087936 / 1 hour |
a2-highgpu-1g* | US$ 4,408062 / 1 hour |
a2-highgpu-2g* | US$ 8,816124 / 1 hour |
a2-highgpu-4g* | US$ 17,632248 / 1 hour |
a2-highgpu-8g* | US$ 35,264496 / 1 hour |
a2-highgpu-16g* | US$ 70,528992 / 1 hour |
a3-highgpu-8g* | US$ 105,39898088 / 1 hour |
a3-megagpu-8g* | US$ 110,65714224 / 1 hour |
a4-highgpu-8g* | US$ 148,212 / 1 hour |
e2-standard-4 | US$ 0,16082748 / 1 hour |
e2-standard-4 | US$ 0,32165496 / 1 hour |
e2-standard-16 | US$ 0,64330992 / 1 hour |
e2-standard-32 | US$ 1,28661984 / 1 hour |
e2-highmem-2 | US$ 0,10847966 / 1 hour |
e2-highmem-4 | US$ 0,21695932 / 1 hour |
e2-highmem-8 | US$ 0,43391864 / 1 hour |
e2-highmem-16 | US$ 0,86783728 / 1 hour |
e2-highcpu-16 | US$ 0,4749144 / 1 hour |
e2-highcpu-32 | US$ 0,9498288 / 1 hour |
n2-standard-4 | US$ 0,2330832 / 1 hour |
n2-standard-8 | US$ 0,4661664 / 1 hour |
n2-standard-16 | US$ 0,9323328 / 1 hour |
n2-standard-32 | US$ 1,8646656 / 1 hour |
n2-standard-48 | US$ 2,7969984 / 1 hour |
n2-standard-64 | US$ 3,7293312 / 1 hour |
n2-standard-80 | US$ 4,661664 / 1 hour |
n2-highmem-2 | US$ 0,1572168 / 1 hour |
n2-highmem-4 | US$ 0,3144336 / 1 hour |
n2-highmem-8 | US$ 0,6288672 / 1 hour |
n2-highmem-16 | US$ 1,2577344 / 1 hour |
n2-highmem-32 | US$ 2,5154688 / 1 hour |
n2-highmem-48 | US$ 3,7732032 / 1 hour |
n2-highmem-64 | US$ 5,0309376 / 1 hour |
n2-highmem-80 | US$ 6,288672 / 1 hour |
n2-highcpu-16 | US$ 0,6882816 / 1 hour |
n2-highcpu-32 | US$ 1,3765632 / 1 hour |
n2-highcpu-48 | US$ 2,0648448 / 1 hour |
n2-highcpu-64 | US$ 2,7531264 / 1 hour |
n2-highcpu-80 | US$ 3,441408 / 1 hour |
c2-standard-4 | US$ 0,2505696 / 1 hour |
c2-standard-8 | US$ 0,5011392 / 1 hour |
c2-standard-16 | US$ 1,0022784 / 1 hour |
c2-standard-30 | US$ 1,879272 / 1 hour |
c2-standard-60 | US$ 3,758544 / 1 hour |
m1-ultramem-40 | US$ 7,55172 / 1 hour |
m1-ultramem-80 | US$ 15,10344 / 1 hour |
m1-ultramem-160 | US$ 30,20688 / 1 hour |
m1-megamem-96 | US$ 12,782592 / 1 hour |
cloud-tpu | O preço é determinado pelo tipo do acelerador. Consulte "Aceleradores". |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Aceleradores
Tipo de GPU | Preço (US$) |
---|---|
NVIDIA_TESLA_A100 | US$ 3,5206896 / 1 hour |
NVIDIA_TESLA_A100_80GB | US$ 4,517292 / 1 hour |
NVIDIA_H100_80GB | US$ 11,75586073 / 1 hour |
NVIDIA_TESLA_P4 | US$ 0,72 / 1 hour |
NVIDIA_TESLA_P100 | US$ 1,752 / 1 hour |
NVIDIA_TESLA_T4 | US$ 0,42 / 1 hour |
NVIDIA_TESLA_V100 | US$ 2,976 / 1 hour |
TPU_V2 Single (8 núcleos) | US$ 5,40 / 1 hour |
Pod TPU_V2 (32 núcleos)* | US$ 28,80 / 1 hour |
TPU_V3 Single (8 núcleos) | US$ 9,60 / 1 hour |
Pod TPU_V3 (32 núcleos)* | US$ 38,40 / 1 hour |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
* O preço para treinar usando um pod do Cloud TPU é baseado no número de núcleos do pod. O número de núcleos de um pod é sempre um múltiplo de 32. Para determinar o preço de treinar em um pod com mais de 32 núcleos, pegue o preço de um pod de 32 núcleos e multiplique pelo número de núcleos, depois divida por 32. Por exemplo, o preço de um pod de 128 núcleos é (preço do pod de 32 núcleos) * (128/32). Para mais informações sobre quais pods do Cloud TPU estão disponíveis para regiões específicas, consulte Arquitetura do sistema na documentação do Cloud TPU.
Discos
Tipo de disco | Preço (US$) |
---|---|
pd-standard | US$ 0,000065753 / 1 gibibyte hour |
pd-ssd | US$ 0,000279452 / 1 gibibyte hour |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Você recebe cobranças pelo treinamento dos modelos a contar do momento em que os recursos são provisionados para um job até a finalização dele.
Aviso:seus jobs de treinamento são limitados pela política de cotas da Vertex AI. É provável que a escolha de um cluster de alto processamento para os primeiros jobs de treinamento exceda sua cota.
A tabela a seguir apresenta os preços da previsão em lote, da previsão on-line e da explicação on-line por hora de uso do nó. Uma hora de uso do nó representa o tempo que a máquina virtual leva executando um job de previsão ou aguardando em estado ativo (um endpoint com um ou mais modelos implantados) para lidar com solicitações de explicação ou previsão.
É possível usar VMs spot com a inferência da Vertex AI.As VMs do Spot são cobradas de acordo com os preços das VMs do Spot do Compute Engine. Há taxas de gerenciamento da Vertex AI Inference além do uso da infraestrutura, capturadas nas tabelas a seguir.
É possível usar reservas do Compute Engine com a Vertex AI Inference. Ao usar reservas do Compute Engine, você recebe cobranças de acordo com os preços do Compute Engine, incluindo os descontos por uso contínuo (CUDs) aplicáveis. Há taxas de gerenciamento da Vertex AI Inference além do uso da infraestrutura, capturadas nas tabelas a seguir.
Série E2
Tipo de máquina | Preço (US$) |
---|---|
e2-standard-2 | US$ 0,0770564 / 1 hour |
e2-standard-4 | US$ 0,1541128 / 1 hour |
e2-standard-8 | US$ 0,3082256 / 1 hour |
e2-standard-16 | US$ 0,6164512 / 1 hour |
e2-standard-32 | US$ 1,2329024 / 1 hour |
e2-highmem-2 | US$ 0,1039476 / 1 hour |
e2-highmem-4 | US$ 0,2078952 / 1 hour |
e2-highmem-8 | US$ 0,4157904 / 1 hour |
e2-highmem-16 | US$ 0,8315808 / 1 hour |
e2-highcpu-2 | US$ 0,056888 / 1 hour |
e2-highcpu-4 | US$ 0,113776 / 1 hour |
e2-highcpu-8 | US$ 0,227552 / 1 hour |
e2-highcpu-16 | US$ 0,455104 / 1 hour |
e2-highcpu-32 | US$ 0,910208 / 1 hour |
Série N1
Tipo de máquina | Preço (US$) |
---|---|
n1-standard-2 | US$ 0,1095 / 1 hour |
n1-standard-4 | US$ 0,219 / 1 hour |
n1-standard-8 | US$ 0,438 / 1 hour |
n1-standard-16 | US$ 0,876 / 1 hour |
n1-standard-32 | US$ 1,752 / 1 hour |
n1-highmem-2 | US$ 0,137 / 1 hour |
n1-highmem-4 | US$ 0,274 / 1 hour |
n1-highmem-8 | US$ 0,548 / 1 hour |
n1-highmem-16 | US$ 1,096 / 1 hour |
n1-highcpu-2 | US$ 0,081 / 1 hour |
n1-highcpu-4 | US$ 0,162 / 1 hour |
n1-highcpu-8 | US$ 0,324 / 1 hour |
n1-highcpu-16 | US$ 0,648 / 1 hour |
n1-highcpu-32 | US$ 1,296 / 1 hour |
Série N2
Tipo de máquina | Preço (US$) |
---|---|
n2-standard-2 | US$ 0,1116854 / 1 hour |
n2-standard-4 | US$ 0,2233708 / 1 hour |
n2-standard-8 | US$ 0,4467416 / 1 hour |
n2-standard-16 | US$ 0,8934832 / 1 hour |
n2-standard-32 | US$ 1,7869664 / 1 hour |
n2-highmem-2 | US$ 0,1506654 / 1 hour |
n2-highmem-4 | US$ 0,3013308 / 1 hour |
n2-highmem-8 | US$ 0,6026616 / 1 hour |
n2-highmem-16 | US$ 1,2053232 / 1 hour |
n2-highcpu-2 | US$ 0,0824504 / 1 hour |
n2-highcpu-4 | US$ 0,1649008 / 1 hour |
n2-highcpu-8 | US$ 0,3298016 / 1 hour |
n2-highcpu-16 | US$ 0,6596032 / 1 hour |
n2-highcpu-32 | US$ 1,3192064 / 1 hour |
Série N2D
Tipo de máquina | Preço (US$) |
---|---|
n2d-standard-2 | US$ 0,0971658 / 1 hour |
n2d-standard-4 | US$ 0,1943316 / 1 hour |
n2d-standard-8 | US$ 0,3886632 / 1 hour |
n2d-standard-16 | US$ 0,7773264 / 1 hour |
n2d-standard-32 | US$ 1,5546528 / 1 hour |
n2d-highmem-2 | US$ 0,131077 / 1 hour |
n2d-highmem-4 | US$ 0,262154 / 1 hour |
n2d-highmem-8 | US$ 0,524308 / 1 hour |
n2d-highmem-16 | US$ 1,048616 / 1 hour |
n2d-highcpu-2 | US$ 0,0717324 / 1 hour |
n2d-highcpu-4 | US$ 0,1434648 / 1 hour |
n2d-highcpu-8 | US$ 0,2869296 / 1 hour |
n2d-highcpu-16 | US$ 0,5738592 / 1 hour |
n2d-highcpu-32 | US$ 1,1477184 / 1 hour |
Série C2
Tipo de máquina | Preço (US$) |
---|---|
c2-standard-4 | US$ 0,240028 / 1 hour |
c2-standard-8 | US$ 0,480056 / 1 hour |
c2-standard-16 | US$ 0,960112 / 1 hour |
c2-standard-30 | US$ 1,80021 / 1 hour |
c2-standard-60 | US$ 3,60042 / 1 hour |
Série C2D
Tipo de máquina | Preço (US$) |
---|---|
c2d-standard-2 | US$ 0,1044172 / 1 hour |
c2d-standard-4 | US$ 0,2088344 / 1 hour |
c2d-standard-8 | US$ 0,4176688 / 1 hour |
c2d-standard-16 | US$ 0,8353376 / 1 hour |
c2d-standard-32 | US$ 1,6706752 / 1 hour |
c2d-standard-56 | US$ 2,9236816 / 1 hour |
c2d-standard-112 | US$ 5,8473632 / 1 hour |
c2d-highmem-2 | US$ 0,1408396 / 1 hour |
c2d-highmem-4 | US$ 0,2816792 / 1 hour |
c2d-highmem-8 | US$ 0,5633584 / 1 hour |
c2d-highmem-16 | US$ 1,1267168 / 1 hour |
c2d-highmem-32 | US$ 2,2534336 / 1 hour |
c2d-highmem-56 | US$ 3,9435088 / 1 hour |
c2d-highmem-112 | US$ 7,8870176 / 1 hour |
c2d-highcpu-2 | US$ 0,086206 / 1 hour |
c2d-highcpu-4 | US$ 0,172412 / 1 hour |
c2d-highcpu-8 | US$ 0,344824 / 1 hour |
c2d-highcpu-16 | US$ 0,689648 / 1 hour |
c2d-highcpu-32 | US$ 1,379296 / 1 hour |
c2d-highcpu-56 | US$ 2,413768 / 1 hour |
c2d-highcpu-112 | US$ 4,827536 / 1 hour |
Série C3
Tipo de máquina | Preço (US$) |
---|---|
C3 highcpu 4 | US$ 0,19824 / 1 hour |
C3 highcpu 8 | US$ 0,39648 / 1 hour |
C3 highcpu 22 | US$ 1,09032 / 1 hour |
C3 highcpu 44 | US$ 2,18064 / 1 hour |
C3 highcpu 88 | US$ 4,36128 / 1 hour |
C3 highcpu 176 | US$ 8,72256 / 1 hour |
Série A2
Tipo de máquina | Preço (US$) |
---|---|
a2-highgpu-1g | US$ 4,2244949 / 1 hour |
a2-highgpu-2g | US$ 8,4489898 / 1 hour |
a2-highgpu-4g | US$ 16,8979796 / 1 hour |
a2-highgpu-8g | US$ 33,7959592 / 1 hour |
a2-megagpu-16g | US$ 64,1020592 / 1 hour |
a2-ultragpu-1g | US$ 5,7818474 / 1 hour |
a2-ultragpu-2g | US$ 11,5636948 / 1 hour |
a2-ultragpu-4g | US$ 23,1273896 / 1 hour |
a2-ultragpu-8g | US$ 46,2547792 / 1 hour |
Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.
Série A3
Tipo de máquina | Preço (US$) |
---|---|
a3-ultragpu-8g | US$ 96,015616 / 1 hour |
a3-megagpu-8g | US$ 106,65474 / 1 hour |
Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.
Série A4
Tipo de máquina | Preço (US$) |
---|---|
a4-highgpu-8g | US$ 148,212 / 1 hour |
Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.
Série A4X
Tipo de máquina | Preço (US$) |
---|---|
a4x-highgpu-4g | US$ 74,75 / 1 hour |
Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.
a4x-highgpu-4g requer pelo menos 18 VMs.
Série G2
Tipo de máquina | Preço (US$) |
---|---|
g2-standard-4 | US$ 0,81293 / 1 hour |
g2-standard-8 | US$ 0,98181 / 1 hour |
g2-standard-12 | US$ 1,15069 / 1 hour |
g2-standard-16 | US$ 1,31957 / 1 hour |
g2-standard-24 | US$ 2,30138 / 1 hour |
g2-standard-32 | US$ 1,99509 / 1 hour |
g2-standard-48 | US$ 4,60276 / 1 hour |
g2-standard-96 | US$ 9,20552 / 1 hour |
Ao consumir de uma reserva ou capacidade spot, o faturamento é distribuído em duas SKUs: a SKU do GCE com o rótulo "vertex-ai-online-prediction" e a SKU da taxa de gerenciamento da Vertex AI. Isso permite que você use seus Descontos por Uso Contínuo (CUDs) na Vertex AI.
Preços da TPU v5e
Tipo de máquina | Preço (US$) |
---|---|
ct5lp-hightpu-1t | US$ 1,38 / 1 hour |
ct5lp-hightpu-4t | US$ 5,52 / 1 hour |
ct5lp-hightpu-8t | US$ 5,52 / 1 hour |
Cada tipo de máquina é cobrado como os seguintes SKUs na sua fatura do Google Cloud:
Os preços por tipo de máquina são usados para aproximar o custo horário total para cada nó de previsão de uma versão do modelo que usa aquele tipo de máquina.
Por exemplo, um tipo de máquina n1-highcpu-32 inclui 32 vCPUs e 32 GB de RAM. Portanto, o preço por hora é igual a 32 vCPU/hora + 32 GB/hora.
Série E2
Item | Preço (US$) |
---|---|
vCPU | US$ 0,0250826 / 1 hour |
RAM | US$ 0,0033614 / 1 gibibyte hour |
Série N1
Item | Preço (US$) |
---|---|
vCPU | US$ 0,036 / 1 hour |
RAM | US$ 0,005 / 1 gibibyte hour |
Série N2
Item | Preço (US$) |
---|---|
vCPU | US$ 0,0363527 / 1 hour |
RAM | US$ 0,0048725 / 1 gibibyte hour |
Série N2D
Item | Preço (US$) |
---|---|
vCPU | US$ 0,0316273 / 1 hour |
RAM | US$ 0,0042389 / 1 gibibyte hour |
Série C2
Item | Preço (US$) |
---|---|
vCPU | US$ 0,039077 / 1 hour |
RAM | US$ 0,0052325 / 1 gibibyte hour |
Série C2D
Item | Preço (US$) |
---|---|
vCPU | US$ 0,0339974 / 1 hour |
RAM | US$ 0,0045528 / 1 gibibyte hour |
Série C3
Item | Preço (US$) |
---|---|
vCPU | US$ 0,03908 / 1 hour |
RAM | US$ 0,00524 / 1 gibibyte hour |
Série A2
Item | Preço (US$) |
---|---|
vCPU | US$ 0,0363527 / 1 hour |
RAM | US$ 0,0048725 / 1 gibibyte hour |
GPU (A100 40 GB) | US$ 3,3741 / 1 hour |
GPU (A100 80 GB) | US$ 4,51729 / 1 hour |
Série A3
Item | Preço (US$) |
---|---|
vCPU | US$ 0,0293227 / 1 hour |
RAM | US$ 0,0025534 / 1 gibibyte hour |
GPU (H100 80 GB) | US$ 11,2660332 / 1 hour |
GPU (H200) | US$ 10,708501 / 1 hour |
Série G2
Item | Preço (US$) |
---|---|
vCPU | US$ 0,02874 / 1 hour |
RAM | US$ 0,00337 / 1 gibibyte hour |
GPU (L4) | US$ 0,64405 / 1 hour |
Alguns tipos de máquinas permitem adicionar aceleradores de GPU opcionais para previsão. As GPUs opcionais geram outras cobranças, separadas daquelas descritas na tabela anterior. Veja cada tabela de preços, que descreve os preços de cada tipo de GPU opcional.
Aceleradores: preço por hora
Tipo de GPU | Preço (US$) |
---|---|
NVIDIA_TESLA_P4 | US$ 0,69 / 1 hour |
NVIDIA_TESLA_P100 | US$ 1,679 / 1 hour |
NVIDIA_TESLA_T4 | US$ 0,402 / 1 hour |
NVIDIA_TESLA_V100 | US$ 2,852 / 1 hour |
O preço é por GPU. Se você usar várias GPUs por nó de previsão (ou se fizer escalonamento da versão para utilizar diversos nós),os custos serão escalonados proporcionalmente.
O AI Platform Prediction disponibiliza previsões a partir do seu modelo executando várias máquinas virtuais ("nós"). Por padrão, a Vertex AI escalona automaticamente o número de nós em execução a qualquer momento. Para previsão on-line, o número de nós é escalonado para atender à demanda. Cada nó pode responder a várias solicitações de previsão. Para previsão em lote, o número de nós é escalonado para reduzir o tempo total necessário para executar um job. Personalize a maneira como os nós de previsão são escalonados.
Você é cobrado pelo tempo que cada nó é executado para seu modelo, incluindo:
O custo de um nó em execução por uma hora é uma hora de uso do nó. A tabela de preços de previsão descreve o preço de uma hora do nó, que varia entre as regiões e entre a previsão on-line e a previsão em lote.
As horas de uso do nó podem ser consumidas em incrementos fracionários. Por exemplo, um nó em execução por 30 minutos custa 0,5 hora do nó.
Cálculo de custo dos tipos de máquina do Compute Engine (N1)
Mais sobre escalonamento automático de nós de previsão
Previsão on-line | Previsão em lote |
---|---|
A prioridade do escalonamento é reduzir a latência das solicitações individuais. O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após atender a uma solicitação. | A prioridade do escalonamento é reduzir o tempo total decorrido do job. |
O escalonamento afeta suas taxas totais a cada mês: quanto mais numerosas e frequentes forem suas solicitações, mais nós serão usados. | O escalonamento provavelmente não terá muito efeito sobre o preço do seu job, ainda que haja alguns gastos indiretos envolvidos na criação de um novo nó. |
Você pode escolher deixar o serviço ser escalonado em resposta ao tráfego (escalonamento automático) ou especificar vários nós para execução constante para evitar latência (escalonamento manual).
| É possível influenciar o escalonamento definindo um número máximo de nós a ser usado para um job de previsão em lote e definindo o número de nós que continuarão em execução para um modelo quando ele for implantado. |
Jobs de predição em lote são cobrados após a conclusão do job
Os jobs de previsão em lote são cobrados após a conclusão do job, e não de forma incremental durante o job. Os alertas de orçamento do Cloud Billing que você configurou não são acionados enquanto um job está em execução. Antes de iniciar um job grande, primeiro execute alguns jobs de comparação de custos com pequenos dados de entrada.
Exemplo de um cálculo de previsão
Uma empresa imobiliária em uma região das Américas realiza uma previsão semanal de valores de habitação nas áreas em que atende. Em um mês, realiza previsões para quatro semanas em lotes de 3920, 4277, 3849 e 3961. Os jobs são limitados a um nó, e cada instância leva uma média de 0,72 segundos de processamento.
Primeiro, calcule o período de tempo que cada job foi executado:
Cada job foi executado por mais de dez minutos, portanto, a cobrança é feita por cada minuto de processamento:
A cobrança total do mês é de US$ 0,26.
Este exemplo considera que os jobs foram executados em um único nó e demoraram um período consistente de tempo por instância de entrada. No uso real, certifique-se de contabilizar vários nós e usar o tempo real que cada nó gasta em execução para os seus cálculos.
Cobranças pela Vertex Explainable AI
Explicações baseadas em atributos
As explicações baseadas em recursos não têm custo extra sobre os preços de previsão. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais. Por isso, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de previsão.
Explicações baseadas em exemplos
O preço das explicações baseadas em exemplos consiste no seguinte:
As tabelas a seguir resumem os preços em cada região em que a pesquisa de arquitetura neural está disponível.
Preços
As tabelas a seguir mostram o preço por hora de várias configurações.
É possível escolher um nível de escalonamento predefinido ou uma configuração personalizada de tipos de máquinas selecionados. Se você escolher uma configuração personalizada, some os custos das máquinas virtuais que você usa.
Tipos de máquinas legadas compatíveis com aceleradores incluem o custo dos aceleradores no preço. Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela a seguir de aceleradores pelo número de cada tipo de acelerador usado.
Tipos de máquina
Tipo de máquina | Preço (US$) |
---|---|
n1-standard-4 | US$ 0,2849985 / 1 hour |
n1-standard-8 | US$ 0,569997 / 1 hour |
n1-standard-16 | US$ 1,139994 / 1 hour |
n1-standard-32 | US$ 2,279988 / 1 hour |
n1-standard-64 | US$ 4,559976 / 1 hour |
n1-standard-96 | US$ 6,839964 / 1 hour |
n1-highmem-2 | US$ 0,1774545 / 1 hour |
n1-highmem-4 | US$ 0,1774545 / 1 hour |
n1-highmem-8 | US$ 0,709818 / 1 hour |
n1-highmem-16 | US$ 1,419636 / 1 hour |
n1-highmem-32 | US$ 2,839272 / 1 hour |
n1-highmem-64 | US$ 5,678544 / 1 hour |
n1-highmem-96 | US$ 8,517816 / 1 hour |
n1-highcpu-16 | US$ 0,8501832 / 1 hour |
n1-highcpu-32 | US$ 1,7003664 / 1 hour |
n1-highcpu-64 | US$ 3,4007328 / 1 hour |
n1-highcpu-96 | US$ 5,1010992 / 1 hour |
a2-highgpu-1g | US$ 5,641070651 / 1 hour |
a2-highgpu-2g | US$ 11,282141301 / 1 hour |
a2-highgpu-4g | US$ 22,564282603 / 1 hour |
a2-highgpu-8g | US$ 45,128565205 / 1 hour |
a2-highgpu-16g | US$ 90,257130411 / 1 hour |
e2-standard-4 | US$ 0,20103426 / 1 hour |
e2-standard-8 | US$ 0,40206852 / 1 hour |
e2-standard-16 | US$ 0,80413704 / 1 hour |
e2-standard-32 | US$ 1,60827408 / 1 hour |
e2-highmem-2 | US$ 0,13559949 / 1 hour |
e2-highmem-4 | US$ 0,27119898 / 1 hour |
e2-highmem-8 | US$ 0,54239796 / 1 hour |
e2-highmem-16 | US$ 1,08479592 / 1 hour |
e2-highcpu-16 | US$ 0,59364288 / 1 hour |
e2-highcpu-32 | US$ 1,18728576 / 1 hour |
n2-standard-4 | US$ 0,291354 / 1 hour |
n2-standard-8 | US$ 0,582708 / 1 hour |
n2-standard-16 | US$ 1,165416 / 1 hour |
n2-standard-32 | US$ 2,330832 / 1 hour |
n2-standard-48 | US$ 3,496248 / 1 hour |
n2-standard-64 | US$ 4,661664 / 1 hour |
n2-standard-80 | US$ 5,82708 / 1 hour |
n2-highmem-2 | US$ 0,196521 / 1 hour |
n2-highmem-4 | US$ 0,393042 / 1 hour |
n2-highmem-8 | US$ 0,786084 / 1 hour |
n2-highmem-16 | US$ 1,572168 / 1 hour |
n2-highmem-32 | US$ 3,144336 / 1 hour |
n2-highmem-48 | US$ 4,716504 / 1 hour |
n2-highmem-64 | US$ 6,288672 / 1 hour |
n2-highmem-80 | US$ 7,86084 / 1 hour |
n2-highcpu-16 | US$ 0,860352 / 1 hour |
n2-highcpu-32 | US$ 1,720704 / 1 hour |
n2-highcpu-64 | US$ 3,441408 / 1 hour |
n2-highcpu-80 | US$ 4,30176 / 1 hour |
c2-standard-4 | US$ 0,313212 / 1 hour |
c2-standard-8 | US$ 0,626424 / 1 hour |
c2-standard-16 | US$ 1,252848 / 1 hour |
c2-standard-30 | US$ 2,34909 / 1 hour |
c2-standard-60 | US$ 4,69818 / 1 hour |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Os preços das instâncias a2-highgpu incluem os encargos dos aceleradores NVIDIA_TESLA_A100 anexados.
Aceleradores
Tipo de GPU | Preço (US$) |
---|---|
NVIDIA_TESLA_A100 | US$ 4,400862 / 1 hour |
NVIDIA_TESLA_P4 | US$ 0,90 / 1 hour |
NVIDIA_TESLA_P100 | US$ 2,19 / 1 hour |
NVIDIA_TESLA_T4 | US$ 0,525 / 1 hour |
NVIDIA_TESLA_V100 | US$ 3,72 / 1 hour |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Discos
Tipo de disco | Preço (US$) |
---|---|
pd-standard | US$ 0,000082192 / 1 gibibyte hour |
pd-ssd | US$ 0,000349315 / 1 gibibyte hour |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Observações:
Uso obrigatório do Cloud Storage
Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida da pesquisa de arquitetura neural. Esse armazenamento está sujeito à política de preços do Cloud Storage.
O uso obrigatório do Cloud Storage inclui:
Observação:você pode usar outro serviço do Google Cloud para armazenar seus dados de entrada, como o BigQuery, que tem o próprio preço.
Operações gratuitas para gerenciar seus recursos
As operações de gerenciamento de recursos fornecidas pela pesquisa de arquitetura neural estão disponíveis sem custo financeiro. A política de cotas da pesquisa de arquitetura neural limita algumas dessas operações.
Recurso | Operações gratuitas |
---|---|
empregos | get, list, cancel |
operações | get, list, cancel, delete |
O Vertex AI Pipelines tem uma taxa de execução de US$ 0,03 por pipeline. Não há cobranças pela taxa de execução durante a versão de pré-lançamento. Você também paga pelos recursos do Google Cloud usados com o Vertex AI Pipelines, como os componentes do Compute Engine consumidos por pipelines. O preço deles é igual ao do treinamento da Vertex AI. Por fim, você é responsável pelo custo de todos os serviços (como o Dataflow) chamados pelo seu pipeline.
O Vertex AI Feature Store está em disponibilidade geral (GA) desde novembro de 2023. Para obter informações sobre a versão anterior do produto, acesse Vertex AI Feature Store (legado).
Novo Vertex AI Feature Store
O novo Vertex AI Feature Store oferece suporte à funcionalidade em dois tipos de operações:
Preços das operações off-line
Como o BigQuery é usado para operações off-line, consulte os preços do BigQuery para funcionalidades como ingestão no repositório off-line, consulta ao repositório off-line e armazenamento off-line.
Preços das operações on-line
Para operações on-line, o Vertex AI Feature Store cobra por quaisquer recursos em GA para transferir dados para a loja on-line, fornecer ou armazenar dados. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta para concluir uma operação, cobrado por minuto.
Operação | Preço (US$) |
---|---|
Nó de processamento de dados Processamento de dados (por exemplo, ingestão em qualquer armazenamento, monitoramento etc.) | US$ 0,08 / 1 hour |
Nó de veiculação on-line otimizado Serviços de baixa latência e serviços de embeddings Cada nó inclui 200 GB de armazenamento | US$ 0,30 / 1 hour |
Nó de veiculação on-line do Bigtable Serving with Cloud Bigtable | US$ 0,94 / 1 hour |
Armazenamento de veiculação on-line do Bigtable Armazenamento para veiculação com o Cloud Bigtable | US$ 0,000342466 / 1 gibibyte hour |
A veiculação on-line otimizada e a veiculação on-line do Bigtable usam arquiteturas diferentes, portanto, seus nós não são comparáveis.
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Estimativas de carga de trabalho das operações on-line
Considere as diretrizes a seguir ao estimar suas cargas de trabalho. O número de nós necessários para determinada carga de trabalho pode diferir em cada abordagem de serviço.
É possível visualizar o número de nós (com réplicas) no Metrics Explorer:
Exemplo de cenários mensais (considerando us-central1)
Carga de trabalho de fluxo de dados: veiculação on-line do Bigtable com 2,5 TB de dados (1 GB atualizado diariamente) e 1.200 QPS
Operações | Uso mensal | Custo mensal |
---|---|---|
Nó de processamento de dados | (1 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 300 horas de uso do nó | 300 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $24 |
Nó de veiculação on-line otimizado | N/A | N/A |
Nó de veiculação on-line do Bigtable | (1 nó) * (24 horas/dia) * (30 dias/mês) = 720 horas de uso do nó | 720 horas de uso do nó * (US$ 0,94 por hora de uso do nó) = US $677 |
Armazenamento de veiculação on-line do Bigtable | (2,5 TB por mês) * (1.000 GB/TB) = 2.500 GB por mês | 2.500 GB por mês * (US$ 0,25 por GB por mês) = US $625 |
Total | US$ 1,326 |
Carga de trabalho de QPS alto: veiculação on-line otimizada com 10 GB de dados sem incorporação (5 GB atualizados diariamente) e 2.000 QPS
Operações | Uso mensal | Custo mensal |
---|---|---|
Nó de processamento de dados | (5 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 1.500 horas de uso do nó | 1.500 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $120 |
Nó de veiculação on-line otimizado | Arredondamento(10 GB * (1 nó / 200 GB)) = 1 * máx.(2 réplicas padrão, 2.000 QPS * (1 réplica / 500 QPS)) = 4 nós no total * (24 horas/dia) * (30 dias/mês) =2.880 horas de uso do nó | 2.880 horas de uso do nó * (US$ 0,30 por hora de uso do nó) = US$ 864 |
Nó de veiculação on-line do Bigtable | N/A | N/A |
Armazenamento de veiculação on-line do Bigtable | N/A | N/A |
Total | US$984 |
Carga de trabalho de veiculação de embeddings: veiculação on-line otimizada com 20 GB de dados de embeddings (2 GB atualizados diariamente) e 800 QPS
Operações | Uso mensal | Custo mensal |
---|---|---|
Nó de processamento de dados | (2 GB/dia) * (30 dias/mês) * (1.000 MB/GB) * (1 hora de uso do nó / 100 MB) = 600 horas de uso do nó | 600 horas de uso do nó * (US$ 0,08 por hora de uso do nó) = US $48 |
Nó de veiculação on-line otimizado | Arredondamento(20 GB* (1 nó / 4 GB) = 5 * max(2 réplicas padrão, 800 QPS * (1 réplica / 500 QPS)) = 10 nós no total * (24 horas/dia) * (30 dias/mês) = 7.200 horas de uso do nó | 7.200 horas de uso do nó * (US$ 0,30 por hora de uso do nó) = US$ 2.160 |
Nó de veiculação on-line do Bigtable | N/A | N/A |
Armazenamento de veiculação on-line do Bigtable | N/A | N/A |
Total | US$2.208 |
Feature Store da Vertex AI (legado)
Os preços do Vertex AI Feature Store (legado) dependem da quantidade de dados de recursos armazenados on-line e off-line, bem como da disponibilidade para veiculação on-line. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta exibindo dados do recurso ou aguardando em estado de prontidão para lidar com as solicitações de dados do recurso.
Operação | Preço (US$) |
---|---|
Armazenamento on-line | US$ 0,25 por GB/mês |
Armazenamento off-line | US$ 0,023 por GB/mês |
Exibição on-line | US$ 0,94 por nó/hora |
Exportação em lote | US$ 0,005 por GB |
Ingestão de streaming | US$ 0,10 por GB de ingestão |
Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
Quando você ativa o monitoramento do valor do recurso, o faturamento inclui os encargos aplicáveis acima, além dos encargos aplicáveis a seguir:
Exemplo de análise de snapshot
Um cientista de dados permite o monitoramento do valor do recurso para seu Vertex AI Feature Store (legado) e ativa o monitoramento para uma análise diária de snapshots. Um pipeline é executado diariamente para monitoramento de tipos da entidade. O pipeline verifica 2 GB de dados no Vertex AI Feature Store (legado) e exporta um snapshot contendo 0,1 GB de dados. A cobrança total de um dia de análise é:
(0,1 GB * US$ 3,50) + (2 GB * US$ 0,005) = US $0,36
Exemplo de análise de ingestão
Um cientista de dados permite o monitoramento do valor do recurso para seu Vertex AI Feature Store (legado) e ativa o monitoramento para operações de ingestão. Uma operação de ingestão importa 1 GB de dados para o Vertex AI Feature Store (legado). A cobrança total referente ao monitoramento do valor do recurso é:
(1 GB * US$ 3,50) = US $3,50
O armazenamento de metadados é medido em gigabytes binários (GiB), sendo que 1 GiB é igual a 1.073.741.824 bytes. Essa unidade de medida também é conhecida como gibibyte.
O Vertex ML Metadata cobra US $10 por gibibyte (GiB) por mês pelo armazenamento de metadados. Os preços são rateados por megabyte (MB). Por exemplo, se você armazena 10 MB de metadados, será cobrado US $0,10 por mês por esses 10 MB de metadados.
Os preços são os mesmos em todas as regiões com suporte ao Vertex ML Metadata.
Para usar o Vertex AI TensorBoard, solicite que o administrador do IAM do projeto atribua a você o papel "Usuário do app da Web do Vertex AI TensorBoard". A função de administrador da Vertex AI também tem acesso.
A partir de agosto de 2023, o preço do Vertex AI TensorBoard mudou de uma licença mensal por usuário de US $300/mês para US $10 GiB/mês para armazenamento de dados de registros e métricas. Isso significa que não há mais taxas de assinatura. Você pagará apenas pelo armazenamento que usar. Consulte o tutorial Vertex AI TensorBoard: excluir experimentos desatualizados do TensorBoard para saber como gerenciar o armazenamento.
O Vertex AI Vizier é um serviço de otimização de caixa preta dentro do Vertex AI. O modelo de preços do Vertex AI Vizier consiste no seguinte:
O preço do serviço de Pesquisa Vetorial de vizinho mais próximo aproximado consiste em:
Os dados processados durante a criação e atualização dos índices são medidos em gigabytes (GiB) binários, em que 1 GiB é 1.073.741.824 bytes. Essa unidade de medida também é conhecida como gibibyte.
A Pesquisa Vetorial cobra US $3,00 por gibibyte (GiB) de dados processados em todas as regiões. A Pesquisa Vetorial cobra US $0,45/GiB ingerido para inserções de atualização de streaming.
As tabelas a seguir resumem o preço de um índice veiculado em cada região onde a Pesquisa Vetorial está disponível. O preço corresponde ao tipo de máquina, por região, e é cobrado por hora de uso do nó.
Tipo de máquina | Preço (US$) |
---|---|
e2-standard-2 | US$ 0,0938084 / 1 hour |
e2-standard-16 | US$ 0,7504672 / 1 hour |
e2-highmem-16 | US$ 1,012368 / 1 hour |
n2d-standard-32 | US$ 1,8926208 / 1 hour |
n1-standard-16 | US$ 1,0639944 / 1 hour |
n1-standard-32 | US$ 2,1279888 / 1 hour |
Exemplos de preços da Pesquisa Vetorial
O preço da Pesquisa Vetorial é determinado pelo tamanho dos seus dados, pela quantidade de consultas por segundo (QPS) que você quer executar e pelo número de nós que você usa. Para obter o custo estimado de veiculação, você precisa calcular o tamanho total dos dados. O tamanho dos dados é o número de embeddings/vetores* o número de dimensões que você tem* 4 bytes por dimensão. Depois de ter o tamanho dos seus dados, você pode calcular o custo de veiculação e o custo de criação. O custo de veiculação mais o custo de criação é igual ao custo total mensal.
Atualização de streaming:a pesquisa de vetores usa métricas baseadas em heurística para determinar quando acionar a compactação. Se os dados não compactados mais antigos tiverem cinco dias, a compactação será sempre acionada. Você será cobrado pelo custo de recriar o índice pela mesma taxa de uma atualização em lote, além dos custos da atualização de streaming.
Número de embeddings/vetores | Número de dimensões | Consultas por segundo (QPS) | Tipo de máquina | Nós | Custo estimado de veiculação mensal (USD) |
---|---|---|---|---|---|
2 milhões | 128 | 100 | e2-standard-2 | 1 | US$ 68 |
20 milhões | 256 | 1.000 | e2-standard-16 | 1 | US$ 547 |
20 milhões | 256 | 3.000 | e2-standard-16 | 3 | US$ 1.642 |
100 milhões | 256 | 500 | e2-highmem-16 | 2 | US$ 1.477 |
1 bilhão | 100 | 500 | e2-highmem-16 | 8 | US$ 5.910 |
Todos os exemplos são baseados em tipos de máquinas em us-central1. O custo gerado vai variar de acordo com a taxa de recall e os requisitos de latência. O custo estimado de veiculação mensal está diretamente relacionado ao número de nós usados no console. Para saber mais sobre os parâmetros de configuração que afetam o custo, consulte Parâmetros de configuração que afetam o recall e a latência.
Se você tiver um alto número de consultas por segundo (QPS), agrupar essas consultas em lote pode reduzir os custos totais em até 30%-40%.
O Vertex AI Model Registry é um repositório central que rastreia e lista seus modelos e versões de modelos. Você pode importar modelos para a Vertex AI e eles aparecem no Vertex AI Model Registry. Não há nenhum custo associado a ter seus modelos no Model Registry. Os custos só são gerados quando você implanta o modelo em um endpoint ou executa uma previsão em lote no modelo. Esse custo é determinado pelo tipo de modelo que você está implantando.
Para saber mais sobre preços para implantação de modelos personalizados do Vertex AI Model Registry, consulte Modelos treinados de maneira personalizada. Para saber mais sobre preços para implantação de modelos AutoML, consulte Preços para modelos AutoML.
Com a Vertex AI, é possível monitorar a eficácia contínua do seu modelo depois de implantá-lo na produção. Para mais informações, consulte Introdução ao Monitoramento de modelos com a Vertex AI.
Ao usar o Monitoramento de modelos da Vertex AI, você recebe cobranças da seguinte forma:
O Vertex AI Model Monitoring é compatível com as seguintes regiões: us-central1, europe-west4, asia-east1 e asia-southeast1. Os preços são os mesmos em todas as regiões.
Os tamanhos dos dados são medidos depois de serem convertidos para o formato TfRecord.
Conjuntos de dados de treinamento geram uma cobrança única quando você configura um job de Monitoramento de Modelos da Vertex AI.
Os conjuntos de dados de previsão são registros coletados do serviço de previsão on-line. Conforme as solicitações de previsão chegam durante janelas de tempo diferentes, os dados de cada janela são coletados e a soma das informações analisadas em cada janela de previsão é usada para calcular a cobrança.
Exemplo: um cientista de dados executa o monitoramento de modelo no tráfego de previsão que pertence ao modelo.
Selecione instâncias, notebooks gerenciados ou notebooks gerenciados pelo usuário para informações sobre preços.
Instâncias
Veja nas tabelas abaixo o preço por hora aproximado de várias configurações de VM. É possível escolher uma configuração personalizada de tipos de máquinas selecionados. Para calcular os preços, some os custos das máquinas virtuais usadas por você.
Se você usar tipos de máquina do Compute Engine e anexar aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela de aceleradores abaixo por quantas horas-máquina de cada tipo de acelerador você utiliza.
CPUs
Tipo de máquina | Preço por vCPU (USD) |
---|---|
N1 | US$ 0,0379332 / 1 hour |
N2 | US$ 0,0379332 / 1 hour |
E2 | US$ 0,026173908 / 1 hour |
A2 | US$ 0,0379332 / 1 hour |
Memória
Tipo de máquina | Preço (US$) |
---|---|
N1 | US$ 0,0050844 / 1 gibibyte hour |
N2 | US$ 0,0050844 / 1 gibibyte hour |
E2 | US$ 0,003508236 / 1 gibibyte hour |
A2 | US$ 0,0050844 / 1 gibibyte hour |
Aceleradores
Tipo de máquina | Preço (US$) |
---|---|
Nvidia Tesla A100 | US$ 4,400862 / 1 hour |
Nvidia Tesla A100 80GB | US$ 4,51729 / 1 hour |
Nvidia Tesla T4 | US$ 0,525 / 1 hour |
Nvidia Tesla V100 | US$ 3,72 / 1 hour |
Nvidia Tesla P100 | US$ 2,19 / 1 hour |
Discos
Tipo de máquina | Preço (US$) |
---|---|
Espaço provisionado extremo do Hyperdisk | US$ 0,000205479 / 1 gibibyte hour |
Espaço provisionado balanceado | US$ 0,000164384 / 1 gibibyte hour |
Espaço provisionado extremo | US$ 0,000205479 / 1 gibibyte hour |
Espaço provisionado em SSD | US$ 0,000279452 / 1 gibibyte hour |
Espaço provisionado padrão | US$ 0,000065753 / 1 gibibyte hour |
Sua instância do Vertex AI Workbench gera cobranças da seguinte forma:
Notebooks gerenciados
O preço é composto pelos recursos de computação e armazenamento que você usa, as taxas de gerenciamento das instâncias do Vertex AI Workbench e eventuais recursos adicionais do Google Cloud que você adota. Consulte as seções a seguir para mais detalhes.
Recursos de computação e armazenamento
Os recursos de computação e armazenamento são cobrados usando a mesma taxa que você atualmente paga pelo Compute Engine e o Cloud Storage.
Taxas de administração
Existem taxas de administração do Vertex AI Workbench além do uso da infraestrutura, capturadas nas tabelas abaixo.
SKU | Preço (US$) |
---|---|
vCPU | US$ 0,05 por vCPU |
T4 e P4 (GPU padrão) | US$ 0,35 por GPU |
GPU P100, V100, L4 e A100 (GPU Premium) | US$ 2,48 por GPU |
Notebooks gerenciados pelo usuário
O preço é composto pelos recursos de computação e armazenamento que você usa, as taxas de gerenciamento das instâncias do Vertex AI Workbench e eventuais recursos adicionais do Google Cloud que você adota. Consulte as seções a seguir para mais detalhes.
Recursos de computação e armazenamento
Os recursos de computação e armazenamento são cobrados usando a mesma taxa que você atualmente paga pelo Compute Engine e o Cloud Storage.
Taxas de administração
Existem taxas de administração do Vertex AI Workbench além do uso da infraestrutura, capturadas nas tabelas abaixo.
SKU | Preço (US$) |
---|---|
vCPU | US$ 0,005 por vCPU |
T4 e P4 (GPU padrão) | US$ 0,035 por GPU |
GPU P100, V100 e A100 (GPU Premium) | US$ 0,25 por GPU |
Recursos adicionais do Google Cloud
Além dos custos mencionados anteriormente, você também paga por eventuais recursos do Google Cloud que usar. Exemplo:
Para informações sobre preços do Colab Enterprise, consulte Preços do Colab Enterprise.
No caso dos Deep Learning Containers, Deep Learning VM Images e AI Platform Pipelines, o preço é calculado com base nos recursos de computação e de armazenamento que você usa. Esses recursos são cobrados usando a mesma taxa que você paga atualmente pelo Compute Engine e pelo Cloud Storage.
Além dos custos de computação e armazenamento, você também paga pelos recursos do Google Cloud que usar. Exemplo:
Com a Vertex AI, é possível solicitar a rotulagem humana de uma coleção de dados que você planeja usar para treinar um modelo de machine learning personalizado. Os preços do serviço são calculados com base no tipo de tarefa de rotulagem.
Na tabela abaixo, veja o preço por 1.000 unidades por rotulador humano com base na unidade listada para cada objetivo. Os preços do nível 1 se aplicam às primeiras 50 mil unidades por mês em cada projeto do Google Cloud. Os do nível 2 se aplicam às 950 mil unidades seguintes por mês no projeto, com um máximo de um milhão de unidades. Entre em contato conosco para saber os preços acima de um milhão de unidades por mês.
Tipo de dado | Objetivo | Unidade | Preço do nível 1 (USD) | Preço do nível 2 (USD) |
---|---|---|---|---|
Imagem | Classificação | Imagem | US$ 35 | US$ 25 |
Caixa delimitadora | Caixa delimitadora | US$ 63 | US$ 49 | |
Segmentação | Segmento | US$ 870 | US$ 850 | |
Caixa rotacionada | Caixa delimitadora | US$ 86 | US$ 60 | |
Polígono/linha poligonal | Polígono/linha poligonal | US$ 257 | US$ 180 | |
Vídeo | Classificação | Vídeo de 5 segundos | US$ 86 | US$ 60 |
Rastreamento de objetos | Caixa delimitadora | US$ 86 | US$ 60 | |
Reconhecimento de ação | Evento em vídeo de 30 segundos | US$ 214 | US$ 150 | |
Texto | Classificação | 50 palavras | US$ 129 | US$ 90 |
Sentimento | 50 palavras | US$ 200 | US$ 140 | |
Extração de entidades | Entidade | US$ 86 | US$ 60 | |
Aprendizagem ativa | Todos | Item de dados | US$ 80 | US$ 56 |
Rotulador personalizado | Todos | Item de dados | US$ 80 | US$ 56 |
Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida da Vertex AI. Esse armazenamento está sujeito à política de preços do Cloud Storage.
O uso obrigatório do Cloud Storage inclui:
As operações de gerenciamento de recursos fornecidas pelo AI Platform estão disponíveis sem custo financeiro. A política de cotas do AI Platform limita algumas dessas operações.
Recurso | Operações gratuitas |
---|---|
modelos | create, get, list, delete |
versões | create, get, list, delete, setDefault |
empregos | get, list, cancel |
operações | get, list, cancel, delete |
Se você armazenar imagens para serem analisadas no Cloud Storage ou usar outros recursos do Google Cloud com a Vertex AI, então também receberá cobrança pelo uso desses serviços.
Para ver seu status atual de faturamento no console do Google Cloud, inclusive o uso e a fatura atual, consulte a página "Faturamento". Para mais detalhes sobre o gerenciamento da sua conta, consulte a documentação do Cloud Billing ou o suporte de faturamento e pagamentos.