Preços da Vertex AI

Os custos da Vertex AI continuam iguais aos dos produtos que ela substitui. Por exemplo, o custo do treinamento de um modelo de classificação de imagem do AutoML é o mesmo, seja para treinamento com a IA Vertex ou com o AutoML Vision.

Os preços são indicados em dólares americanos (US$). Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Cloud Platform.

Preços da Vertex AI em comparação com os preços do AI Platform legado

Os preços das operações da Vertex AI e operações "legadas" equivalentes são os mesmos para cada operação. Por exemplo, se você treina um modelo usando o AI Platform Training, o custo é o mesmo para treinar um modelo usando o Vertex AI Training.

Se você estiver usando produtos legados da AI Platform, o faturamento poderá ser expresso em "unidades de treinamento".

Modelos Vertex AutoML

Para modelos do Vertex AutoML, você paga por três atividades principais:

  • Como treinar o modelo
  • Como implantar o modelo em um endpoint
  • Como usar o modelo para fazer previsões

A IA Vertex usa configurações de máquina predefinidas para modelos do Vertex AutoML, e a taxa por hora dessas atividades reflete o uso de recursos.

O tempo necessário para treinar o modelo depende do tamanho e da complexidade dos dados de treinamento. É preciso implantar os modelos para que possam fornecer previsões ou explicações on-line.

Você paga por cada modelo implantado em um endpoint, mesmo que não seja feita nenhuma previsão. É preciso cancelar a implantação do modelo para suspender demais cobranças. Modelos que não foram implantados ou que falharam na implantação não são cobrados.

Selecione um tipo de modelo abaixo para ver informações de preço.

Dados de imagem

Operação Preço por hora do nó (classificação) Preço por hora do nó (detecção de objetos)
Treinamento US$ 3,465 US$ 3,465
Treinamento (no dispositivo) US$ 18,0 US$ 18,0
Implantação e previsão on-line US$ 1,375 US$ 2,002
Previsão em lote US$ 2,222 US$ 2,222

Dados de vídeo

Operação Preço por hora do nó
Treinamento US$ 3,234
Previsões US$ 0,462

Dados em tabela

Operação Preço por hora de uso do nó para classificação/regressão Preço para estimativas
Treinamento US$ 21,252 US$ 21,252
Previsão Mesmo preço das previsões para modelos treinados personalizados US$ 1,00 por 1.000 previsões (somente em lote)
Implantação legada US$ 0,004055 n/a
Previsão e explicação on-line US$ 0,231 n/a
Previsão de lote legado US$ 1,276 n/a

Dados de texto

Operação Preço
Upload de dados legado (apenas PDF)

Primeiras 1.000 páginas gratuitas por mês

US$ 0,60 por 1.000 páginas

US$ 0,60 por 1.000 páginas acima de 5.000.000

Treinamento US$ 3,30 por hora
Implantação US$ 0,21 por hora
Previsão

US$ 5 a cada grupo de 1.000 registros de texto

US$ 25,00 por 1.000 páginas de documentos, como arquivos PDF (somente legado)

Os preços das solicitações de previsão de texto do Vertex AutoML são calculados com base no número de registros de texto enviados para análise. Um registro de texto é um texto simples de até 1.000 caracteres Unicode (incluindo espaço em branco e qualquer marcação como tags HTML ou XML).

Se o texto fornecido em uma solicitação de previsão contiver mais de 1.000 caracteres, será contabilizado um registro de texto para cada 1.000 caracteres. Por exemplo, se você enviar três solicitações com 800, 1.500 e 600 caracteres, respectivamente, serão cobrados quatro registros de texto: um para a primeira solicitação (800), dois para a segunda solicitação (1.500) e outra para a terceira (600).

Cobranças de previsão para Vertex Explainable AI

A computação associada à Vertex Explainable AI é cobrada da mesma forma que a previsão. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais. Assim, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de previsão.

Modelos treinados e personalizados

Treinamento

Veja nas tabelas abaixo o preço por hora aproximado de várias configurações de treinamento. É possível escolher uma configuração personalizada de tipos de máquinas selecionados. Para calcular os preços, calcule os custos das máquinas virtuais que você usa.

Se você usa tipos de máquina do Compute Engine e anexa aceleradores, o custo deles será separado. Para calcular esse custo, multiplique os preços da tabela abaixo por quantas horas de máquina de cada tipo de acelerador você usa.

Tipos de máquina

Américas

Europa

Ásia-Pacífico

Aceleradores

Américas

Europa

Ásia-Pacífico

Discos

Américas

Europa

Ásia-Pacífico

Você receberá cobrança pelo treinamento dos seus modelos:

  • em incrementos de um minuto;
  • por no mínimo 10 minutos por job de treinamento;
  • a partir do momento em que os recursos são provisionados para um job até que ele seja concluído.

Níveis de escalonamento para configurações predefinidas (AI Platform Training)

Controle o tipo de cluster de processamento a ser usado ao treinar seu modelo. A maneira mais simples é escolher uma das configurações predefinidas, chamadas níveis de escalonamento. Saiba mais sobre os níveis de escalonamento.

Tipos de máquinas para configurações personalizadas

Se você usa o Vertex AI ou seleciona CUSTOM como seu nível de escalonamento no AI Platform Training, tem controle sobre o número e o tipo de máquinas virtuais que serão usadas para o mestre, worker e parâmetro do cluster. servidores. Leia mais sobre tipos de máquinas para a Vertex AI e tipos de máquinas para o AI Platform Training.

O custo do treinamento com um cluster de processamento personalizado será a soma de todas as máquinas que você especificar. Haverá cobrança pelo tempo total do job, não pelo tempo de processamento ativo de máquinas individuais.

Previsão e explicação

Nesta tabela, mostramos os preços de previsões em lote e on-line e explicações por hora de uso do nó. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta executando seu job de previsão ou aguardando em estado de prontidão para tratar as solicitações de explicação ou de previsão..

Américas

Previsão
Previsões e explicações
Tipos de máquinas: preço por hora de uso do nó
n1-standard-2 Aproximações:
us-east4 US$ 0,123
northamerica-northeast1 US$ 0,1203
Outras regiões das Américas US$ 0,1093
n1-standard-4 Aproximações:
us-east4 US$ 0,2461
northamerica-northeast1 US$ 0,2405
Outras regiões das Américas US$ 0,2186
n1-standard-8 Aproximações:
us-east4 US$ 0,4922
northamerica-northeast1 US$ 0,4811
Outras regiões das Américas US$ 0,4372
n1-standard-16 Aproximações:
us-east4 US$ 0,9843
northamerica-northeast1 US$ 0,9622
Outras regiões das Américas US$ 0,8744
n1-standard-32 Aproximações:
us-east4 US$ 1,9687
northamerica-northeast1 US$ 1,9243
Outras regiões das Américas US$ 1,7488
n1-highmem-2 Aproximações:
us-east4 US$ 0,1532
northamerica-northeast1 US$ 0,1498
Outras regiões das Américas US$ 0,1361
n1-highmem-4 Aproximações:
us-east4 US$ 0,3064
northamerica-northeast1 US$ 0,2995
Outras regiões das Américas US$ 0,2723
n1-highmem-8 Aproximações:
us-east4 US$ 0,6129
northamerica-northeast1 US$ 0,5991
Outras regiões das Américas US$ 0,5445
n1-highmem-16 Aproximações:
us-east4 US$ 1,2257
northamerica-northeast1 US$ 1,1982
Outras regiões das Américas US$ 1,089
n1-highmem-32 Aproximações:
us-east4 US$ 2,4515
northamerica-northeast1 US$ 2,3963
Outras regiões das Américas US$ 2,178
n1-highcpu-2 Aproximações:
us-east4 US$ 0,0918
northamerica-northeast1 US$ 0,0897
Outras regiões das Américas US$ 0,0815
n1-highcpu-4 Aproximações:
us-east4 US$ 0,1835
northamerica-northeast1 US$ 0,1794
Outras regiões das Américas US$ 0,163
n1-highcpu-8 Aproximações:
us-east4 US$ 0,3671
northamerica-northeast1 US$ 0,3588
Outras regiões das Américas US$ 0,326
n1-highcpu-16 Aproximações:
us-east4 US$ 0,7341
northamerica-northeast1 US$ 0,7176
Outras regiões das Américas US$ 0,6519
n1-highcpu-32 Aproximações:
us-east4 US$ 1,4683
northamerica-northeast1 US$ 1,4352
Outras regiões das Américas US$ 1,3039

Europa

Previsão
Previsões e explicações
Tipos de máquinas: preço por hora de uso do nó
n1-standard-2 Aproximações:
europe-west2 US$ 0,1408
Outras regiões da Europa US$ 0,1265
n1-standard-4 Aproximações:
europe-west2 US$ 0,2815
Outras regiões da Europa US$ 0,2531
n1-standard-8 Aproximações:
europe-west2 US$ 0,563
Outras regiões da Europa US$ 0,5061
n1-standard-16 Aproximações:
europe-west2 US$ 1,126
Outras regiões da Europa US$ 1,0123
n1-standard-32 Aproximações:
europe-west2 US$ 2,2521
Outras regiões da Europa US$ 2,0245
n1-highmem-2 Aproximações:
europe-west2 US$ 0,1753
Outras regiões da Europa US$ 0,1575
n1-highmem-4 Aproximações:
europe-west2 US$ 0,3506
Outras regiões da Europa US$ 0,3151
n1-highmem-8 Aproximações:
europe-west2 US$ 0,7011
Outras regiões da Europa US$ 0,6302
n1-highmem-16 Aproximações:
europe-west2 US$ 1,4022
Outras regiões da Europa US$ 1,2603
n1-highmem-32 Aproximações:
europe-west2 US$ 2,8044
Outras regiões da Europa US$ 2,5206
n1-highcpu-2 Aproximações:
europe-west2 US$ 0,105
Outras regiões da Europa US$ 0,0944
n1-highcpu-4 Aproximações:
europe-west2 US$ 0,21
Outras regiões da Europa US$ 0,1888
n1-highcpu-8 Aproximações:
europe-west2 US$ 0,4199
Outras regiões da Europa US$ 0,3776
n1-highcpu-16 Aproximações:
europe-west2 US$ 0,8398
Outras regiões da Europa US$ 0,7552
n1-highcpu-32 Aproximações:
europe-west2 US$ 1,6796
Outras regiões da Europa US$ 1,5104

Ásia-Pacífico

Previsão
Previsões e explicações
Tipos de máquinas: preço por hora de uso do nó
n1-standard-2 Aproximações:
asia-northeast1 US$ 0,1402
asia-southeast1 US$ 0,1348
australia-southeast1 US$ 0,155
Outras regiões da Ásia-Pacífico US$ 0,1265
n1-standard-4 Aproximações:
asia-northeast1 US$ 0,2803
asia-southeast1 US$ 0,2695
australia-southeast1 US$ 0,31
Outras regiões da Ásia-Pacífico US$ 0,2531
n1-standard-8 Aproximações:
asia-northeast1 US$ 0,5606
asia-southeast1 US$ 0,5391
australia-southeast1 US$ 0,6201
Outras regiões da Ásia-Pacífico US$ 0,5061
n1-standard-16 Aproximações:
asia-northeast1 US$ 1,1213
asia-southeast1 US$ 1,0782
australia-southeast1 US$ 1,2401
Outras regiões da Ásia-Pacífico US$ 1,0123
n1-standard-32 Aproximações:
asia-northeast1 US$ 2,2426
asia-southeast1 US$ 2,1564
australia-southeast1 US$ 2,4802
Outras regiões da Ásia-Pacífico US$ 2,0245
n1-highmem-2 Aproximações:
asia-northeast1 US$ 0,1744
asia-southeast1 US$ 0,1678
australia-southeast1 US$ 0,193
Outras regiões da Ásia-Pacífico US$ 0,1575
n1-highmem-4 Aproximações:
asia-northeast1 US$ 0,3489
asia-southeast1 US$ 0,3357
australia-southeast1 US$ 0,3861
Outras regiões da Ásia-Pacífico US$ 0,3151
n1-highmem-8 Aproximações:
asia-northeast1 US$ 0,6977
asia-southeast1 US$ 0,6713
australia-southeast1 US$ 0,7721
Outras regiões da Ásia-Pacífico US$ 0,6302
n1-highmem-16 Aproximações:
asia-northeast1 US$ 1,3955
asia-southeast1 US$ 1,3426
australia-southeast1 US$ 1,5443
Outras regiões da Ásia-Pacífico US$ 1,2603
n1-highmem-32 Aproximações:
asia-northeast1 US$ 2,791
asia-southeast1 US$ 2,6852
australia-southeast1 US$ 3,0885
Outras regiões da Ásia-Pacífico US$ 2,5206
n1-highcpu-2 Aproximações:
asia-northeast1 US$ 0,1046
asia-southeast1 US$ 0,1005
australia-southeast1 US$ 0,1156
Outras regiões da Ásia-Pacífico US$ 0,0944
n1-highcpu-4 Aproximações:
asia-northeast1 US$ 0,2093
asia-southeast1 US$ 0,201
australia-southeast1 US$ 0,2312
Outras regiões da Ásia-Pacífico US$ 0,1888
n1-highcpu-8 Aproximações:
asia-northeast1 US$ 0,4186
asia-southeast1 US$ 0,4021
australia-southeast1 US$ 0,4624
Outras regiões da Ásia-Pacífico US$ 0,3776
n1-highcpu-16 Aproximações:
asia-northeast1 US$ 0,8371
asia-southeast1 US$ 0,8041
australia-southeast1 US$ 0,9249
Outras regiões da Ásia-Pacífico US$ 0,7552
n1-highcpu-32 Aproximações:
asia-northeast1 US$ 1,6742
asia-southeast1 US$ 1,6082
australia-southeast1 US$ 1,8498
Outras regiões da Ásia-Pacífico US$ 1,5104

Cada tipo de máquina é cobrado como duas SKUs separadas na fatura do Google Cloud:

  • Custo de vCPU, calculado por vCPU/hora
  • Custo de RAM, calculado por GB/hora

Os preços dos tipos de máquina na tabela anterior se aproximam do custo por hora total de cada nó de previsão de uma versão de modelo que usa esse tipo de máquina. Por exemplo, para um tipo de máquina n1-highcpu-32 que inclua 32 vCPUs e 28,8 GB de RAM, o preço/hora por nó é igual a 32 vCPU/hora + 28,8 GB/hora.

Os preços na tabela anterior são fornecidos para ajudar você a estimar os custos de previsão on-line. A tabela a seguir mostra os preços de vCPU e RAM dos tipos de máquina de previsão, que refletem com mais precisão as SKUs que serão cobradas:

Américas

SKUs do tipo de máquina do Prediction
vCPU
Norte da Virgínia (us-east4) US$ 0,04094575 por hora de vCPU
Montréal (northamerica-northeast1) US$ 0,0400223 por hora de vCPU
Outras regiões das Américas US$ 0,03635495 por hora de vCPU
RAM
Norte da Virgínia (us-east4) US$ 0,00548665 por GB/hora
Montréal (northamerica-northeast1) US$ 0,0053636 por GB/hora
Outras regiões das Américas US$ 0,0048783 por GB/hora

Europa

SKUs do tipo de máquina do Prediction
vCPU
Londres (europe-west2) US$ 0,0468395 por hora de vCPU
Outras regiões da Europa US$ 0,0421268 por hora de vCPU
RAM
Londres (europe-west2) US$ 0,0062767 por GB/hora
Outras regiões da Europa US$ 0,004902 por GB/hora

Ásia-Pacífico

SKUs do tipo de máquina do Prediction
vCPU
Tóquio (asia-northeast1) US$ 0,0467107 por hora de vCPU
Singapura (asia-southeast1) US$ 0,04484885 por hora de vCPU
Sydney (australia-southeast1) US$ 0,0515844 por hora de vCPU
Outras regiões da Ásia-Pacífico US$ 0,0421268 por hora de vCPU
RAM
Tóquio (asia-northeast1) US$0,00623185 por GB/hora
Singapura (asia-southeast1) US$ 0,0060099 por GB/hora
Sydney (australia-southeast1) US$ 0,006912651 por GB/hora
Outras regiões da Ásia-Pacífico US$ 0,004902 por GB/hora

Opcionalmente, use aceleradores de GPU para previsão. As GPUs geram outras cobranças, separadas daquelas descritas na tabela anterior. A tabela a seguir descreve os preços de cada tipo de GPU:

Américas

Aceleradores: preço por hora
NVIDIA_TESLA_K80
Iowa (us-central1) US$ 0,5175
Carolina do Sul (us-east1) US$ 0,5175
NVIDIA_TESLA_P4
Iowa (us-central1) US$ 0,6900
Norte da Virgínia (us-east4) US$ 0,6900
Montréal (northamerica-northeast1) US$ 0,7475
NVIDIA_TESLA_P100
Oregon (us-west1) US$ 1,6790
Iowa (us-central1) US$ 1,6790
Carolina do Sul (us-east1) US$ 1,6790
NVIDIA_TESLA_T4
Oregon (us-west1) US$ 0,4025
Iowa (us-central1) US$ 0,4025
Carolina do Sul (us-east1) US$ 0,4025
NVIDIA_TESLA_V100
Oregon (us-west1) US$ 2,8520
Iowa (us-central1) US$ 2,8520

Europa

Aceleradores: preço por hora
NVIDIA_TESLA_K80
Bélgica (europe-west1) US$ 0,5635
NVIDIA_TESLA_P4
Países Baixos (europe-west4) US$ 0,7475
NVIDIA_TESLA_P100
Bélgica (europe-west1) US$ 1,8400
NVIDIA_TESLA_T4
Londres (europe-west2) US$ 0,4715
Países Baixos (europe-west4) US$ 0,4370
NVIDIA_TESLA_V100
Países Baixos (europe-west4) US$ 2,9325

Ásia-Pacífico

Aceleradores: preço por hora
NVIDIA_TESLA_K80
Taiwan (asia-east1) US$ 0,5635
NVIDIA_TESLA_P4
Singapura (asia-southeast1) US$ 0,7475
Sydney (australia-southeast1) US$ 0,7475
NVIDIA_TESLA_P100
Taiwan (asia-east1) US$ 1,8400
NVIDIA_TESLA_T4
Tóquio (asia-northeast1) US$ 0,4255
Singapura (asia-southeast1) US$ 0,4255
Seul (asia-northeast3) US$ 0,4485
NVIDIA_TESLA_V100 Indisponível

Os preços são definidos por GPU. Portanto, se você usar várias GPUs por nó de previsão (ou se fizer escalonamento da versão para utilizar diversos nós), os custos serão escalonados proporcionalmente.

O AI Platform Prediction fornece previsões do seu modelo executando várias máquinas virtuais ("nós"). Por padrão, a IA Vertex escalona automaticamente o número de nós em execução a qualquer momento. Para previsão on-line, o número de nós é escalonado para atender à demanda. Cada nó pode responder a várias solicitações de previsão. Para previsão em lote, o número de nós é escalonado para reduzir o tempo total necessário para executar um job. Personalize a maneira como os nós de previsão são escalonados.

Você é cobrado pelo tempo que cada nó é executado para seu modelo, incluindo:

  • Quando o nó está processando um job de previsão em lote.
  • Quando o nó está processando uma solicitação de previsão on-line.
  • Quando o nó está em um estado pronto para cumprir as previsões on-line.

O custo de um nó em execução por uma hora é uma hora do nó. A tabela de preços de previsão descreve o preço de uma hora de uso do nó, que varia entre as regiões e entre a previsão on-line e a previsão em lote.

As horas de uso do nó podem ser consumidas em incrementos fracionários. Por exemplo, um nó em execução por 30 minutos custa 0,5 horas por uso do nó.

Cálculo de custo dos tipos de máquina legados (MLS1) e previsão em lote

  • O tempo de execução de um nó é medido em incrementos de um minuto, arredondado para o minuto mais próximo. Por exemplo, se um nó for executado por 20,1 minutos, calcule seu custo como se ele tivesse sido executado por 21 minutos.
  • O tempo de execução para nós que são executados por menos de 10 minutos é arredondado para 10 minutos. Por exemplo, se um nó for executado por apenas 3 minutos, calcule o custo dele como se ele tivesse sido executado por 10 minutos.

Cálculo de custo dos tipos de máquina do Compute Engine (N1)

  • O tempo de execução de um nó é cobrado em incrementos de 30 segundos. Isso significa que, a cada 30 segundos, seu projeto é cobrado por 30 segundos de uso de qualquer recurso, como vCPU, RAM ou GPU, que o nó esteja usando no momento.

Mais sobre escalonamento automático de nós de previsão

Previsão on-line Previsão em lote
A prioridade do escalonamento é reduzir a latência de solicitações individuais. O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após atender a uma solicitação. A prioridade do escalonamento é reduzir o tempo total decorrido do job.
O escalonamento afeta suas taxas totais a cada mês: quanto mais numerosas e frequentes forem suas solicitações, mais nós serão usados. O escalonamento provavelmente não terá muito efeito sobre o preço do seu job, ainda que haja alguns gastos indiretos envolvidos na criação de um novo nó.

Escolha deixar o serviço ser escalonado em resposta ao tráfego (escalonamento automático) ou especifique vários nós para execução constante para evitar latência (escalonamento manual).

  • Se você escolher o escalonamento automático, o número de nós será escalonado automaticamente e pode ser reduzido a zero em períodos sem tráfego.
  • Se escolher o escalonamento manual, você especifica que alguns nós continuem em execução sempre. Você é cobrado por todo o tempo em que eles estão em execução, começando no momento da implantação e continuando até você excluir a versão do modelo.
Influencie o escalonamento com a definição de um número máximo de nós a ser usado para um job de previsão em lote e com a definição do número de nós que continuarão em execução em um modelo quando ele for implantado.

Taxa mínima de 10 minutos

Lembre-se de que, se um nó for executado por menos de 10 minutos, você será cobrado como se ele tivesse sido executado por 10 minutos. Por exemplo, suponha que você use o escalonamento automático. Durante um período sem tráfego, nenhum nó está em uso. Se você receber uma única solicitação de previsão on-line, um nó será escalonado para atender à solicitação. Depois de atender à solicitação, o nó continuará em execução por alguns minutos em estado de prontidão. Em seguida, ele para. Mesmo que o nó tenha sido executado por menos de 10 minutos, você será cobrado por 10 minutos de nó (0,17 hora de uso do nó) pelo trabalho dele.

Como alternativa, se um único nó for escalonado e atender a muitas solicitações de previsão on-line em um período de 10 minutos antes do encerramento, você também será cobrado por 10 minutos de nó.

É possível usar o escalonamento manual para controlar exatamente quantos nós são executados durante um determinado período de tempo. No entanto, se um nó for executado por menos de 10 minutos, você ainda será cobrado como se ele tivesse sido executado por 10 minutos.

Saiba mais sobre alocação e escalonamento de nós.

Exemplo de um cálculo de previsão

Uma empresa imobiliária em uma região das Américas realiza uma previsão semanal de valores de habitação nas áreas em que atende. Em um mês, realiza previsões para quatro semanas em lotes de 3920, 4277, 3849 e 3961. Os jobs são limitados a um nó, e cada instância leva uma média de 0.72 segundos de processamento.

Primeiro, calcule o período de tempo que cada job foi executado:

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

Cada job foi executado por mais de dez minutos, portanto a cobrança é feita por cada minuto de processamento:

($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725
($0.0909886 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964

A cobrança total do mês é de US$ 0,26.

Este exemplo considera que os jobs foram executados em um único nó e demoraram um período consistente de tempo por instância de entrada. No uso real, certifique-se de contabilizar vários nós e usar o tempo real que cada nó gasta em execução para os seus cálculos.

Cobranças pela Vertex Explainable AI

A Vertex Explainable AI vem sem cobrança extra para preços de previsão. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais. Assim, o uso pesado do Vertex Explainable AI com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças de previsão.

Pipelines de Vertex AI

O Vertex AI Pipelines tem uma taxa de execução de US$ 0,03 por pipeline. Não há cobranças pela taxa de execução durante o lançamento. Você também paga pelos recursos do Google Cloud usados com o Vertex AI Pipelines, como os componentes do Compute Engine consumidos por pipelines. O preço deles é igual ao do treinamento da Vertex AI. Por fim, você é responsável pelo custo de todos os serviços (como o Dataflow) chamados pelo seu pipeline.

Feature Store da Vertex AI

Os preços do Feature Store da Vertex AI dependem da quantidade de dados de recursos armazenados on-line e off-line, bem como da disponibilidade para exibição on-line. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta exibindo dados do recurso ou aguardando em estado de prontidão para lidar com as solicitações de dados do recurso.

Operação Preço
Armazenamento on-line US$ 0,25 por GB/mês
Armazenamento off-line US$ 0,023 por GB/mês
Exibição on-line US$ 0,94 por nó/hora
Exportação em lote US$ 0,005 por GB

Vertex ML Metadata

O armazenamento de metadados é medido em gigabytes binários (GiB), sendo que 1 GiB é igual a 1.073.741.824 bytes. Essa unidade de medida também é conhecida como um gibibyte.

O Vertex ML Metadata cobra US $10 por gibibyte (GiB) por mês pelo armazenamento de metadados.

Tensorboard da Vertex AI

O TensorBoard da Vertex AI é gratuito durante o pré-lançamento. Também é preciso pagar pelos recursos do Google Cloud usados com o TensorBoard da Vertex AI, como os registros do produto armazenados no Cloud Storage.

Vertex AI Vizier

O Vertex AI Vizier é um serviço de otimização de caixa preta dentro do Vertex AI. O modelo de preços da Vertex AI Vizier consiste no seguinte:

  • Não há cobranças para testes que usam RANDOM_SEARCH e GRID_SEARCH. Saiba mais sobre os algoritmos de pesquisa.
  • Os primeiros 100 testes da Vertex AI Vizier por mês estão disponíveis gratuitamente. Os testes com RANDOM_SEARCH e GRID_SEARCH não contam para esse total.
  • Após os 100 testes da Vertex AI Vizier, os testes subsequentes durante o mesmo mês serão cobrados a US$ 1,00 por teste (testes que usam RANDOM_SEARCH ou GRID_SEARCH não geram cobrança).

Mecanismo de correspondência Vertex AI

O preço do serviço aproximadamente o vizinho mais próximo do Vertex AI Match Engine consiste em:

  • hora de uso do nó para cada VM usada na hospedagem de um índice implantado;
  • criação e atualização de índices.

Veja nas tabelas a seguir os preços da veiculação de índices em cada região em que o mecanismo correspondente está disponível.

Américas

Tipo de máquina - Região - Preço por hora de uso do nó
n1-standard-16
us-central1 US$ 1,0640
us-east1 US$ 1,0640
us-east4 US$ 1,1984
us-west1 US$ 1,0640
n1-standard-32
us-central1 US$ 2,1280
us-east1 US$ 2,1280
us-east4 US$ 2,3968
us-west1 US$ 2,1280

Europa

Tipo de máquina - Região - Preço por hora de uso do nó
n1-standard-16
europe-west1 US$ 1,1715
n1-standard-32
europe-west1 US$ 2,3430

Ásia-Pacífico

Tipo de máquina - Região - Preço por hora de uso do nó
n1-standard-16
asia-southeast1 US$ 1,3126
n1-standard-32
asia-southeast1 US$ 2,6252

Os dados processados durante a criação e atualização dos índices são medidos em gigabytes (GiB) binários, em que 1 GiB é 1.073.741.824 bytes. Essa unidade de medida também é conhecida como gibibyte.

Com disponibilidade geral (GA), o Vertex AI Matching Engine cobra US$ 3 por gibibyte (GiB) de dados processados em todas as regiões.

Monitoramento de modelos da Vertex AI

Com a Vertex AI, é possível monitorar a eficácia contínua do seu modelo depois de implantá-lo na produção. Para mais informações, consulte Introdução ao Vertex AI Model Monitoring.

Ao usar o Vertex AI Model Monitoring, você recebe cobranças da seguinte forma:

  • US$ 3,50 por GB para todos os dados analisados, incluindo os dados de treinamento fornecidos e os dados de previsão registrados em uma tabela do BigQuery
  • Cobranças por outros produtos do Google Cloud que você usa com o Model Monitoring, como o armazenamento do BigQuery ou o Batch Explain, quando o monitoramento de atribuição está ativado

O Vertex AI Model Monitoring é compatível com as seguintes regiões: us-central1, europe-west4, asia-east1 e asia-southeast1 pelo mesmo preço.

Os tamanhos dos dados são medidos depois de serem convertidos para o formato TfRecord.

Conjuntos de dados de treinamento geram uma cobrança única quando você configura um job do Vertex AI Model Monitoring.

Os conjuntos de dados de previsão são registros coletados do serviço de previsão on-line. Conforme as solicitações de previsão chegam durante janelas de tempo diferentes, os dados de cada janela são coletados e a soma das informações analisadas em cada janela de previsão é usada para calcular a cobrança.

Exemplo: um cientista de dados executa o monitoramento de modelo no tráfego de previsão que pertence ao modelo.

  • O modelo é treinado com um conjunto de dados do BigQuery. O tamanho dos dados após a conversão para TfRecord é de 1,5 GB.
  • Os dados de previsão registrados entre 13h e 14h são de 0,1 GB, entre 15h e 16h é de 0,2 GB.
  • O preço total para configurar o job de monitoramento de modelo é:

    (1.5 GB * $3.50) + ((0.1 GB + 0.2 GB) * $3.50) = $6.30

Vertex AI Workbench, Deep Learning Containers, VM de aprendizado profundo e pipelines do AI Platform

No caso dos Deep Learning Containers, Deep Learning VM Images e AI Platform Pipelines, o preço é calculado com base nos recursos de computação que você usa. Esses recursos serão cobrados com a mesma taxa que você paga atualmente pelo Compute Engine e Cloud Storage.

Para o Vertex AI Workbench, há uma taxa de gerenciamento além do uso da infraestrutura, capturada nas tabelas abaixo.

Selecione notebooks gerenciados ou notebooks gerenciados pelo usuário para informações sobre preços.

Notebooks gerenciados

Não há taxas de gerenciamento para notebooks gerenciados enquanto estiver em Visualização.

Notebooks gerenciados por usuários

SKU Taxa de gerenciamento por núcleo/hora
vCPU US$ 0,005
GPU T4, K80 e P4 US$ 0,035
GPU P100, V100 e A100 US$ 0,25

Além dos custos de computação, você também paga por todos os recursos do Google Cloud usados. Exemplo:

  • Serviços de análise dos dados: os custos do BigQuery são gerados ao emitir consultas SQL em um notebook. Consulte os Preços do BigQuery.

  • Chaves de criptografia gerenciadas pelo cliente: você está sujeito a cobranças pelo uso. Sempre que os notebooks gerenciados ou a instância de notebooks gerenciados pelo usuário usam uma chave do Cloud Key Management Service, a operação será cobrada de acordo com a taxa das operações de chave do Cloud KMS. Consulte Preços do Cloud Key Management Service).

Rotulagem de dados

Com a IA Vertex, é possível solicitar a rotulagem humana de uma coleção de dados que você planeja usar para treinar um modelo de machine learning personalizado. Os preços do serviço são calculados com base no tipo de tarefa de rotulagem.

  • Para tarefas de rotulagem regular, os preços são determinados pelo número de unidades de anotação.
    • Em uma tarefa de classificação de imagem, as unidades são determinadas com base no número de imagens e na quantidade de rotuladores humanos. Por exemplo, uma imagem com três rotuladores humanos será contabilizada como de 1 * 3 = 3 unidades. O preço da classificação de rótulo único e vários rótulos é o mesmo.
    • Em uma tarefa de caixa delimitadora de imagem, as unidades são determinadas pelo número de caixas delimitadoras identificadas nas imagens e pelo número de rotuladores humanos. Por exemplo, uma imagem com duas caixas delimitadoras e três rotuladores humanos será contabilizada como 2 * 3 = 6 unidades. Imagens sem caixas delimitadoras não geram cobrança.
    • Em uma segmentação de imagem/caixa rotacionada/linha poligonal/tarefa poligonal, as unidades são determinadas da mesma forma que uma tarefa de caixa delimitadora de imagem.
    • Em uma tarefa de classificação de vídeo, as unidades são determinadas pela duração do vídeo (cinco segundos equivalem a uma unidade de preço) e pelo número de rotuladores humanos. Por exemplo, um vídeo de 25 segundos com três rotuladores humanos é contabilizado como 25 / 5 * 3 = 15 unidades. O preço da classificação de rótulo único e vários rótulos é o mesmo.
    • Em uma tarefa de detecção de objetos em vídeo, a unidade é determinada pelo número de objetos identificados no vídeo e pelo número de rotuladores humanos. Por exemplo, um vídeo com dois objetos e três rotuladores humanos é contabilizado como 2 * 3 = 6 unidades. Vídeos sem objetos não geram cobrança.
    • Em uma tarefa de reconhecimento de ação em vídeo, as unidades são determinadas da mesma maneira que em uma tarefa de rastreamento de objetos de vídeo.
    • Em uma tarefa de classificação de texto, as unidades são determinadas pelo tamanho do texto (cada 50 palavras equivalem a uma unidade de preço) e pelo número de rotuladores humanos. Por exemplo, um trecho de texto com 100 palavras e três rotuladores humanos é contabilizado como 100 / 50 * 3 = 6 unidades. O preço da classificação de rótulo único e vários rótulos é o mesmo.
    • Em uma tarefa de sentimento de texto, as unidades são determinadas da mesma maneira que uma tarefa de classificação de texto.
    • Em uma tarefa de extração de entidade de texto, as unidades são determinadas por comprimento do texto (cada 50 palavras equivale a uma unidade de preço), o número de entidades identificadas e o número de rotuladores humanos. Por exemplo, um trecho de texto com 100 palavras, duas entidades identificadas e três rotuladores humanos é contabilizado como 100 / 50 * 2 * 3 = 12 unidades. Textos sem entidades não geram cobrança.
  • Nas tarefas de classificação de imagem/vídeo/texto, e de sentimento de texto é possível que os rotuladores humanos percam o controle das classes se o tamanho do conjunto de rótulos for muito grande. Como resultado, enviamos no máximo 20 classes para os rotuladores humanos de cada vez. Por exemplo, se o tamanho do conjunto de rótulos de uma tarefa de rotulagem for 40, cada item de dados será enviado para revisão humana 40 / 20 = 2 vezes e cobraremos duas vezes do preço calculado acima.

  • Para uma tarefa de rotulagem que ativa o recurso de rotulador personalizado, cada item de dados é contabilizado como uma unidade de rotulador personalizada.

  • Em uma tarefa de rotulagem de aprendizagem ativa para itens de dados com anotações geradas por modelos (sem a ajuda de um rotulador humano), cada item de dados é contabilizado como uma unidade de aprendizagem ativa.

  • Para uma tarefa de rotulagem de aprendizagem ativa para itens de dados com anotações geradas por rotuladores humanos, cada item de dados é contado como uma tarefa de rotulagem regular conforme descrito acima.

Na tabela abaixo, você confere o preço por 1.000 unidades por rotulador humano com base na unidade listada para cada objetivo. Os preços do nível 1 se aplicam às primeiras 50 mil unidades por mês em cada projeto do Google Cloud. Os do nível 2 se aplicam às 950 mil unidades seguintes por mês no projeto, com um máximo de um milhão de unidades. Entre em contato conosco para saber os preços acima de um milhão de unidades por mês.

Tipo de dado Objetivo Unidade Nível 1 Nível 2
Imagem Classificação Imagem US$ 35 US$ 25
Caixa delimitadora Caixa delimitadora US$ 63 US$ 49
Segmentação Segmento US$ 870 US$ 850
Caixa rotacionada Caixa delimitadora US$ 86 US$ 60
Polígono/linha poligonal Polígono/linha poligonal US$ 257 US$ 180
Vídeo Classificação Vídeo de 5 segundos US$ 86 US$ 60
Rastreamento de objetos Caixa delimitadora US$ 86 US$ 60
Reconhecimento de ação Evento em vídeo de 30 segundos US$ 214 US$ 150
Texto Classificação 50 palavras US$ 129 US$ 90
Sentimento 50 palavras US$ 200 US$ 140
Extração de entidade Entidade US$ 86 US$ 60
Aprendizagem ativa Tudo Item de dados US$ 80 US$ 56
Rotulador personalizado Tudo Item de dados US$ 80 US$ 56

Uso obrigatório do Cloud Storage

Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida da IA Vertex. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

  • Preparação do pacote de aplicativo de treinamento para modelos treinados personalizados

  • Armazenamento dos dados de entrada do treinamento

  • Armazenamento do resultado dos jobs de treinamento. A IA Vertex não requer armazenamento a longo prazo desses itens. Remova os arquivos assim que a operação for concluída.

Operações gratuitas para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pela AI Platform estão disponíveis gratuitamente. A política de cotas da AI Platform limita algumas dessas operações.

Recurso Operações gratuitas
modelos create, get, list, delete
versões create, get, list, delete, setDefault
jobs get, list, cancel
operações get, list, cancel, delete

Custos do Google Cloud

Se você armazenar imagens para serem analisadas no Cloud Storage ou usar outros recursos do Google Cloud com a IA Vertex, então também receberá cobrança pelo uso desses serviços.

Para ver seu status atualizado de faturamento no Console do Cloud, inclusive o uso e a fatura atual, consulte a página Faturamento. Para mais detalhes sobre o gerenciamento da sua conta, consulte a documentação do Cloud Billing ou o suporte de faturamento e pagamentos.

A seguir