Preços

O AI Platform Prediction oferece opções de preços flexíveis e escalonáveis adequados ao seu projeto e orçamento. Ele cobra pelo fornecimento de previsões, mas o gerenciamento dos recursos de machine learning na nuvem é gratuito.

Visão geral de preços

As tabelas a seguir resumem os preços em cada região em que o AI Platform Prediction está disponível.

Veja os preços do AI Platform Training.

Preços de previsões

Nesta tabela, mostramos os preços de previsões em lote e on-line por hora de uso do nó. Uma hora de uso do nó representa o tempo que uma máquina virtual gasta executando seu job de previsão ou aguardando em estado de prontidão para tratar as solicitações de previsão. Leia mais sobre como calcular os custos de previsão.

Américas

Previsão
Previsão em lote US$ 0,0791205 por hora de uso do nó
Previsão on-line
Tipos de máquinas: preço por hora de uso do nó
mls1-c1-m2 (padrão)

US$ 0,045147

mls1-c4-m2 (Beta)

US$ 0,151962

n1-standard-2

aproximadamente US$ 0,095

n1-standard-4

aproximadamente US$ 0,1901

n1-standard-8

aproximadamente US$ 0,3802

n1-standard-16

aproximadamente US$ 0,7603

n1-standard-32

aproximadamente US$ 1,5207

n1-highmem-2

aproximadamente US$ 0,1184

n1-highmem-4

aproximadamente US$ 0,2367

n1-highmem-8

aproximadamente US$ 0,4735

n1-highmem-16

aproximadamente US$ 0,947

n1-highmem-32

aproximadamente US$ 1,894

n1-highcpu-2

aproximadamente US$ 0,0709

n1-highcpu-4

aproximadamente US$ 0,1417

n1-highcpu-8

aproximadamente US$ 0,2834

n1-highcpu-16

aproximadamente US$ 0,5669

n1-highcpu-32

aproximadamente US$ 1,1338

Europa

Previsão
Previsão em lote US$ 0,086118 por hora de uso do nó
Previsão on-line
Tipos de máquinas: preço por hora de uso do nó
mls1-c1-m2 (padrão)

US$ 0,044095

mls1-c4-m2 (Beta)

US$ 0,148414

n1-standard-2

aproximadamente US$ 0,11

n1-standard-4

aproximadamente US$ 0,2201

n1-standard-8

aproximadamente US$ 0,4401

n1-standard-16

aproximadamente US$ 0,8802

n1-standard-32

aproximadamente US$ 1,7605

n1-highmem-2

aproximadamente US$ 0,137

n1-highmem-4

aproximadamente US$ 0,274

n1-highmem-8

aproximadamente US$ 0,548

n1-highmem-16

aproximadamente US$ 1,0959

n1-highmem-32

aproximadamente US$ 2,1918

n1-highcpu-2

aproximadamente US$ 0,0821

n1-highcpu-4

aproximadamente US$ 0,1642

n1-highcpu-8

aproximadamente US$ 0,3284

n1-highcpu-16

aproximadamente US$ 0,6567

n1-highcpu-32

aproximadamente US$ 1,3134

Ásia-Pacífico

Previsão
Previsão em lote US$ 0,086118 por hora de uso do nó
Previsão on-line
Tipos de máquinas: preço por hora de uso do nó
mls1-c1-m2 (padrão)

US$ 0,051456

mls1-c4-m2 (Beta)

US$ 0,17331

n1-standard-2

aproximadamente US$ 0,11

n1-standard-4

aproximadamente US$ 0,2201

n1-standard-8

aproximadamente US$ 0,4401

n1-standard-16

aproximadamente US$ 0,8802

n1-standard-32

aproximadamente US$ 1,7605

n1-highmem-2

aproximadamente US$ 0,137

n1-highmem-4

aproximadamente US$ 0,274

n1-highmem-8

aproximadamente US$ 0,548

n1-highmem-16

aproximadamente US$ 1,0959

n1-highmem-32

aproximadamente US$ 2,1918

n1-highcpu-2

aproximadamente US$ 0,0821

n1-highcpu-4

aproximadamente US$ 0,1642

n1-highcpu-8

aproximadamente US$ 0,3284

n1-highcpu-16

aproximadamente US$ 0,6567

n1-highcpu-32

aproximadamente US$ 1,3134

Os tipos de máquina do Compute Engine (N1) para previsões on-line estão disponíveis apenas nas regiões us-central1, europe-west4 e asia-east1. Além disso, elas são cobradas como dois SKUs diferentes na sua fatura do Google Cloud:

  • Custo de vCPU, calculado por vCPU/hora
  • Custo de RAM, calculado por GB/hora

Os preços dos tipos de máquina (N1) do Compute Engine na tabela anterior se aproximam do custo por hora total de cada nó de previsão da versão do modelo que usa o tipo de máquina mencionado. Por exemplo, para um tipo de máquina n1-highcpu-32 que inclua 32 vCPUs e 28,8 GB de RAM, o preço/hora por nó é igual a 32 vCPU/hora + 28,8 GB/hora.

Os preços na tabela anterior são fornecidos a você para ajudar a estimar os custos de previsão on-line. As tabelas a seguir mostram os preços de vCPU e RAM dos tipos de máquina (N1) do Compute Engine, que refletem com mais precisão as SKUs que serão cobradas:

Américas

SKUs do tipo de máquina (N1) do Compute Engine
vCPU US$ 0,031613 por hora de vCPU
RAM US$ 0,004242 por GB/hora

Europa

SKUs do tipo de máquina (N1) do Compute Engine
vCPU US$ 0,036632 por hora de vCPU
RAM US$ 0,004902 por GB/hora

Ásia-Pacífico

SKUs do tipo de máquina (N1) do Compute Engine
vCPU US$ 0,036632 por hora de vCPU
RAM US$ 0,004902 por GB/hora

Se preferir, use os aceleradores de GPU para previsão on-line com os tipos de máquina (N1) do Compute Engine. As GPUs geram outras cobranças, separadas daquelas descritas na tabela anterior. A tabela a seguir descreve os preços de cada tipo de GPU:

Américas

Aceleradores: preço por hora
NVIDIA_TESLA_K80 $0,4500
NVIDIA_TESLA_P4 $0,6000
NVIDIA_TESLA_P100 $1,4600
NVIDIA_TESLA_T4 US$ 0,3500
NVIDIA_TESLA_V100 $2,4800

Europa

Aceleradores: preço por hora
NVIDIA_TESLA_K80 Indisponível
NVIDIA_TESLA_P4 US$ 0,6500
NVIDIA_TESLA_P100 Indisponível
NVIDIA_TESLA_T4 $0,3800
NVIDIA_TESLA_V100 US$ 2,5500

Ásia-Pacífico

Aceleradores: preço por hora
NVIDIA_TESLA_K80 US$ 0,4900
NVIDIA_TESLA_P4 Indisponível
NVIDIA_TESLA_P100 US$ 1,6000
NVIDIA_TESLA_T4 Indisponível
NVIDIA_TESLA_V100 Indisponível

Os preços são definidos por GPU. Portanto, se você usar várias GPUs por nó de previsão (ou se fizer escalonamento da versão para utilizar diversos nós), os custos serão escalonados proporcionalmente.

Observações:

  1. Todo o uso está sujeito à política de cotas do AI Platform Prediction.
  2. É necessário armazenar seus dados e arquivos de programas em buckets do Google Cloud Storage durante o ciclo de vida do AI Platform Prediction. Veja mais sobre o uso do Cloud Storage.
  3. Para saber sobre descontos baseados em volume, entre em contato com a equipe de vendas.
  4. Caso o pagamento seja feito em uma moeda diferente do dólar americano, serão aplicados os preços listados na sua moeda na página SKUs do Cloud Platform.

Calculadora de preços

Use a calculadora de preços para estimar seus custos de treinamento e previsão.

Mais sobre os custos de previsão

O AI Platform Prediction cumpre previsões do seu modelo executando várias máquinas virtuais ("nós"). Por padrão, o AI Platform Prediction faz o escalonamento automático do número de nós sendo executados em qualquer momento. Para previsão on-line, o número de nós é escalonado para atender à demanda. Cada nó pode responder a várias solicitações de previsão. Para previsão em lote, o número de nós é escalonado para reduzir o tempo total necessário para executar um job. Personalize a maneira como os nós de previsão são escalonados.

Você é cobrado pelo tempo que cada nó é executado para seu modelo, incluindo:

  • Quando o nó está processando um job de previsão em lote.
  • Quando o nó está processando uma solicitação de previsão on-line.
  • Quando o nó está em estado de prontidão para disponibilizar as previsões on-line.

O custo de um nó em execução por uma hora é uma hora de uso do nó. A tabela de preços de previsão descreve o preço de uma hora de uso do nó, que varia entre as regiões e entre a previsão on-line e a previsão em lote.

As horas de uso do nó podem ser consumidas em incrementos fracionários. Por exemplo, um nó em execução por 30 minutos custa 0,5 horas por uso do nó. No entanto, várias regras regem os cálculos de custos:

Cálculo de custo dos tipos de máquina legados (MLS1) e previsão em lote.

  • O tempo de execução de um nó é medido em incrementos de um minuto, arredondado para o minuto mais próximo. Por exemplo, se um nó for executado por 20,1 minutos, calcule seu custo como se ele tivesse sido executado por 21 minutos.
  • O tempo de execução para nós que são executados por menos de 10 minutos é arredondado para 10 minutos. Por exemplo, se um nó for executado por apenas 3 minutos, calcule o custo dele como se ele tivesse sido executado por 10 minutos.

Cálculo de custo dos tipos de máquina do Compute Engine (N1)

  • O tempo de execução de um nó é cobrado em incrementos de 30 segundos. Isso significa que, a cada 30 segundos, seu projeto é cobrado por 30 segundos de uso de qualquer recurso, como vCPU, RAM ou GPU, que o nó esteja usando no momento.

Mais sobre escalonamento automático de nós de previsão

Previsão on-line Previsão em lote
A prioridade do escalonamento é reduzir a latência de solicitações individuais. O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após atender a uma solicitação. A prioridade do escalonamento é reduzir o tempo total decorrido do job.
O escalonamento afeta suas taxas totais a cada mês: quanto mais numerosas e frequentes forem suas solicitações, mais nós serão usados. O escalonamento provavelmente não terá muito efeito sobre o preço do seu job, ainda que haja alguns gastos indiretos envolvidos na criação de um novo nó.

Escolha deixar o serviço ser escalonado em resposta ao tráfego (escalonamento automático) ou especifique vários nós para execução constante para evitar latência (escalonamento manual).

  • Se você escolher o escalonamento automático, o número de nós será escalonado automaticamente e pode ser reduzido a zero em períodos sem tráfego.
  • Se escolher o escalonamento manual, você especifica que alguns nós continuem em execução sempre. Você é cobrado por todo o tempo em que eles estão em execução, começando no momento da implantação e continuando até você excluir a versão do modelo.
Influencie o escalonamento com a definição de um número máximo de nós a ser usado para um job de previsão em lote e com a definição do número de nós que continuarão em execução em um modelo quando ele for implantado.

Taxa mínima de 10 minutos

Lembre-se de que, se um nó for executado por menos de 10 minutos, você será cobrado como se ele tivesse sido executado por 10 minutos. Por exemplo, suponha que você use o escalonamento automático. Durante um período sem tráfego, nenhum nó está em uso. Se você receber uma única solicitação de previsão on-line, um nó será escalonado para atender à solicitação. Depois de atender à solicitação, o nó continuará em execução por alguns minutos em estado de prontidão. Em seguida, ele para. Mesmo que o nó tenha sido executado por menos de 10 minutos, você será cobrado por 10 minutos de nó (0,17 hora de uso do nó) pelo trabalho dele.

Como alternativa, se um único nó for escalonado e atender a muitas solicitações de previsão on-line em um período de 10 minutos antes do encerramento, você também será cobrado por 10 minutos de nó.

É possível usar o escalonamento manual para controlar exatamente quantos nós são executados durante um determinado período de tempo. No entanto, se um nó for executado por menos de 10 minutos, você ainda será cobrado como se ele tivesse sido executado por 10 minutos.

Saiba mais sobre alocação e escalonamento de nós.

Exemplo de um cálculo de previsão

Uma empresa imobiliária em uma região das Américas realiza uma previsão semanal de valores de habitação nas áreas em que atende. Em um mês, realiza previsões para quatro semanas em lotes de 3920, 4277, 3849 e 3961. Os jobs são limitados a um nó, e cada instância leva uma média de 0.72 segundos de processamento.

Primeiro, calcule o período de tempo que cada job foi executado:

3920 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.04 minutes
4277 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 51.324 minutes
3849 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 46.188 minutes
3961 instances * (0.72 seconds / 1 instance) * (1 minute / 60 seconds) = 47.532 minutes

Cada job foi executado por mais de dez minutos, portanto a cobrança é feita por cada minuto de processamento:

($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 52 minutes * 1 node = $0.0685711
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 47 minutes * 1 node = $0.061977725
($0.0791205 / 1 node hour) * (1 hour / 60 minutes) * 48 minutes * 1 node = $0.0632964

A cobrança total do mês é de US$ 0,26.

Este exemplo considera que os jobs foram executados em um único nó e demoraram um período consistente de tempo por instância de entrada. No uso real, certifique-se de contabilizar vários nós e usar o tempo real que cada nó gasta em execução para os seus cálculos.

Observação sobre as cobranças do AI Platform Prediction para o AI Explanations

O AI Explanations vem sem cobrança extra para preços do AI Platform Prediction. Contudo, as explicações levam mais tempo para serem processadas do que as previsões normais, assim o uso pesado do AI Explanations junto com o escalonamento automático resulta em mais nós sendo iniciados, o que aumentaria as cobranças do AI Platform Prediction.

Uso obrigatório do Cloud Storage

Além dos custos descritos neste documento, você precisa armazenar dados e arquivos de programas nos buckets do Cloud Storage durante o ciclo de vida do AI Platform Prediction. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

  • preparação dos arquivos do modelo quando estiver tudo pronto para você implantar uma versão;

  • armazenamento dos dados de entrada para a previsão em lote;

  • armazenamento do resultado dos jobs de previsão em lote. O AI Platform Prediction não requer armazenamento a longo prazo desses itens. Remova os arquivos assim que a operação for concluída.

Operações gratuitas para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pelo AI Platform Prediction estão disponíveis gratuitamente. A política de cotas do AI Platform Prediction limita algumas das operações.

Recurso Operações gratuitas
modelos create, get, list, delete
versões create, get, list, delete, setDefault
jobs get, list, cancel
operações get, list, cancel, delete