Preços

O Cloud Machine Learning Engine oferece opções de preço flexíveis e escalonáveis para se adequar ao seu projeto e orçamento. No Cloud ML Engine, são cobrados os modelos de treinamento e as previsões, mas o gerenciamento dos recursos de machine learning na nuvem é gratuito.

Visão geral de preços

Nas tabelas a seguir, resumimos os preços para treinamento e previsão em cada região em que o Cloud ML Engine está disponível.

Preços de treinamentos

Nas tabelas abaixo, fornecemos o preço por hora de várias configurações de treinamento, bem como o número de unidades de treinamento2 usadas por cada configuração. As unidades de treinamento medem o uso de recursos do seu job. O preço por hora de uma configuração de máquina é o número de unidades de treinamento que ela usa multiplicado pelo custo de treinamento da região.

É possível escolher um nível de escalonamento predefinido ou uma configuração personalizada de tipos de máquinas selecionados. Se você escolher uma configuração personalizada, some os custos das máquinas virtuais que usa.

Os tipos de máquinas do Cloud ML Engine compatíveis com acelerador incluem o custo dos aceleradores nos preços. Se você usa tipos de máquina do Compute Engine e anexa aceleradores, o custo deles é separado. Para calcular esse custo, multiplique os preços da tabela abaixo por quantos aceleradores de cada tipo você usa.

Américas

O custo de um job de treinamento em todas as regiões das Américas disponíveis é de US$ 0,49 por hora, por unidade de treinamento.

Níveis de escalonamento predefinidos: preço por hora (unidades de treinamento)
BASIC US$ 0,1900 (0,3878)
STANDARD_1 US$ 1,9880 (4,0571)
PREMIUM_1 US$ 16,5536 (33,7829)
BASIC_GPU US$ 0,8300 (1,6939)
BASIC_TPU US$ 4,6900 (9,5714)
CUSTOM Se você selecionar o nível de escalonamento CUSTOM, poderá controlar o número e os tipos de máquinas virtuais usadas no seu job de treinamento. Veja a tabela de tipos de máquinas.
Tipos de máquinas do Cloud ML Engine: preço por hora (unidades de treinamento)
standard US$ 0,1900 (0,3878)
large_model US$ 0,4736 (0,9665)
complex_model_s US$ 0,2836 (0,5788)
complex_model_m US$ 0,5672 (1,1576)
complex_model_l US$ 1,1344 (2,3151)
standard_gpu US$ 0,8300 (1,6939)
complex_model_m_gpu US$ 2,5600 (5,2245)
complex_model_l_gpu US$ 3,3200 (6,7755)
standard_p100 US$ 1,8400 (3,7551)
complex_model_m_p100 US$ 6,6000 (13,4694)
standard_v100 US$ 2,8600 (5,8367)
large_model_v100 US$ 2,9536 (6,0278)
complex_model_m_v100 US$ 10,6800 (21,7959)
complex_model_l_v100 US$ 21,3600 (43,5918)
cloud_tpu6 US$ 4,5000 (9,1840) ou N/A se os aceleradores estiverem explicitamente anexados6
Tipos de máquinas do Compute Engine (Beta): preço por hora (unidades de treinamento)
n1-standard-4 US$ 0,1900 (0,3878)
n1-standard-8 US$ 0,3800 (0,7755)
n1-standard-16 US$ 0,7600 (1,5510)
n1-standard-32 US$ 1,5200 (3,1020)
n1-standard-64 US$ 3,0400 (6,2041)
n1-standard-96 US$ 4,5600 (9,3061)
n1-highmem-2 US$ 0,1184 (0,2416)
n1-highmem-4 US$ 0,2368 (0,4833)
n1-highmem-8 US$ 0,4736 (0,9665)
n1-highmem-16 US$ 0,9472 (1,9331)
n1-highmem-32 US$ 1,8944 (3,8661)
n1-highmem-64 US$ 3,7888 (7,7322)
n1-highmem-96 US$ 5,6832 (11,5984)
n1-highcpu-16 US$ 0,5672 (1,1576)
n1-highcpu-32 US$ 1,1344 (2,3151)
n1-highcpu-64 US$ 2,2688 (4,6302)
n1-highcpu-96 US$ 3,4020 (6,9429)
Aceleradores: preço por hora (unidades de treinamento)
NVIDIA_TESLA_K80 US$ 0,4500 (0,9184)
NVIDIA_TESLA_P4 (Beta) US$ 0,6000 (1,2245)
NVIDIA_TESLA_P100 US$ 1,4600 (2,9796)
NVIDIA_TESLA_V100 US$ 2,4800 (5,0612)
Oito núcleos TPU_V26 US$ 4,5000 (9,1840)

Europa

O custo de um job de treinamento em todas as regiões da Europa disponíveis é de US$ 0,54 por hora, por unidade de treinamento.

Níveis de escalonamento predefinidos: preço por hora (unidades de treinamento)
BASIC US$ 0,2200 (0,4074)
STANDARD_1 US$ 2,3020 (4,2630)
PREMIUM_1 US$ 19,1640 (35,4889)
BASIC_GPU US$ 0,9300 (1,7222)
BASIC_TPU (Não disponível)
CUSTOM Se você selecionar o nível de escalonamento CUSTOM, poderá controlar o número e os tipos de máquinas virtuais usadas no seu job de treinamento. Veja a tabela de tipos de máquinas.
Tipos de máquinas do Cloud ML Engine: preço por hora (unidades de treinamento)
standard US$ 0,2200 (0,4074)
large_model US$ 0,5480 (1,0148)
complex_model_s US$ 0,3284 (0,6081)
complex_model_m US$ 0,6568 (1,2163)
complex_model_l US$ 1,3136 (2,4326)
standard_gpu US$ 0,9300 (1,7222)
complex_model_m_gpu US$ 2,8400 (5,2593)
complex_model_l_gpu US$ 3,7200 (6,8889)
standard_p100 US$ 2,0400 (3,7778)
complex_model_m_p100 US$ 7,2800 (13,4815)
standard_v100 US$ 2,9684 (5,4970)
large_model_v100 US$ 3,0708 (5,6867)
complex_model_m_v100 US$ 11,0368 (20,4385)
complex_model_l_v100 US$ 22,0736 (40,8770)
cloud_tpu6 (Não disponível)
Tipos de máquinas do Compute Engine (Beta): preço por hora (unidades de treinamento)
n1-standard-4 US$ 0,2200 (0,4074)
n1-standard-8 US$ 0,4400 (0,8148)
n1-standard-16 US$ 0,8800 (1,6296)
n1-standard-32 US$ 1,7600 (3,2593)
n1-standard-64 US$ 3,5200 (6,5185)
n1-standard-96 US$ 5,2800 (9,7778)
n1-highmem-2 US$ 0,1370 (0,2537)
n1-highmem-4 US$ 0,2740 (0,5074)
n1-highmem-8 US$ 0,5480 (1,0148)
n1-highmem-16 US$ 1,0960 (2,0296)
n1-highmem-32 US$ 2,1920 (4,0593)
n1-highmem-64 US$ 4,3840 (8,1185)
n1-highmem-96 US$ 6,5760 (12,1778)
n1-highcpu-16 US$ 0,6568 (1,2163)
n1-highcpu-32 US$ 1,3136 (2,4326)
n1-highcpu-64 US$ 2,6272 (4,8652)
n1-highcpu-96 US$ 3,9408 (7,2978)
Aceleradores: preço por hora (unidades de treinamento)
NVIDIA_TESLA_K80 US$ 0,4900 (0,9074)
NVIDIA_TESLA_P4 (Beta) US$ 0,6500 (1,2037)
NVIDIA_TESLA_P100 US$ 1,6000 (2,9630)
NVIDIA_TESLA_V100 US$ 2,5500 (4,7222)
Oito núcleos TPU_V26 (Não disponível)

Ásia-Pacífico

O custo de um job de treinamento em todas as regiões da Ásia-Pacífico disponíveis é de US$ 0,54 por hora, por unidade de treinamento.

Níveis de escalonamento predefinidos: preço por hora (unidades de treinamento)
BASIC US$ 0,2200 (0,4074)
STANDARD_1 US$ 2,3020 (4,2630)
PREMIUM_1 US$ 19,1640 (35,4889)
BASIC_GPU US$ 0,9300 (1,7222)
BASIC_TPU (Não disponível)
CUSTOM Se você selecionar o nível de escalonamento CUSTOM, poderá controlar o número e os tipos de máquinas virtuais usadas no seu job de treinamento. Veja a tabela de tipos de máquinas.
Tipos de máquinas do Cloud ML Engine: preço por hora (unidades de treinamento)
standard US$ 0,2200 (0,4074)
large_model US$ 0,5480 (1,0148)
complex_model_s US$ 0,3284 (0,6081)
complex_model_m US$ 0,6568 (1,2163)
complex_model_l US$ 1,3136 (2,4326)
standard_gpu US$ 0,9300 (1,7222)
complex_model_m_gpu US$ 2,8400 (5,2593)
complex_model_l_gpu US$ 3,7200 (6,8889)
standard_p100 US$ 2,0400 (3,7778)
complex_model_m_p100 US$ 7,2800 (13,4815)
standard_v100 US$ 2,9684 (5,4970)
large_model_v100 US$ 3,0708 (5,6867)
complex_model_m_v100 US$ 11,0368 (20,4385)
complex_model_l_v100 US$ 22,0736 (40,8770)
cloud_tpu6 (Não disponível)
Tipos de máquinas do Compute Engine (Beta): preço por hora (unidades de treinamento)
n1-standard-4 US$ 0,2200 (0,4074)
n1-standard-8 US$ 0,4400 (0,8148)
n1-standard-16 US$ 0,8800 (1,6296)
n1-standard-32 US$ 1,7600 (3,2593)
n1-standard-64 US$ 3,5200 (6,5185)
n1-standard-96 US$ 5,2800 (9,7778)
n1-highmem-2 US$ 0,1370 (0,2537)
n1-highmem-4 US$ 0,2740 (0,5074)
n1-highmem-8 US$ 0,5480 (1,0148)
n1-highmem-16 US$ 1,0960 (2,0296)
n1-highmem-32 US$ 2,1920 (4,0593)
n1-highmem-64 US$ 4,3840 (8,1185)
n1-highmem-96 US$ 6,5760 (12,1778)
n1-highcpu-16 US$ 0,6568 (1,2163)
n1-highcpu-32 US$ 1,3136 (2,4326)
n1-highcpu-64 US$ 2,6272 (4,8652)
n1-highcpu-96 US$ 3,9408 (7,2978)
Aceleradores: preço por hora (unidades de treinamento)
NVIDIA_TESLA_K80 US$ 0,4900 (0,9074)
NVIDIA_TESLA_P4 (Beta) (Não disponível)
NVIDIA_TESLA_P100 US$ 1,6000 (2,9630)
NVIDIA_TESLA_V100 US$ 2,5500 (4,7222)
Oito núcleos TPU_V26 (Não disponível)

Preços de predições

Nesta tabela, oferecemos os preços de predições em lote e on-line por hora do nó. Uma hora do nó representa o tempo que seu job de predição fica em execução em uma máquina virtual. Leia mais sobre horas do nó.

Américas

Predição: preço por hora do nó
Predição em lote US$ 0,0791
Predição on-line
Tipos de máquinas: preço por hora do nó
mls1-c1-m2 (padrão)

US$ 0,0401

mls1-c4-m2 (Beta)

US$ 0,1349

Europa

Predição: preço por hora do nó
Predição em lote US$ 0,0861
Predição on-line
Tipos de máquinas: preço por hora do nó
mls1-c1-m2 (padrão)

US$ 0,0441

mls1-c4-m2 (Beta)

US$ 0,1484

Ásia-Pacífico

Predição: preço por hora do nó
Predição em lote US$ 0,0861
Predição on-line
Tipos de máquinas: preço por hora do nó
mls1-c1-m2 (padrão)

US$ 0,0515

mls1-c4-m2 (Beta)

US$ 0,1733

Observações:

  1. Todo o uso está sujeito à política de cotas do Cloud ML Engine.
  2. Observe a diferença entre a unidade de treinamento usada nesta página e as unidades de ML consumidas mostradas na página Detalhes do job. A duração já está incluída nas unidades de ML consumidas. Veja os detalhes abaixo.
  3. É necessário armazenar seus dados e arquivos de programas nos intervalos do Google Cloud Storage durante o ciclo de vida do Cloud ML Engine. Veja mais sobre o uso do Cloud Storage.
  4. Para saber sobre descontos baseados em volume, entre em contato com a equipe de vendas.
  5. Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados na sua moeda os preços listados na página SKUs do Cloud Platform.
  6. No momento, o tipo de máquina cloud_tpu oferece um dispositivo TPU v2 com oito núcleos, independentemente de você anexar de modo explícito aceleradores à sua configuração. O preço é o mesmo de qualquer maneira.

Calculadora de preços

Use a calculadora de preços para estimar seus custos de treinamento e previsão.

Mais sobre os custos de treinamento

Você é cobrado pelo treinamento dos seus modelos na nuvem:

  • em incrementos de um minuto;
  • em um preço por hora como mostrado na tabela acima. O preço por hora é calculado a partir de um preço base e um número de unidades de treinamento, determinado pela configuração de processamento escolhida quando você inicia seu job de treinamento;
  • por no mínimo 10 minutos por job de treinamento;
  • a partir do momento em que os recursos são provisionados para um job até que ele seja concluído.

Níveis de escalonamento para configurações predefinidas

Você pode controlar o tipo de cluster de processamento a ser usado ao treinar seu modelo. A maneira mais simples é escolher uma das configurações predefinidas, chamadas níveis de escalonamento. Saiba mais sobre os níveis de escalonamento.

Tipos de máquinas para configurações personalizadas

Ao selecionar CUSTOM como seu nível de escalonamento, você controlará o número e o tipo das máquinas virtuais que serão usadas para os servidores mestre, de worker e de parâmetros do cluster. Saiba mais sobre os tipos de máquinas.

O custo do treinamento com um cluster de processamento personalizado será a soma de todas as máquinas que você especificar. Você será cobrado pelo tempo total do job, não pelo tempo de processamento ativo de máquinas individuais.

Exemplos: calcular o custo do treinamento com o uso de unidades de treinamento

Use unidades de treinamento para calcular o custo do seu job de treinamento com a seguinte fórmula:

(training units * base price / 60) * job duration in minutes

Exemplos:

  • Um cientista de dados em uma região das Américas executa um job de treinamento e seleciona o nível de escalonamento STANDARD_1, que usa 4,0571 unidades de treinamento. O job leva 15 minutos:

    (4.0571 training units * $0.49 per hour / 60) * 15 minutes
    

    O total é de US$ 0,50 pelo job.

  • Um professor de ciência da computação em uma região das Américas executa um job de treinamento com o nível de escalonamento CUSTOM. O modelo usado é muito grande e, por isso, ele quer aproveitar as VMs de modelos grandes como servidores de parâmetros. Ele configura o cluster de processamento deste modo:

    • Uma máquina complex_model_s para o mestre (0,5788 unidades de treinamento).
    • 5 servidores de parâmetros em VMs large_model (5 vezes 0,9665 = 4,8325 unidades de treinamento).
    • 8 workers em VMs complex_model_s (8 vezes 0,5788 = 4,6304 unidades de treinamento).

    O job é executado durante 2 horas e 26 minutos:

    (10.0417 training units * $0.49 per hour / 60) * 146 minutes
    

    O total é de US$ 11,97 pelo job.

Exemplos: calcular o custo do treinamento com o uso do preço por hora

Em vez de unidades de treinamento, você pode usar o preço por hora mostrado na tabela acima. A fórmula é a seguinte:

(Price per hour / 60) * job duration in minutes

Exemplos:

  • Um cientista de dados em uma região das Américas executa um job de treinamento e seleciona o nível de escalonamento STANDARD_1. O job leva 15 minutos:

    ($1.9880 per hour / 60) * 15 minutes
    

    O total é de US$ 0,50 pelo job.

  • Um professor de ciência da computação em uma região das Américas executa um job de treinamento com o nível de escalonamento CUSTOM. O modelo usado é muito grande e, por isso, ele quer aproveitar as VMs de modelos grandes como servidores de parâmetros. Ele configura o cluster de processamento deste modo:

    • Uma máquina complex_model_s para o mestre (US$ 0,2836).
    • 5 servidores de parâmetros em VMs large_model (5 vezes US$ 0,4736 = US$ 2,3680).
    • 8 workers em VMs complex_model_s (8 vezes US$ 0,2836 = US$ 2,2688).

    O job é executado durante 2 horas e 26 minutos:

    (($0.2836 + $2.368 + $2.2688) per hour / 60) * 146 minutes
    

    O total é de US$ 11,97 pelo job.

Exemplos: calcular o custo do treinamento com o uso de "unidades de ML consumidas"

As unidades de machine learning (ML) consumidas mostradas na página Detalhes do job são equivalentes às unidades de treinamento com a duração do job já inclusa. Ao usar unidades ML consumidas nos seus cálculos, use a seguinte fórmula:

Consumed ML units * $0.49

Exemplo:

  • Um cientista de dados em uma região das Américas executa um job de treinamento. O campo Unidades ML consumidas na página Detalhes do job mostra 55,75. O cálculo é o seguinte:

    55.75 consumed ML units * $0.49
    

    O total é de US$ 27,32 pelo job.

Para encontrar a página Detalhes do job, acesse a lista de jobs e clique no link de um deles.

Mais sobre os custos de previsão

O preço de previsão se aplica às solicitações feitas para versões de modelo treinadas hospedadas pelo Cloud ML Engine.

Você é cobrado:

  • pelo tempo usado em cada nó no cluster de processamento que realiza as previsões;
  • em incrementos de um minuto;
  • com base em uma taxa por hora do nó, conforme mostrado na tabela acima;
  • por no mínimo 10 minutos por job de previsão.

Horas do nó

Para executar seu modelo de previsão, o Cloud ML Engine usa recursos de processamento on-line chamados nós. Pense em um nó como uma máquina virtual. O Cloud ML Engine escalona o número de nós usados para acomodar o trabalho, tanto na previsão on-line quanto em lote.

Você é cobrado pelo tempo que seu modelo está sendo executado em um nó, inclusive:

  • ao processar um job de previsão em lote;
  • ao processar uma solicitação de previsão on-line;
  • quando seu modelo está pronto para veicular previsões on-line.

Veja a seguir o que se aplica à previsão em lote:

  • A prioridade do escalonamento é reduzir o tempo total decorrido do job.
  • O escalonamento provavelmente não terá muito efeito sobre o preço do seu job, ainda que haja alguns gastos indiretos envolvidos na criação de um novo nó.
  • Você pode influenciar o escalonamento com a definição de um número máximo de nós a ser usado para um job de previsão em lote e do número de nós que continuarão em execução em um modelo quando ele for implantado.

Veja a seguir o que se aplica à previsão on-line:

  • A prioridade do escalonamento é reduzir a latência das solicitações individuais.
  • O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após veicular uma solicitação.
  • O escalonamento afeta suas cobranças totais a cada mês: quanto mais frequentes forem suas solicitações, mais nós serão usados.
  • Você pode permitir o escalonamento do serviço em resposta ao tráfego (escalonamento automático) ou especificar uma série de nós a serem executados constantemente para evitar latência.
  • Se você escolher o escalonamento automático, o número de nós será dimensionado automaticamente e pode ser reduzido a zero em períodos sem tráfego.
  • Se optar por especificar um número de nós em vez de fazer o escalonamento automático, você será cobrado por todo o tempo em que os nós estiverem em execução, desde o momento da implantação até aquele em que a versão do modelo for excluída.

A previsão on-line usa máquinas de núcleo único sem GPUs ou outros aceleradores.

Saiba mais sobre alocação e escalonamento de nós.

Exemplos de cálculos de previsão

Use a fórmula abaixo para calcular seu custo de previsão por um mês:

(Price per hour / 60) * job duration in node minutes

Exemplo:

  • Uma empresa imobiliária em uma região das Américas realiza uma predição semanal de valores de habitação nas áreas em que trabalha. Em um mês, ela realizou predições por quatro semanas em lotes de 3920, 4277, 3849 e 3961. As predições levam em média 0.72 segundos do nó de processamento.

    O custo de processamento é por job (este exemplo usa a média, mas os custos reais usam valores exatos para cada job):

    3920 * 0.72 = 47.04 minutes
    4277 * 0.72 = 51.324 minutes
    3849 * 0.72 = 46.188 minutes
    3961 * 0.72 = 47.532 minutes
    

    Cada job leva mais de dez minutos, portanto é cobrado por minuto de processamento:

    ($0.0791 / 60) * 48 = $0.06328
    ($0.0791 / 60) * 52 = $0.06855
    ($0.0791 / 60) * 47 = $0.06196
    ($0.0791 / 60) * 48 = $0.06328
    

    O resultado é uma taxa total de US$ 0,26 para o mês.

O número de minutos mostrado nos exemplos não corresponde ao tempo real decorrido. Tanto a previsão em lote quanto a on-line usa uma ou mais máquinas para processar os dados. Portanto, o tempo real decorrido é geralmente menor do que o tempo expresso em horas ou em minutos do nó.

Uso obrigatório do Google Cloud Storage

Além dos custos descritos neste documento, é necessário armazenar dados e arquivos de programas nos intervalos do Google Cloud Storage durante o ciclo de vida do Cloud ML Engine. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

  • preparação do pacote de aplicativo de treinamento;

  • armazenamento dos dados de entrada do treinamento;

  • preparação dos arquivos do modelo quando estiver tudo pronto para você implantar uma versão;

  • armazenamento dos dados de entrada para a previsão em lote;

  • armazenamento do resultado dos jobs de previsão em lote. O Cloud ML Engine não requer o armazenamento a longo prazo desses itens. Você pode remover os arquivos assim que a operação for concluída;

  • armazenamento do resultado dos jobs de treinamento. O Cloud ML Engine não requer o armazenamento a longo prazo desses itens. Você pode remover os arquivos assim que a operação for concluída.

Operações gratuitas para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pelo Cloud ML Engine são gratuitas. A política de cotas do Cloud ML Engine limita algumas dessas operações.

Recurso Operações gratuitas
modelos create, get, list, delete
versões create, get, list, delete, setDefault
jobs get, list, cancel
operações get, list, cancel, delete

A seguir

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…