Preço

O Cloud Machine Learning Engine oferece opções de preço flexíveis e dimensionáveis para se adequar ao seu projeto e orçamento. No Cloud ML Engine, são cobrados os modelos de treinamento e as previsões, mas o gerenciamento dos recursos de aprendizado de máquina na nuvem é gratuito.

Visão geral de preços

As tabelas a seguir resumem os preços por região para treinamento, previsão em lote e previsão on-line.

EUA

Treinamento (EUA)

O custo de um job de treinamento é de US$ 0,49 por hora, por unidade de treinamento. O número de unidades de treinamento é determinado pela configuração da máquina que você escolher para executar o job. Você pode escolher um nível de escalonamento predefinido ou uma configuração personalizada de tipos de máquinas selecionados. Consulte as tabelas a seguir para ver mais detalhes.

Níveis de escalonamento predefinidos: preço por hora (e unidades de treinamento)
BASIC

US$ 0,2774 (0,5661)

STANDARD_1

US$ 2,9025 (5,9234)

PREMIUM_1

US$ 24,1683 (49,323)

BASIC_GPU

US$ 1,2118 (2,4731)

CUSTOM

Se você selecionar o nível de escalonamento CUSTOM, poderá controlar o número e os tipos de máquinas virtuais usadas no seu job de treinamento. Veja a tabela de tipos de máquinas.

Tipos de máquinas: preço por hora (e unidades de treinamento)
standard

US$ 0,2774 (0,5661)

large_model

US$ 0,6915 (1,4111)

complex_model_s

US$ 0,4141 (0,845)

complex_model_m

US$ 0,8281 (1,69)

complex_model_l

US$ 1,6562 (3,38)

standard_gpu

US$ 1,2118 (2,4731)

complex_model_m_gpu

US$ 3,7376 (7,6278)

complex_model_l_gpu

US$ 7,4752 (15,2555)

standard_p100 (Beta)

US$ 2,6864 (5,4824)

complex_model_m_p100 (Beta)

US$ 9,636 (19,6653)

Previsão em lote (EUA) US$ 0,09262 por hora do node. 3
Previsão on-line (EUA) US$ 0,3 por hora do node. 3

Europa

Treinamento (Europa)

O custo de um job de treinamento é de US$ 0,54 por hora, por unidade de treinamento. O número de unidades de treinamento é determinado pela configuração da máquina que você escolher para executar o job. Você pode escolher um nível de escalonamento predefinido ou uma configuração personalizada de tipos de máquinas selecionados. Consulte as tabelas a seguir para ver mais detalhes.

Níveis de escalonamento predefinidos: preço por hora (e unidades de treinamento)
BASIC

US$ 0,3212 (0,5948)

STANDARD_1

US$ 3,3609 (6,2239)

PREMIUM_1

US$ 27,9794 (51,8138)

BASIC_GPU

US$ 1,3578 (2,5144)

CUSTOM

Se você selecionar o nível de escalonamento CUSTOM, poderá controlar o número e os tipos de máquinas virtuais usadas no seu job de treinamento. Veja a tabela de tipos de máquinas.

Tipos de máquinas: preço por hora (e unidades de treinamento)
standard

US$ 0,3212 (0,5948)

large_model

US$ 0,8001 (1,4816)

complex_model_s

US$ 0,4795 (0,8879)

complex_model_m

US$ 0,9589 (1,7758)

complex_model_l

US$ 1,9179 (3,5516)

standard_gpu

US$ 1,3578 (2,5144)

complex_model_m_gpu

US$ 4,1464 (7,6785)

complex_model_l_gpu

US$ 8,2928 (15,357)

standard_p100 (Beta)

US$ 2,9784 (5,5156)

complex_model_m_p100 (Beta)

US$ 10,6288 (19,6830)

Previsão em lote (Europa) US$ 0,10744 por hora do node.3
Previsão on-line (Europa) US$ 0,348 por hora do node.3

Ásia-Pacífico

Treinamento (Ásia-Pacífico)

O custo de um job de treinamento é de US$ 0,54 por hora, por unidade de treinamento. O número de unidades de treinamento é determinado pela configuração da máquina que você escolher para executar o job. Você pode escolher um nível de escalonamento predefinido ou uma configuração personalizada de tipos de máquinas selecionados. Consulte as tabelas a seguir para ver mais detalhes.

Níveis de escalonamento predefinidos: preço por hora (e unidades de treinamento)
BASIC

US$ 0,3212 (0,5948)

STANDARD_1

US$ 3,3609 (6,2239)

PREMIUM_1

US$ 27,9794 (51,8138)

BASIC_GPU

US$ 1,3578 (2,5144)

CUSTOM

Se você selecionar o nível de escalonamento CUSTOM, poderá controlar o número e os tipos de máquinas virtuais usadas no seu job de treinamento. Veja a tabela de tipos de máquinas.

Tipos de máquinas: preço por hora (e unidades de treinamento)
standard

US$ 0,3212 (0,5948)

large_model

US$ 0,8001 (1,4816)

complex_model_s

US$ 0,4795 (0,8879)

complex_model_m

US$ 0,9589 (1,7758)

complex_model_l

US$ 1,9179 (3,5516)

standard_gpu

US$ 1,3578 (2,5144)

complex_model_m_gpu

US$ 4,1464 (7,6785)

complex_model_l_gpu

US$ 8,2928 (15,357)

standard_p100 (Beta)

US$ 2,9784 (5,5156)

complex_model_m_p100 (Beta)

US$ 10,6288 (19,6830)

Previsão em lote (Ásia-Pacífico) US$ 0,10744 por hora do node.3
Previsão on-line (Ásia-Pacífico) US$ 0,348 por hora do node.3

Observações:

  1. Todo o uso está sujeito à política de cotas do Cloud ML Engine.
  2. É necessário armazenar seus dados e arquivos de programas nos intervalos do Google Cloud Storage durante o ciclo de vida do Cloud ML Engine. Veja mais sobre o uso do Cloud Storage.
  3. Uma hora do node representa o tempo em que seu job de previsão fica em execução em uma máquina virtual. Leia mais sobre horas do node.
  4. Para saber sobre descontos baseados em volume, entre em contato com a equipe de vendas.
  5. Se você fizer pagamentos em uma moeda que não seja o dólar americano, serão aplicados os preços na sua moeda listados na página Cloud Platform SKUs.

A calculadora de preços

Use a calculadora de preços para estimar seus custos de treinamento e previsão.

Mais sobre os custos de treinamento

Você é cobrado pelo treinamento dos seus modelos na nuvem:

  • em incrementos de um minuto;
  • em um preço por hora como mostrado na tabela acima. O preço por hora é calculado a partir de um preço base e um número de unidades de treinamento, determinado pela configuração de processamento escolhida quando você inicia seu job de treinamento;
  • no mínimo 10 minutos por job de treinamento;
  • a partir do momento em que os recursos são provisionados para um job até que ele seja concluído.

Níveis de escalonamento para configurações predefinidas

Você pode controlar o tipo de cluster de processamento a ser usado ao treinar seu modelo. A maneira mais simples é escolher uma das configurações predefinidas, chamadas níveis de escalonamento. Leia mais sobre níveis de escalonamento na visão geral do treinamento.

Tipos de máquinas para configurações personalizadas

Ao selecionar CUSTOM como seu nível de escalonamento, você controlará o número e o tipo das máquinas virtuais que serão usadas para os servidores mestre, de worker e de parâmetros do cluster. Leia mais sobre os tipos de máquinas na visão geral do treinamento.

O custo do treinamento com um cluster de processamento personalizado é a soma de todas as máquinas que você especificar. Você será cobrado pelo tempo total do job, não pelo tempo de processamento ativo de máquinas individuais.

Exemplos: calcular o custo do treinamento com o uso de unidades de treinamento

Use unidades de treinamento para calcular o custo do seu job de treinamento com a seguinte fórmula:

(training units * base price / 60) * job duration in minutes

Exemplos:

  • Um cientista de dados na região dos EUA executa um job de treinamento e seleciona o nível de escalonamento STANDARD_1, que usa 5,9234 unidades de treinamento. O job leva 15 minutos:

    (5.9234 training units * $0.49 per hour / 60) * 15 minutes
    

    O total é de US$ 0,73 para o job.

  • Nos EUA, um professor de ciência da computação executa um job de treinamento com o nível de escala CUSTOM. O modelo usado é muito grande e, por isso, ele quer aproveitar as VMs de modelos grandes como servidores de parâmetros. Ele configura o cluster de processamento deste modo:

    • Uma máquina complex_model_s para o mestre (0,845 unidades de treinamento).
    • 5 servidores de parâmetros em VMs de large_model (5 vezes 1,4111 = 7,0555 unidades de treinamento).
    • 8 trabalhadores em VMs complex_model_s (8 vezes 0,845 = 6,76 unidades de treinamento).

    O job é executado durante 2 horas e 26 minutos:

    (4.6605 training units * $0.49 per hour / 60) * 146 minutes
    

    O total é de US$ 17,48 para o job.

Exemplos: calcular o custo do treinamento com o uso do preço por hora

Em vez de unidades de treinamento, você pode usar o preço por hora mostrado na tabela acima. A fórmula é a seguinte:

(Price per hour / 60) * job duration in minutes

Exemplos:

  • Um cientista de dados na região dos EUA executa um job de treinamento e seleciona o nível de escalonamento STANDARD_1. O job leva 15 minutos:

    ($2.9025 per hour / 60) * 15 minutes
    

    O total é de US$ 0,73 para o job.

  • Nos EUA, um professor de ciência da computação executa um job de treinamento com o nível de escalonamento CUSTOM. O modelo usado é muito grande e, por isso, ele quer aproveitar as VMs de modelos grandes como servidores de parâmetros. Ele configura o cluster de processamento deste modo:

    • Uma máquina complex_model_s para o mestre (US$ 0,4141).
    • 5 servidores de parâmetros em VMs de large_model (5 vezes US$ 0,6915 = US$ 3,4575).
    • 8 trabalhadores em VMs de complex_model_s (8 vezes US$ 0,4141 = US$ 3,3128).

    O job é executado durante 2 horas e 26 minutos:

    (($0.41406 + $3.4573 + $3.31248) per hour / 60) * 146 minutes
    

    O total é de US$ 17,48 para o job.

Exemplos: calcular o custo do treinamento com o uso de "unidades ML consumidas"

As unidades ML consumidas (unidades de aprendizado de máquina consumidas) mostradas na página Detalhes do job são equivalentes a unidades de treinamento com a duração do job já inclusa. Ao usar unidades ML consumidas nos seus cálculos, use a seguinte fórmula:

Consumed ML units * $0.49

Exemplo:

  • Um cientista de dados na região dos EUA executa um job de treinamento. O campo unidades ML consumidas na página Detalhes do job mostra 55,75. O cálculo é o seguinte:

    55.75 consumed ML units * $0.49
    

    O total é de US$ 27,32 para o job.

Para encontrar a página Detalhes do job, acesse a lista de jobs e clique no link de um job específico.

Mais sobre os custos de previsão

O preço de previsão aplica-se às solicitações feitas para versões de modelo treinadas hospedadas pelo Cloud ML Engine.

Você é cobrado:

  • pelo tempo usado em cada node no cluster de processamento que realiza as previsões;
  • em incrementos de um minuto;
  • com base em uma taxa por hora do node, conforme mostrado na tabela acima;
  • no mínimo 10 minutos por job de previsão.

Horas do node

Para executar seu modelo de previsão, o Cloud ML Engine usa recursos de processamento on-line chamados nodes. Pense em um node como uma máquina virtual. O Cloud ML Engine escalona o número de nodes usados para acomodar o trabalho, tanto na previsão on-line quanto em lote.

Você é cobrado pelo tempo em que seu modelo está sendo executado em um node, inclusive:

  • ao processar um job de previsão em lote;
  • ao processar uma solicitação de previsão on-line;
  • quando seu modelo está pronto para veicular previsões on-line.

Veja a seguir o que se aplica à previsão em lote:

  • A prioridade do escalonamento é reduzir o tempo total decorrido do job.
  • O escalonamento precisa ter pouco efeito sobre o preço do seu job, mesmo que haja alguns gastos indiretos envolvidos na criação de um novo node.
  • Você pode simular o escalonamento com a definição de um número máximo de nodes a ser usado para um job de previsão em lote e do número de nodes que continuará em execução em um modelo quando ele for implantado.

Veja a seguir o que se aplica à previsão on-line:

  • A prioridade do escalonamento é reduzir a latência das solicitações individuais.
  • O serviço mantém seu modelo pronto em um estado de inatividade por alguns minutos após veicular uma solicitação.
  • O escalonamento afeta suas taxas totais a cada mês: quanto mais frequentes forem suas solicitações, mais nodes serão usados.
  • Você pode permitir o escalonamento do serviço em resposta ao tráfego (escalonamento automático) ou especificar uma série de nodes a serem executados constantemente para evitar latência.
  • Se você escolher o escalonamento automático, o número de nodes é dimensionado automaticamente e pode ser reduzido a zero em períodos sem tráfego.
  • Se optar por especificar um número de nodes em vez de fazer o escalonamento automático, você será cobrado por todo o tempo em que os nodes estiverem em execução, desde o momento da implantação até aquele em que a versão do modelo for excluída.

A previsão on-line usa máquinas de núcleo único sem GPUs ou outros aceleradores.

Saiba mais sobre alocação e escalonamento de nodes no guia de previsão.

Exemplos de cálculos de previsão

Use a fórmula abaixo para calcular seu custo de previsão por um mês:

(Price per hour / 60) * job duration in node minutes

Exemplo:

  • Uma empresa imobiliária dos Estados Unidos realiza uma previsão semanal de valores de habitação nas áreas em que trabalha. Em um mês, eles realizaram previsões por quatro semanas em lotes de 3920, 4277, 3849 e 3961. As previsões levam em média 0.72 segundos de processamento por node.

    O custo de processamento é definido por job (este exemplo usa a média, mas os custos reais usam valores exatos para cada job):

    3920 * 0.72 = 47.04 minutes
    4277 * 0.72 = 51.324 minutes
    3849 * 0.72 = 46.188 minutes
    3961 * 0.72 = 47.532 minutes
    

    Cada job leva mais de dez minutos, portanto, é cobrado por minuto de processamento:

    ($0.09262 / 60) * 48 = $0.0741
    ($0.09262 / 60) * 52 = $0.08027
    ($0.09262 / 60) * 47 = $0.07255
    ($0.09262 / 60) * 48 = $0.0741
    

    O resultado é uma taxa total de US$ 0,30 para o mês.

O número de minutos mostrado nos exemplos não corresponde ao tempo real decorrido. Tanto a previsão em lote quanto a on-line usam uma ou mais máquinas para processar os dados. Portanto, o tempo decorrido real é geralmente menor do que o tempo expresso em horas ou minutos do node.

Uso obrigatório do Google Cloud Storage

Além dos custos descritos neste documento, é necessário armazenar dados e arquivos de programas nos intervalos do Google Cloud Storage durante o ciclo de vida do Cloud ML Engine. Esse armazenamento está sujeito à política de preços do Cloud Storage.

O uso obrigatório do Cloud Storage inclui:

  • preparação do pacote de aplicativos de treinamento ao treinar seu modelo;

  • armazenamento dos dados de entrada do treinamento;

  • preparação dos arquivos modelo quando você estiver pronto para implantar uma versão;

  • armazenamento dos dados de entrada para a previsão em lote;

  • armazenamento do resultado dos jobs de previsão em lote. O Cloud ML Engine não requer o armazenamento a longo prazo desses itens. Você pode remover os arquivos assim que a operação for concluída;

  • armazenamento do resultado dos jobs de treinamento. O Cloud ML Engine não requer o armazenamento a longo prazo desses itens. Você pode remover os arquivos assim que a operação for concluída.

Operações gratuitas para gerenciar seus recursos

As operações de gerenciamento de recursos fornecidas pelo Cloud ML Engine são gratuitas. A política de cotas do Cloud ML Engine limita algumas dessas operações.

Recurso Operações gratuitas
modelos criar, conseguir, listar, excluir
versões criar, conseguir, listar, excluir, setDefault
jobs conseguir, listar, cancelar
operações conseguir, listar, cancelar, excluir

Próximas etapas

Esta página foi útil? Conte sua opinião sobre:

Enviar comentários sobre…