Este documento mostra como os preços do Cloud Data Fusion são determinados. Para ver os preços de outros produtos, leia a documentação de preços.
Os preços são determinados de acordo com o uso, que é medido pelo intervalo, em minutos, entre a criação e a exclusão de uma instância do Cloud Data Fusion. A taxa de preços é baseada em horas, mas o uso do Cloud Data Fusion é faturado por minuto. Isso é medido em horas (30 minutos são 0,5 hora, por exemplo) para aplicar preços por hora ao uso por minuto.
Se você não paga em dólar americano, valem os preços na sua moeda local listados na página SKUs do Google Cloud.
O preço do Cloud Data Fusion é dividido em duas funções: desenvolvimento e execução de pipelines.
Desenvolvimento
Para o desenvolvimento de pipelines, o Cloud Data Fusion oferece estas três edições:
Edição do Cloud Data Fusion | Preço (USD) |
|---|---|
Desenvolvedor | US$ 0,35 / 1 hour |
Básico | 0 hour to 120 hour Free per 1 month / account 120 hour and above US$ 1,80 / 1 hour, per 1 month / account |
Enterprise | US$ 4,20 / 1 hour |
A edição Basic oferece as primeiras 120 horas do mês por usuário sem custo financeiro.
Execução
Para a execução de pipelines, os clusters do Serviço Gerenciado para Apache Spark são cobrados. Esses clusters são criados no Cloud Data Fusion para executar pipelines nas taxas atuais do Serviço Gerenciado para Apache Spark.
Capacidade | Desenvolvedor | Básico | Enterprise |
|---|---|---|---|
Número de usuários simultâneos | 2 | Limitado* | Limitado* |
Cargas de trabalho | Desenvolvimento, exploração do produto | Testes, sandbox, prova de conceito | Produção |
Suporte a IP interno | ✓ | ✓ | ✓ |
Controle de acesso baseado em função (RBAC) | 🚫 | 🚫 | ✓ |
Designer visual | ✓ | ✓ | ✓ |
Ecossistema de conectores | ✓ | ✓ | ✓ |
Transformações visuais | ✓ | ✓ | ✓ |
Estruturado, não estruturado, semiestruturado | ✓ | ✓ | ✓ |
Pipelines de streaming | ✓ | ✓ | ✓ |
Linhagem de integração: nível de campo e de conjunto de dados | ✓ | ✓ | ✓ |
Integração com o Knowledge Catalog | ✓ | ✓ | ✓ |
Alta disponibilidade | Zonal | Regional | Regional |
Criar e personalizar perfis de computação | ✓ | ✓ | ✓ |
Suporte a DevOps: API REST, gerenciamento de controle de origem | ✓ | ✓ | ✓ |
Gatilhos e programações | ✓ | ✓ | ✓ |
Seleção do ambiente de execução | ✓ | ✓ | ✓ |
Execução de pipeline simultânea | 🚫 | Limitado** | Limitado** |
SDK do desenvolvedor para extensibilidade | ✓ | ✓ | ✓ |
* Usuários simultâneos: em geral, o Cloud Data Fusion aceita até 50 usuários por instância. Se o RBAC estiver ativado, o máximo é 25 usuários.
** A execução de pipeline simultânea é limitada e baseada na versão da instância usada. Para acessar detalhes sobre escalonabilidade, entre em contato com um representante do Google Cloud.
Além do custo de desenvolvimento de uma instância do Cloud Data Fusion,a cobrança será apenas pelos recursos usados para executar seus pipelines, como:
★ Para criar jobs de replicação, os preços de taxa fixa do BigQuery são recomendados, e não os preços sob demanda.
Atualmente, o preço do Cloud Data Fusion é o mesmo para todas as regiões compatíveis.
Região | Local |
|---|---|
africa-south1 * | Joanesburgo, África do Sul |
asia-east1 | Changhua County, Taiwan |
asia-east2 | Hong Kong |
asia-northeast1 | Tóquio, Japão |
asia-northeast2 | Osaka, Japão |
asia-northeast3 | Seul (Coreia do Sul) |
asia-south1 | Mumbai, Índia |
asia-south2 | Déli, Índia |
asia-southeast1 | Jurong West, Singapura |
asia-southeast2 | Jacarta, Indonésia |
australia-southeast1 | Sydney, Austrália |
europe-north1 | Hamina, Finlândia |
europe-southwest1 | Madri, Espanha |
europe-west1 | St. Ghislain, Bélgica |
europe-west2 | Londres, Inglaterra, Reino Unido |
europe-west3 | Frankfurt, Alemanha |
europe-west4 | Eemshaven, Países Baixos |
europe-west6 | Zurique, Suíça |
europe-west8 | Milão, Itália |
europe-west9 | Paris, França |
europe-west12* | Turim, Itália |
me-central1* | Doha, Catar |
me-central2* | Damã, Arábia Saudita |
me-west1 | Tel Aviv, Israel |
northamerica-northeast1 | Montreal, Quebec, Canadá |
northamerica-south1 | México |
southamerica-east1 | Osasco (São Paulo), Brasil |
southamerica-west1 | Santiago, Chile |
us-central1 | Council Bluffs, Iowa, América do Norte |
us-east1 | Moncks Corner, Carolina do Sul, América do Norte |
us-east4 | Ashburn, Virgínia do Norte, América do Norte |
us-east5 | Columbus, Ohio, América do Norte |
us-south1 | Dallas, Texas, América do Norte |
us-west1 | The Dalles, Oregon, América do Norte |
us-west2 | Los Angeles, Califórnia, América do Norte |
* A Linhagem de dados no Cloud Data Fusion não é compatível com africa-south1, me-central1, me-central1 ou europe-west12.
Suponha que uma instância do Cloud Data Fusion esteja em execução há 24 horas e não haja horas sem custo financeiro disponíveis para a edição Basic. De acordo com a edição, a taxa da instância do Cloud Data Fusion é resumida na tabela a seguir:
Edição | Custo por hora | Número de horas | Custo de desenvolvimento |
|---|---|---|---|
Desenvolvedor | US$ 0,35 | 24 | 24 x 0,35 = US$ 8,4 |
Básico | US$ 1,80 | 24 | 24 x 1,8 = US$ 43,2 |
Enterprise | US$ 4,20 | 24 | 24 x 4,2 = US$ 100,8 |
★ Observação:as instâncias do Cloud Data Fusion, depois de provisionadas, precisam estar sempre disponíveis. Depois de excluir as instâncias, elas não podem ser recuperadas e os dados do pipeline são perdidos. Para conferir os custos mensais estimados, consulte a Visão geral dos preços.
Durante esse período de 24 horas, você executou um pipeline que leu dados brutos do Cloud Storage, realizou transformações e gravou os dados no BigQuery a cada hora. Cada execução levou cerca de 15 minutos para ser concluída. Ou seja, os clusters do Serviço Gerenciado para Apache Spark criados para essas execuções estavam ativos por 15 minutos (0,25 hora) cada. Suponha que a configuração de cada cluster do Serviço Gerenciado para Apache Spark foi a seguinte:
Item | Tipo de máquina | CPUs virtuais | Disco permanente anexado | Número no cluster |
|---|---|---|---|---|
Nó mestre | n1-standard-4 | 4 | 500 GB | 1 |
Nó de trabalho | n1-standard-4 | 4 | 500 GB | 5 |
Cada cluster do Serviço Gerenciado para Apache Spark tem 24 CPUs virtuais, 4 para o mestre e 20 distribuídas pelos workers. Para fins de faturamento do Serviço Gerenciado para Apache Spark, o preço desse cluster baseia-se nas 24 CPUs virtuais e no tempo de execução dele.
Em todas as execuções do pipeline, o custo total incorrido para o Serviço Gerenciado para Apache Spark pode ser calculado como:
Cobrança do Serviço Gerenciado para Apache Spark = número de vCPUs * número de clusters * horas por cluster * preço do Serviço Gerenciado para Apache Spark
= 24 * 24 * 0,25 * US$ 0,01
= US $1,44
Os clusters do Serviço Gerenciado para Apache Spark usam outros produtos do Google Cloud, que são faturados separadamente. Especificamente, esses clusters têm custos para o Compute Engine e o espaço provisionado do disco permanente padrão. Você estará sujeito a custos de armazenamento para o Cloud Storage e para o BigQuery, dependendo da quantidade de dados que seu pipeline processa.
Para determinar esses custos extras com base nas taxas atuais, use a calculadora de faturamento.