Assista ao Data Cloud Summit sob demanda e saiba mais sobre as inovações mais recentes em análise, IA, BI e bancos de dados.

Ir para
Cloud Data Fusion

Cloud Data Fusion

Integração de dados nativos da nuvem totalmente gerenciada e em qualquer escala.

Novos clientes ganham US$ 300 em créditos para gastar no Data Fusion. Todos os clientes recebem as primeiras 120 horas de desenvolvimento de pipeline sem custo financeiro por mês, sem cobrança de créditos.

  • Interface visual do tipo "apontar e clicar" que possibilita a implantação de pipelines de dados ETL/ELT sem código

  • Ampla biblioteca de mais de 150 conectores e transformações pré-configurados sem custo adicional

  • Os melhores serviços do Google Cloud integrados nativamente

  • Linhagem de dados completa para causa raiz e análise de impacto

  • Desenvolvido com um núcleo de código aberto (CDAP) para portabilidade de pipelines

Vantagens

Evite gargalos técnicos e aumente a produtividade

A interface intuitiva do tipo "arraste e solte", os conectores pré-criados e o modelo de autoatendimento de integração de dados sem código do Data Fusion removem gargalos técnicos de acordo com a especialidade e aceleram o tempo de geração de insights.

Reduza o custo total de propriedade do pipeline

Uma abordagem sem servidor utiliza a escalonabilidade e a confiabilidade dos serviços do Google, como o Serviço Gerenciado para Apache Spark e o Data Fusion, e oferece as melhores funcionalidades de integração de dados com um custo total de propriedade reduzido.

Desenvolvido com uma fundação de governança de dados

Com recursos integrados, como linhagem de dados completa, metadados de integração, segurança nativa da nuvem e serviços de proteção de dados, o Data Fusion auxilia equipes com análise de causa raiz ou de impacto e compliance.

Principais recursos

Principais recursos

Núcleo aberto com integração híbrida e de várias nuvens

O Data Fusion foi criado pelo uso de um projeto de código aberto CDAP e o núcleo aberto garante a portabilidade de pipelines de dados aos usuários. A ampla integração do CDAP com plataformas de nuvem no local e em nuvens públicas proporciona aos usuários do Cloud Data Fusion a capacidade de dividir os silos e de fornecer insights que eram inacessíveis.

Integrado às ferramentas de Big Data líderes do setor do Google

A integração nativa do Data Fusion com o Google Cloud simplifica a segurança de dados e garante a disponibilidade imediata dos dados para análise. É fácil e rápido desenvolver e iterar usando a integração do Cloud Data Fusion, seja para organizar um data lake com o Cloud Storage e o Serviço Gerenciado para Apache Spark, transferir dados para o BigQuery para armazenamento em data warehouse ou transformar dados para destiná-los a um armazenamento relacional, como o Spanner.

Integração de dados por meio de colaboração e padronização

O Cloud Data Fusion oferece transformações pré-criadas para processamento em lote e em tempo real. Ele permite criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas entre as equipes. Isso estabelece uma base de engenharia de dados colaborativa e aumenta a produtividade. Assim, o tempo de espera é menor para os desenvolvedores ETL e engenheiros de dados e, o mais importante, o esforço para criar códigos de qualidade é menor.

Documentação

Documentação

Tutorial

Como ativar o Cloud Data Fusion

Saiba como ativar a API Cloud Data Fusion no seu projeto do Google Cloud.

Tutorial

Visão geral do conceito do Cloud Data Fusion

Saiba mais sobre os conceitos e recursos do Cloud Data Fusion.

Tutorial

Como explorar a linhagem de dados

Neste tutorial, mostramos como usar o Cloud Data Fusion para explorar a linhagem de dados: as origens e o movimento dos dados ao longo do tempo.

Tutorial

Como usar drivers JDBC com o Cloud Data Fusion

Descubra como usar drivers Java Database Connectivity (JDBC) com os pipelines do Cloud Data Fusion.

Tutorial

Data Engineering on Google Cloud

Saiba em primeira mão como projetar e criar sistemas de processamento de dados no Google Cloud neste curso de quatro dias orientado por um instrutor.

Não encontrou o que procura?

Casos de uso

Casos de uso

Caso de uso
Data lakes modernos e mais seguros no Google Cloud

Com o Cloud Data Fusion, os usuários podem criar data lakes escalonáveis e distribuídos no Google Cloud ao integrar dados de plataformas locais isoladas. Os consumidores podem usar o escalonamento da nuvem para centralizar dados e, como resultado, torná-los mais produtivos. A capacidade de autoatendimento do Cloud Data Fusion aumenta a visibilidade do processo e diminui o custo geral do suporte operacional.

Caso de uso
Armazenamento de dados ágil com o BigQuery

O Cloud Data Fusion ajuda organizações a entenderem melhor os clientes ao decompor silos de dados e ativar o desenvolvimento de soluções rápidas de armazenamento de dados em warehouse baseado em nuvem no BigQuery. Uma visualização confiável e unificada sobre o engajamento do cliente e o comportamento possibilita a criação de uma experiência do cliente melhor, o que gera mais retenção e receita por cliente.

Caso de uso
Ambiente de análise unificado

Atualmente, muitos usuários querem estabelecer um ambiente de análise unificado usando uma série de data marts caros e no local. Empregar uma série de ferramentas desconectadas e medidas temporárias gera desafios relacionados à segurança e à qualidade dos dados. A vasta variedade de conectores, interfaces visuais e abstrações centralizadas na lógica de negócios do Cloud Data Fusion ajuda a diminuir o custo total de propriedade (TCO), promover o autoatendimento e a padronização e reduzir o trabalho repetitivo.

Todos os recursos

Todos os recursos

Autoatendimento sem código

Elimine gargalos ao autorizar usuários "não profissionais" por meio de uma interface gráfica sem código que oferece uma integração de dados do tipo "apontar e clicar".

Engenharia de dados colaborativa

O Cloud Data Fusion oferece a capacidade de criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas em uma organização.

Nativo do Google Cloud

A arquitetura nativa e totalmente gerenciada do Google Cloud proporciona escalonabilidade, confiabilidade, segurança e privacidade.

Integração de dados em tempo real

Replique bancos de dados transacionais e operacionais, como SQL Server, Oracle e MySQL, diretamente no BigQuery com apenas alguns cliques usando o recurso de replicação do Data Fusion. A integração com o  Datastream permite enviar fluxos de alterações ao BigQuery para análise contínua. Use a avaliação de viabilidade para iterações de desenvolvimento mais rápidas e monitoramento de desempenho/integridade para observabilidade.

Integração em lote

Projete, execute e opere grandes volumes de pipelines de dados periodicamente com suporte para fontes de dados conhecidas, incluindo sistemas de arquivos, armazenamentos de objetos, bancos de dados relacionais e NoSQL, sistemas SaaS e mainframes.

Segurança de nível empresarial

A integração com o Cloud Identity and Access Management (IAM), IP privado, VPC-SC e CMEK proporciona segurança empresarial e diminui riscos ao assegurar conformidade e proteção de dados.

Linhagem e metadados de integração

Use metadados técnicos e comerciais para pesquisar conjuntos de dados integrados. Acompanhe a linhagem de todos os conjuntos de dados integrados no nível de conjunto de dados e de campo.

Operações perfeitas

É fácil operar nos ambientes mais importantes usando APIs REST, programações com base em tempo, acionadores de pipeline com base em estado, registros, métricas e painéis de monitoramento.

Kit de ferramentas de integração abrangente

Uma experiência de integração de dados abrangente é possível graças aos conectores integrados compatíveis com vários sistemas modernos e legados, transformações sem código, condicionais e pré/pós-processamento, alertas e notificações e processamento de erros.

Capacitação híbrida

O código aberto proporciona a flexibilidade e a portabilidade necessárias para criar soluções de integração de dados padronizadas em ambientes híbridos e multicloud.

Preços

Preços

Os preços do Cloud Data Fusion são detalhados por:  

1. Custo de design: baseado no número de horas em que uma instância está em execução, e não no número de pipelines em desenvolvimento e execução. A edição Basic também inclui as 120 primeiras horas por mês por conta sem custo.

2. Custo de processamento: o custo dos clusters do Serviço Gerenciado para Apache Spark usados para executar os pipelines.

Edição

Valor por hora de instância do Cloud Data Fusion

Número de pipelines simultâneos compatíveis

Número compatível de usuários

Desenvolvedor

US$ 0,35

2 (Recomendado)

2 (Recomendado)

Básico

US$ 1,80

Ilimitado

Ilimitado

Enterprise

US$ 4,20

Ilimitado

Ilimitado

Vá além

Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos, tudo isso sem custo financeiro.

Cloud Data Fusion
Google Cloud