Cloud Data Fusion

Assista ao Data Cloud Summit sob demanda e saiba mais sobre as inovações mais recentes em análise, IA, BI e bancos de dados.

Ir para

Cloud Data Fusion

Integração de dados nativos da nuvem totalmente gerenciada e em qualquer escala.

Novos clientes ganham US$ 300 em créditos para gastar no Data Fusion. Todos os clientes recebem as primeiras 120 horas de desenvolvimento de pipeline sem custo financeiro por mês, sem cobrança de créditos.

Interface visual do tipo "apontar e clicar" que possibilita a implantação de pipelines de dados ETL/ELT sem código
Ampla biblioteca de mais de 150 conectores e transformações pré-configurados sem custo adicional
Os melhores serviços do Google Cloud integrados nativamente
Linhagem de dados completa para causa raiz e análise de impacto
Desenvolvido com um núcleo de código aberto (CDAP) para portabilidade de pipelines

Miniatura do vídeo: três pessoas subindo degraus. Ao fundo, há imagens de várias arquiteturas de armazenamento de dados

Introdução ao Cloud Data Fusion

1:54

Vantagens

Evite gargalos técnicos e aumente a produtividade

A interface intuitiva do tipo "arraste e solte", os conectores pré-criados e o modelo de autoatendimento de integração de dados sem código do Data Fusion removem gargalos técnicos de acordo com a especialidade e aceleram o tempo de geração de insights.

Reduza o custo total de propriedade do pipeline

Uma abordagem sem servidor utiliza a escalonabilidade e a confiabilidade dos serviços do Google, como o Serviço Gerenciado para Apache Spark e o Data Fusion, e oferece as melhores funcionalidades de integração de dados com um custo total de propriedade reduzido.

Desenvolvido com uma fundação de governança de dados

Com recursos integrados, como linhagem de dados completa, metadados de integração, segurança nativa da nuvem e serviços de proteção de dados, o Data Fusion auxilia equipes com análise de causa raiz ou de impacto e compliance.

Principais recursos

Núcleo aberto com integração híbrida e de várias nuvens

O Data Fusion foi criado pelo uso de um projeto de código aberto CDAP e o núcleo aberto garante a portabilidade de pipelines de dados aos usuários. A ampla integração do CDAP com plataformas de nuvem no local e em nuvens públicas proporciona aos usuários do Cloud Data Fusion a capacidade de dividir os silos e de fornecer insights que eram inacessíveis.

Integrado às ferramentas de Big Data líderes do setor do Google

A integração nativa do Data Fusion com o Google Cloud simplifica a segurança de dados e garante a disponibilidade imediata dos dados para análise. É fácil e rápido desenvolver e iterar usando a integração do Cloud Data Fusion, seja para organizar um data lake com o Cloud Storage e o Serviço Gerenciado para Apache Spark, transferir dados para o BigQuery para armazenamento em data warehouse ou transformar dados para destiná-los a um armazenamento relacional, como o Spanner.

Integração de dados por meio de colaboração e padronização

O Cloud Data Fusion oferece transformações pré-criadas para processamento em lote e em tempo real. Ele permite criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas entre as equipes. Isso estabelece uma base de engenharia de dados colaborativa e aumenta a produtividade. Assim, o tempo de espera é menor para os desenvolvedores ETL e engenheiros de dados e, o mais importante, o esforço para criar códigos de qualidade é menor.

Os benefícios econômicos do Data Fusion e as alternativas de integração de dados

Baixe o relatório (em inglês)

Clientes

Aprenda com clientes usando o Cloud Data Fusion

Blog post

A Liveramp escalona o gerenciamento de dados de identidade com o Cloud Data Fusion

Leitura de 5 minutos

Case study

O Star Media Group se transformou em um negócio de engajamento usando o Cloud Data Fusion.

Leitura de 5 minutos

O que há de novo

Veja as atualizações mais recentes

Inscreva-se na newsletter do Google Cloud para receber atualizações de produtos, informações sobre eventos, ofertas especiais e muito mais.

Video

Como transferir dados da SAP para o Google CloudAssista ao vídeo

Ícone da preparação de dados incorporada ao Data Fusion

Video

Preparação de dados incorporada com o Data FusionAssista ao vídeo

Blog post

TCO menor para gerenciar pipelines de dados em 80% com o Cloud Data FusionSaiba mais

Blog post

Conecte silos de dados com o Data FusionLeia o post

Ícone de captura de dados alterados em tempo real para replicação de dados no BigQuery

Blog post

Captura de dados alterados em tempo real para replicação de dados no BigQueryLeia o post

Melhor em conjunto: como orquestrar os pipelines do Data Fusion com o ícone do serviço gerenciado para Apache Airflow

Blog post

Melhor em conjunto: como orquestrar os pipelines do Data Fusion com o serviço gerenciado para Apache AirflowLeia o post

Documentação

Tutorial

Como ativar o Cloud Data Fusion

Saiba como ativar a API Cloud Data Fusion no seu projeto do Google Cloud.

Tutorial

Visão geral do conceito do Cloud Data Fusion

Saiba mais sobre os conceitos e recursos do Cloud Data Fusion.

Tutorial

Como explorar a linhagem de dados

Neste tutorial, mostramos como usar o Cloud Data Fusion para explorar a linhagem de dados: as origens e o movimento dos dados ao longo do tempo.

Tutorial

Como usar drivers JDBC com o Cloud Data Fusion

Descubra como usar drivers Java Database Connectivity (JDBC) com os pipelines do Cloud Data Fusion.

Tutorial

Data Engineering on Google Cloud

Saiba em primeira mão como projetar e criar sistemas de processamento de dados no Google Cloud neste curso de quatro dias orientado por um instrutor.

Não encontrou o que procura?

Notas de lançamento

Leia sobre as atualizações mais recentes do Cloud Data Fusion

Casos de uso

Caso de uso

Data lakes modernos e mais seguros no Google Cloud

Com o Cloud Data Fusion, os usuários podem criar data lakes escalonáveis e distribuídos no Google Cloud ao integrar dados de plataformas locais isoladas. Os consumidores podem usar o escalonamento da nuvem para centralizar dados e, como resultado, torná-los mais produtivos. A capacidade de autoatendimento do Cloud Data Fusion aumenta a visibilidade do processo e diminui o custo geral do suporte operacional.

Caso de uso

Armazenamento de dados ágil com o BigQuery

O Cloud Data Fusion ajuda organizações a entenderem melhor os clientes ao decompor silos de dados e ativar o desenvolvimento de soluções rápidas de armazenamento de dados em warehouse baseado em nuvem no BigQuery. Uma visualização confiável e unificada sobre o engajamento do cliente e o comportamento possibilita a criação de uma experiência do cliente melhor, o que gera mais retenção e receita por cliente.

Caso de uso

Ambiente de análise unificado

Atualmente, muitos usuários querem estabelecer um ambiente de análise unificado usando uma série de data marts caros e no local. Empregar uma série de ferramentas desconectadas e medidas temporárias gera desafios relacionados à segurança e à qualidade dos dados. A vasta variedade de conectores, interfaces visuais e abstrações centralizadas na lógica de negócios do Cloud Data Fusion ajuda a diminuir o custo total de propriedade (TCO), promover o autoatendimento e a padronização e reduzir o trabalho repetitivo.

Todos os recursos

Autoatendimento sem código	Elimine gargalos ao autorizar usuários "não profissionais" por meio de uma interface gráfica sem código que oferece uma integração de dados do tipo "apontar e clicar".
Engenharia de dados colaborativa	O Cloud Data Fusion oferece a capacidade de criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas em uma organização.
Nativo do Google Cloud	A arquitetura nativa e totalmente gerenciada do Google Cloud proporciona escalonabilidade, confiabilidade, segurança e privacidade.
Integração de dados em tempo real	Replique bancos de dados transacionais e operacionais, como SQL Server, Oracle e MySQL, diretamente no BigQuery com apenas alguns cliques usando o recurso de replicação do Data Fusion. A integração com o Datastream permite enviar fluxos de alterações ao BigQuery para análise contínua. Use a avaliação de viabilidade para iterações de desenvolvimento mais rápidas e monitoramento de desempenho/integridade para observabilidade.
Integração em lote	Projete, execute e opere grandes volumes de pipelines de dados periodicamente com suporte para fontes de dados conhecidas, incluindo sistemas de arquivos, armazenamentos de objetos, bancos de dados relacionais e NoSQL, sistemas SaaS e mainframes.
Segurança de nível empresarial	A integração com o Cloud Identity and Access Management (IAM), IP privado, VPC-SC e CMEK proporciona segurança empresarial e diminui riscos ao assegurar conformidade e proteção de dados.
Linhagem e metadados de integração	Use metadados técnicos e comerciais para pesquisar conjuntos de dados integrados. Acompanhe a linhagem de todos os conjuntos de dados integrados no nível de conjunto de dados e de campo.
Operações perfeitas	É fácil operar nos ambientes mais importantes usando APIs REST, programações com base em tempo, acionadores de pipeline com base em estado, registros, métricas e painéis de monitoramento.
Kit de ferramentas de integração abrangente	Uma experiência de integração de dados abrangente é possível graças aos conectores integrados compatíveis com vários sistemas modernos e legados, transformações sem código, condicionais e pré/pós-processamento, alertas e notificações e processamento de erros.
Capacitação híbrida	O código aberto proporciona a flexibilidade e a portabilidade necessárias para criar soluções de integração de dados padronizadas em ambientes híbridos e multicloud.

Preços

Os preços do Cloud Data Fusion são detalhados por:

1. Custo de design: baseado no número de horas em que uma instância está em execução, e não no número de pipelines em desenvolvimento e execução. A edição Basic também inclui as 120 primeiras horas por mês por conta sem custo.

2. Custo de processamento: o custo dos clusters do Serviço Gerenciado para Apache Spark usados para executar os pipelines.

Edição	Valor por hora de instância do Cloud Data Fusion	Número de pipelines simultâneos compatíveis	Número compatível de usuários
Desenvolvedor	US$ 0,35	2 (Recomendado)	2 (Recomendado)
Básico	US$ 1,80	Ilimitado	Ilimitado
Enterprise	US$ 4,20	Ilimitado	Ilimitado

Vá além

Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos, tudo isso sem custo financeiro.

Precisa de ajuda para começar?
Entre em contato com a equipe de vendas
Trabalhe com um parceiro confiável
Encontre um parceiro
Continue navegando
Ver todos os produtos

Evite gargalos técnicos e aumente a produtividade

Reduza o custo total de propriedade do pipeline

Desenvolvido com uma fundação de governança de dados

Principais recursos

Núcleo aberto com integração híbrida e de várias nuvens

Integrado às ferramentas de Big Data líderes do setor do Google

Integração de dados por meio de colaboração e padronização

Aprenda com clientes usando o Cloud Data Fusion

Veja as atualizações mais recentes

Documentação

Como ativar o Cloud Data Fusion

Visão geral do conceito do Cloud Data Fusion

Como explorar a linhagem de dados

Como usar drivers JDBC com o Cloud Data Fusion

Data Engineering on Google Cloud

Não encontrou o que procura?

Consulte mais documentos

Casos de uso

Data lakes modernos e mais seguros no Google Cloud

Armazenamento de dados ágil com o BigQuery

Ambiente de análise unificado

Todos os recursos

Preços

Vá além

Precisa de ajuda para começar?

Trabalhe com um parceiro confiável

Continue navegando