Integração de dados nativos da nuvem totalmente gerenciada e em qualquer escala.
Novos clientes ganham US$ 300 em créditos para gastar no Data Fusion. Todos os clientes recebem as primeiras 120 horas de desenvolvimento de pipeline sem custos por mês, sem cobrança de créditos.
Interface visual do tipo "apontar e clicar" que possibilita a implantação de pipelines de dados ETL/ELT sem código
Ampla biblioteca com mais de 150 conectores e transformações pré-configurados sem custo adicional
Os melhores serviços do Google Cloud integrados nativamente
Linhagem de dados completa para causa raiz e análise de impacto
Desenvolvido com um núcleo de código aberto (CDAP, na sigla em inglês, link nesse mesmo idioma) para portabilidade de pipelines
Vantagens
A interface intuitiva do tipo "arraste e solte", os conectores pré-criados e o modelo de autoatendimento de integração de dados sem código do Data Fusion removem gargalos técnicos de acordo com a especialidade e aceleram o tempo de geração de insights.
Uma abordagem sem servidor utiliza a escalonabilidade e e a confiabilidade dos serviços do Google, como Dataproc e Data Fusion, e oferece as melhores funcionalidades de integração de dados com um custo total de propriedade reduzido.
Com recursos integrados, como linhagem de dados completa, metadados de integração, segurança nativa da nuvem e serviços de proteção de dados, o Data Fusion auxilia equipes com análise de causa raiz ou de impacto e compliance.
Principais recursos
O Data Fusion foi criado pelo uso de um projeto de código aberto CDAP e o núcleo aberto garante a portabilidade de pipelines de dados aos usuários. A ampla integração do CDAP com plataformas de nuvem públicas e e no local proporciona aos usuários do Cloud Data Fusion a capacidade de dividir os silos e fornecer insights que antes eram inacessíveis.
A integração nativa do Data Fusion com o Google Cloud simplifica a segurança de dados e garante a disponibilidade imediata dos dados para análise. É fácil e rápido desenvolver e iterar usando a integração do Cloud Data Fusion, seja para organizar um data lake com o Cloud Storage e o Dataproc, transferir dados para o BigQuery com o intuito de armazená-los ou transformar dados para destiná-los a um armazenamento relacional, como o Cloud Spanner.
O Cloud Data Fusion oferece transformações pré-criadas para processamento em lote e em tempo real. Ele permite criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas entre as equipes. Isso estabelece uma base de engenharia de dados colaborativa e aumenta a produtividade. Assim, o tempo de espera é menor para os desenvolvedores ETL e engenheiros de dados e, o mais importante, o esforço para criar códigos de qualidade é menor.
Clientes
O que há de novo
Inscreva-se na newsletter do Google Cloud para receber atualizações de produtos, informações sobre eventos, ofertas especiais e muito mais.
Documentação
Casos de uso
Com o Cloud Data Fusion, os usuários podem criar data lakes escalonáveis e distribuídos no Google Cloud ao integrar dados de plataformas locais isoladas. Os clientes podem usar o escalonamento da nuvem para centralizar dados e, como resultado, torná-los mais produtivos. A capacidade de autoatendimento do Cloud Data Fusion aumenta a visibilidade do processo e diminui o custo geral do suporte operacional.
O Cloud Data Fusion ajuda organizações a entenderem melhor os clientes ao decompor silos de dados e ativar o desenvolvimento de soluções rápidas de armazenamento de dados baseado em nuvem no BigQuery. Uma visão confiável e unificada sobre o comportamento e engajamento do cliente possibilita a criação de uma experiência melhor para ele, o que gera mais retenção e receita por cliente.
Atualmente, muitos usuários querem estabelecer um ambiente de análise unificado usando uma série de data marts caros e locais. Empregar uma série de ferramentas desconectadas e medidas temporárias gera desafios relacionados à segurança e à qualidade dos dados. A enorme variedade de conectores, interfaces visuais e abstrações centralizadas na lógica dos negócios do Cloud Data Fusion ajuda a diminuir o custo total de propriedade (TCO, na sigla em inglês), promover o autoatendimento e e a padronização e reduzir o trabalho repetitivo.
Todos os recursos
Autoatendimento sem código | Elimine gargalos ao autorizar usuários sem conhecimento técnico por meio de uma interface gráfica sem código que oferece uma integração de dados do tipo "apontar e clicar". |
Engenharia de dados colaborativa | O Cloud Data Fusion oferece a capacidade de criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas em uma organização. |
Nativo do Google Cloud | A arquitetura nativa e totalmente gerenciada do Google Cloud disponibiliza os recursos de escalonabilidade, confiabilidade, segurança e privacidade do Google Cloud. |
Integração de dados em tempo real | Replique bancos de dados transacionais e operacionais, como SQL Server, Oracle e MySQL, diretamente no BigQuery com apenas alguns cliques usando o recurso de replicação do Data Fusion. A integração com o Datastream permite enviar fluxos de alterações ao BigQuery para análise contínua. Use a avaliação de viabilidade para iterações de desenvolvimento mais rápidas e monitoramento de desempenho/integridade para observabilidade. |
Integração em lote | Projete, execute e opere grandes volumes de pipelines de dados periodicamente com suporte para fontes de dados conhecidas, incluindo sistemas de arquivos, armazenamentos de objetos, bancos de dados relacionais e NoSQL, sistemas SaaS e mainframes. |
Segurança de nível empresarial | A integração com o Cloud Identity and Access Management (IAM), IP privado, VPC-SC e CMEK proporciona segurança empresarial e diminui riscos ao assegurar a conformidade e a proteção de dados. |
Linhagem e metadados de integração | Faça pesquisas em conjuntos de dados integrados para capturar metadados técnicos e comerciais. Acompanhe a linhagem de todos os conjuntos de dados integrados no nível de campo e conjunto de dados. |
Operações perfeitas | É mais fácil operar nos ambientes essenciais usando APIs REST, programações com base em tempo, gatilhos de pipelines com base em estado, painéis de monitoramento, registros e métricas. |
Kit de ferramentas de integração abrangente | conectores integrados compatíveis com vários sistemas modernos e legados, transformações sem código, condicionais e pré/pós- processamento, alertas e notificações e processamento de erros. |
Capacitação híbrida | O código aberto proporciona a flexibilidade e a portabilidade necessárias para criar soluções de integração de dados padronizadas em ambientes híbridos e de várias nuvens. |
Preços
Os preços do Cloud Data Fusion são detalhados por:
1. Custo de design: baseado no número de horas em que uma instância está em execução, e não no número de pipelines em desenvolvimento e execução. A edição Basic também inclui as 120 primeiras horas por mês por conta sem custo.
2. Custo de processamento: o custo dos clusters do Dataproc usados para executar os pipelines.
Edição | Valor por instância/hora do Cloud Data Fusion | Número de pipelines simultâneos compatíveis | Número compatível de usuários |
---|---|---|---|
Developer | US$ 0,35 | 2 (recomendado) | 2 (recomendado) |
Básico | US$ 1,80 | Ilimitado | Ilimitado |
Enterprise | US$ 4,20 | Ilimitado | Ilimitado |
Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.