Assista ao Data Cloud Summit sob demanda e saiba mais sobre as inovações mais recentes em análise, IA, BI e bancos de dados.
Integração de dados nativos da nuvem totalmente gerenciada e em qualquer escala.
Novos clientes ganham US$ 300 em créditos para gastar no Data Fusion. Todos os clientes recebem as primeiras 120 horas de desenvolvimento de pipeline sem custo financeiro por mês, sem cobrança de créditos.
Interface visual do tipo "apontar e clicar" que possibilita a implantação de pipelines de dados ETL/ELT sem código
Ampla biblioteca de mais de 150 conectores e transformações pré-configurados sem custo adicional
Os melhores serviços do Google Cloud integrados nativamente
Linhagem de dados completa para causa raiz e análise de impacto
Desenvolvido com um núcleo de código aberto (CDAP) para portabilidade de pipelines
Vantagens
Evite gargalos técnicos e aumente a produtividade
A interface intuitiva do tipo "arraste e solte", os conectores pré-criados e o modelo de autoatendimento de integração de dados sem código do Data Fusion removem gargalos técnicos de acordo com a especialidade e aceleram o tempo de geração de insights.
Reduza o custo total de propriedade do pipeline
Uma abordagem sem servidor utiliza a escalonabilidade e a confiabilidade dos serviços do Google, como o Serviço Gerenciado para Apache Spark e o Data Fusion, e oferece as melhores funcionalidades de integração de dados com um custo total de propriedade reduzido.
Desenvolvido com uma fundação de governança de dados
Com recursos integrados, como linhagem de dados completa, metadados de integração, segurança nativa da nuvem e serviços de proteção de dados, o Data Fusion auxilia equipes com análise de causa raiz ou de impacto e compliance.
Principais recursos
O Data Fusion foi criado pelo uso de um projeto de código aberto CDAP e o núcleo aberto garante a portabilidade de pipelines de dados aos usuários. A ampla integração do CDAP com plataformas de nuvem no local e em nuvens públicas proporciona aos usuários do Cloud Data Fusion a capacidade de dividir os silos e de fornecer insights que eram inacessíveis.
A integração nativa do Data Fusion com o Google Cloud simplifica a segurança de dados e garante a disponibilidade imediata dos dados para análise. É fácil e rápido desenvolver e iterar usando a integração do Cloud Data Fusion, seja para organizar um data lake com o Cloud Storage e o Serviço Gerenciado para Apache Spark, transferir dados para o BigQuery para armazenamento em data warehouse ou transformar dados para destiná-los a um armazenamento relacional, como o Spanner.
O Cloud Data Fusion oferece transformações pré-criadas para processamento em lote e em tempo real. Ele permite criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas entre as equipes. Isso estabelece uma base de engenharia de dados colaborativa e aumenta a produtividade. Assim, o tempo de espera é menor para os desenvolvedores ETL e engenheiros de dados e, o mais importante, o esforço para criar códigos de qualidade é menor.
O que há de novo
Inscreva-se na newsletter do Google Cloud para receber atualizações de produtos, informações sobre eventos, ofertas especiais e muito mais.
Documentação
Casos de uso
Com o Cloud Data Fusion, os usuários podem criar data lakes escalonáveis e distribuídos no Google Cloud ao integrar dados de plataformas locais isoladas. Os consumidores podem usar o escalonamento da nuvem para centralizar dados e, como resultado, torná-los mais produtivos. A capacidade de autoatendimento do Cloud Data Fusion aumenta a visibilidade do processo e diminui o custo geral do suporte operacional.
O Cloud Data Fusion ajuda organizações a entenderem melhor os clientes ao decompor silos de dados e ativar o desenvolvimento de soluções rápidas de armazenamento de dados em warehouse baseado em nuvem no BigQuery. Uma visualização confiável e unificada sobre o engajamento do cliente e o comportamento possibilita a criação de uma experiência do cliente melhor, o que gera mais retenção e receita por cliente.
Atualmente, muitos usuários querem estabelecer um ambiente de análise unificado usando uma série de data marts caros e no local. Empregar uma série de ferramentas desconectadas e medidas temporárias gera desafios relacionados à segurança e à qualidade dos dados. A vasta variedade de conectores, interfaces visuais e abstrações centralizadas na lógica de negócios do Cloud Data Fusion ajuda a diminuir o custo total de propriedade (TCO), promover o autoatendimento e a padronização e reduzir o trabalho repetitivo.
Todos os recursos
| Autoatendimento sem código | Elimine gargalos ao autorizar usuários "não profissionais" por meio de uma interface gráfica sem código que oferece uma integração de dados do tipo "apontar e clicar". |
| Engenharia de dados colaborativa | O Cloud Data Fusion oferece a capacidade de criar uma biblioteca interna de conexões e transformações personalizadas que podem ser validadas, compartilhadas e reutilizadas em uma organização. |
| Nativo do Google Cloud | A arquitetura nativa e totalmente gerenciada do Google Cloud proporciona escalonabilidade, confiabilidade, segurança e privacidade. |
| Integração de dados em tempo real | Replique bancos de dados transacionais e operacionais, como SQL Server, Oracle e MySQL, diretamente no BigQuery com apenas alguns cliques usando o recurso de replicação do Data Fusion. A integração com o Datastream permite enviar fluxos de alterações ao BigQuery para análise contínua. Use a avaliação de viabilidade para iterações de desenvolvimento mais rápidas e monitoramento de desempenho/integridade para observabilidade. |
| Integração em lote | Projete, execute e opere grandes volumes de pipelines de dados periodicamente com suporte para fontes de dados conhecidas, incluindo sistemas de arquivos, armazenamentos de objetos, bancos de dados relacionais e NoSQL, sistemas SaaS e mainframes. |
| Segurança de nível empresarial | A integração com o Cloud Identity and Access Management (IAM), IP privado, VPC-SC e CMEK proporciona segurança empresarial e diminui riscos ao assegurar conformidade e proteção de dados. |
| Linhagem e metadados de integração | Use metadados técnicos e comerciais para pesquisar conjuntos de dados integrados. Acompanhe a linhagem de todos os conjuntos de dados integrados no nível de conjunto de dados e de campo. |
| Operações perfeitas | É fácil operar nos ambientes mais importantes usando APIs REST, programações com base em tempo, acionadores de pipeline com base em estado, registros, métricas e painéis de monitoramento. |
| Kit de ferramentas de integração abrangente | Uma experiência de integração de dados abrangente é possível graças aos conectores integrados compatíveis com vários sistemas modernos e legados, transformações sem código, condicionais e pré/pós-processamento, alertas e notificações e processamento de erros. |
| Capacitação híbrida | O código aberto proporciona a flexibilidade e a portabilidade necessárias para criar soluções de integração de dados padronizadas em ambientes híbridos e multicloud. |
Preços
Os preços do Cloud Data Fusion são detalhados por:
1. Custo de design: baseado no número de horas em que uma instância está em execução, e não no número de pipelines em desenvolvimento e execução. A edição Basic também inclui as 120 primeiras horas por mês por conta sem custo.
2. Custo de processamento: o custo dos clusters do Serviço Gerenciado para Apache Spark usados para executar os pipelines.
Edição | Valor por hora de instância do Cloud Data Fusion | Número de pipelines simultâneos compatíveis | Número compatível de usuários |
|---|---|---|---|
Desenvolvedor | US$ 0,35 | 2 (Recomendado) | 2 (Recomendado) |
Básico | US$ 1,80 | Ilimitado | Ilimitado |
Enterprise | US$ 4,20 | Ilimitado | Ilimitado |
Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos, tudo isso sem custo financeiro.