Replicação integrada de bancos de dados relacionais diretamente para o BigQuery, permitindo insights quase em tempo real sobre dados operacionais.
Replicação de baixa latência para permitir insights quase em tempo real no BigQuery
Acesso a dados de streaming de bancos de dados MySQL, PostgreSQL, AlloyDB, SQL Server e Oracle.
Plataforma sem servidor com escalonamento automático, sem recursos para provisionar ou gerenciar
Configuração fácil de pipelines de ELT (extração, carregamento, transformação) com conectividade segura integrada
Usado por milhares de clientes para replicar seus dados operacionais no BigQuery
Vantagens
Replique dados dos bancos de dados MySQL, PostgreSQL, AlloyDB, SQL Server e Oracle diretamente no BigQuery, com baixa latência e sem afetar o desempenho da origem.
Elimine a sobrecarga operacional com uma abordagem sem servidor com escalonamento automático, sem infraestrutura para você gerenciar.
Uma experiência de configuração simplificada permite começar a replicar dados dos seus bancos de dados operacionais para o BigQuery em apenas algumas etapas.
Principais recursos
O Datastream usa a funcionalidade Change Data Capture (CDC) do BigQuery e a API Storage Write para replicar atualizações com eficiência diretamente dos sistemas de origem quase em tempo real. Você não precisa mais de soluções de replicação que desperdiçam recursos valiosos em pipelines de dados complexos, tabelas de preparo autogerenciadas, lógica de mesclagem complicada ou conversão manual de tipo de dados.
Com o Datastream, é possível começar a replicar dados no BigQuery em algumas etapas. Basta configurar seu banco de dados de origem, o tipo de conexão e o destino no BigQuery e pronto. O Datastream para BigQuery vai preencher os dados históricos e replicar continuamente novas alterações conforme elas ocorrerem.
O Datastream lê e entrega todas as alterações (inserir, atualizar e excluir) dos bancos de dados MySQL, PostgreSQL, AlloyDB, SQL Server e Oracle no BigQuery com latência mínima. O banco de dados de origem pode ser hospedado no local, em serviços do Google Cloud, como o Cloud SQL ou a Solução Bare Metal para Oracle, ou em qualquer outro lugar na nuvem. Um serviço nativo do Google e sem agente criado especificamente para o BigQuery, que transmite de maneira confiável todos os eventos que vão acontecendo.
À medida que os esquemas de origem mudam, o Datastream lida com o deslocamento de esquema com facilidade e replica automaticamente novas colunas e tabelas adicionadas na origem para o BigQuery.
O Datastream aceita vários métodos de conectividade particular e segura para proteger os dados em trânsito. Os dados também são criptografados em repouso.
Clientes
Casos de uso
O Datastream lê eventos de mudanças (inserções, atualizações e exclusões) de bancos de dados de origem e os grava nas tabelas do BigQuery quase em tempo real. Isso permite que você aprimore os armazenamentos de dados do BigQuery e modelos de ML com dados transacionais, como compras de varejo, para criar uma imagem completa mais completa dos dados. O Datastream vai preencher os dados históricos, replicar continuamente novas mudanças à medida que elas acontecem e processar alterações de esquema com facilidade.
Principais vantagens
Opção mais fácil para replicar dados operacionais para o BigQuery
Arquitetura sem servidor que faz o escalonamento automático para cima e para baixo
Interface única para visibilidade e monitoramento completos de pipelines de replicação
Solução personalizável com mais flexibilidade
Modelos pré-criados compatíveis com o Google para vários destinos
Integração de outros recursos, como qualidade de dados e mascaramento de dados
Interface simples para desenvolvedores de ETL e analistas de dados
Identificação de possíveis problemas e lacunas na replicação com antecedência
Insights quase em tempo real sobre o desempenho da replicação
Principais vantagens
Opção mais fácil para replicar dados operacionais para o BigQuery
Arquitetura sem servidor que faz o escalonamento automático para cima e para baixo
Interface única para visibilidade e monitoramento completos de pipelines de replicação
Principais vantagens
Solução personalizável com mais flexibilidade
Modelos pré-criados compatíveis com o Google para vários destinos
Integração de outros recursos, como qualidade de dados e mascaramento de dados
Principais vantagens
Interface simples para desenvolvedores de ETL e analistas de dados
Identificação de possíveis problemas e lacunas na replicação com antecedência
Insights quase em tempo real sobre o desempenho da replicação
Preços
Os preços do Datastream são baseados em dados reais processados. Os preços em níveis com base em volume estão disponíveis, o que o torna mais acessível quando você move volumes de dados maiores. Veja mais detalhes sobre preços na página de preços do Datastream.
Recursos adicionais, como o BigQuery, o Cloud Storage e o Dataflow, são cobrados de acordo com os preços desses serviços.
Comece a criar no Google Cloud com US$ 300 em créditos e mais de 20 produtos do programa Sempre gratuito.