Visão geral do Datastream

Visão geral

O Datastream é um serviço de replicação de dados e captura de dados de alteração (CDC, na sigla em inglês) fácil de usar e sem uso. Ele permite sincronizar dados em bancos de dados e aplicativos heterogêneos de maneira confiável, com latência e tempo de inatividade mínimos.

O Datastream é compatível com streaming de bancos de dados Oracle e MySQL para o Cloud Storage. O serviço oferece integração simplificada com modelos do Dataflow para potencializar as visualizações materializadas atualizadas no BigQuery para análise, replicar bancos de dados no Cloud SQL ou Cloud Spanner para sincronização do banco de dados ou aproveitar o fluxo de eventos diretamente do Cloud Storage para realizar arquiteturas orientadas a eventos.

Veja os benefícios do Datastream:

  • Ser sem servidor, para que não haja recursos para provisionar ou gerenciar, e o serviço seja escalonado verticalmente e reduzido automaticamente, conforme necessário, com tempo de inatividade mínimo.
  • Configuração fácil de usar e experiências de monitoramento que aceleram o retorno do investimento.
  • Integração com o melhor do portfólio de serviços de dados do Google Cloud para integração de dados no Datastream, Dataflow, Cloud Data Fusion, Pub/Sub, BigQuery e muito mais.
  • Sincronização e unificação de fluxos de dados em bancos de dados e aplicativos heterogêneos.
  • Segurança, com opções de conectividade privada e a segurança que você espera do Google Cloud.
  • É preciso e confiável, com relatórios de status transparentes e flexibilidade de processamento robusta diante de mudanças de dados e esquemas.
  • Compatibilidade com vários casos de uso, incluindo análise, replicação de banco de dados e sincronização para migrações e configurações de nuvem híbrida, e para a criação de arquiteturas orientadas a eventos.

Casos de uso

Os recursos de streaming do Datastream permitem vários casos de uso:

  • Replicação e sincronização de dados em toda a organização com latência mínima

    É possível sincronizar dados em bancos de dados e aplicativos heterogêneos de maneira confiável, com baixa latência e um impacto mínimo no desempenho da sua origem. Aproveite o poder dos fluxos de dados para análises, replicação de bancos de dados, migração para a nuvem e arquiteturas orientadas a eventos em ambientes híbridos.

  • Aumente ou reduza a escala com uma arquitetura sem servidor

    Comece a trabalhar rapidamente com um serviço sem servidor e fácil de usar que faz o escalonamento sem interrupções conforme os volumes de dados mudam. Concentre-se em gerar insights atualizados com base nos seus dados e responder a problemas de alta prioridade, em vez de gerenciar a infraestrutura, o ajuste de desempenho ou o provisionamento de recursos.

  • Integração com o pacote de integração de dados do Google Cloud

    Conecte dados em toda a organização com o pacote de produtos de integração de dados do Google Cloud. O Datastream utiliza modelos do Dataflow para carregar dados no BigQuery, Cloud Spanner e Cloud SQL e alimenta os conectores do CDC Replicator do Cloud Data Fusion para um pipeline de dados mais fácil do que nunca.

Elementos de experiência

Há três elementos principais que compõem o Datastream:

  • As configurações de conectividade privada permitem que o Datastream se comunique com uma fonte de dados em uma rede privada (internamente no Google Cloud ou com fontes externas conectadas por VPN ou Interconnect). Essa comunicação acontece por meio de uma conexão de peering de nuvem privada virtual (VPC).
  • Perfis de conexão representam as informações de conectividade para uma origem e para o destino. Essas informações serão usadas por um stream.
  • Streams usam as informações nos perfis de conexão para transferir os dados do CDC e de preenchimento da origem para o destino.