Guia de migração do Netezza para o BigQuery

Neste documento, forneceremos orientação de alto nível para organizações em processo de migração do Netezza para o BigQuery. Além disso, mostraremos como as organizações podem repensar os modelos de dados atuais e extrair, transformar e carregar (ETL) processos para aproveitar o BigQuery ao máximo.

Introdução

Há décadas, empresas de grande porte confiam em sistemas como o Netezza para ajudar no armazenamento e análise de grandes quantidades de dados. Embora eles sejam poderosos, exigem investimentos enormes em hardware, manutenção e licenciamento. Além disso, à medida que o número de fontes e o volume de dados aumentam, as organizações enfrentam desafios no gerenciamento de nós, no volume de dados por origem, nos custos de arquivamento e na escalonabilidade geral do sistema.

Como resultado, cada vez mais organizações estão avaliando o BigQuery para atender à necessidade de um armazenamento de dados corporativo baseado na nuvem. O BigQuery é um serviço sem servidor e totalmente gerenciado do Google para armazenamento de dados corporativo (EDW, na sigla em inglês) em escala de petabytes destinados à análise. Não há infraestrutura para gerenciar, e você não precisa de um administrador de banco de dados. Concentre-se na análise de dados para encontrar insights significativos com um SQL conhecido.

O BigQuery pode verificar bilhões de linhas, sem um índice, em dezenas de segundos. Ele é um serviço de consulta em paralelo e em nuvem que compartilha a infraestrutura do Google. Dessa forma, é possível carregar em paralelo todas as consultas e executá-las em milhares de servidores simultaneamente. As duas tecnologias essenciais que diferenciam o BigQuery são o armazenamento em colunas e a arquitetura de árvore:

  • Armazenamento em colunas: os dados são armazenados em colunas em vez de linhas, o que possibilita alcançar uma taxa de compactação e uma capacidade de verificação muito altas.
  • Arquitetura de árvore: as consultas são despachadas e os resultados são agregados em milhares de máquinas em poucos segundos.

A arquitetura técnica do BigQuery é explicada com mais detalhes em Um estudo do Google BigQuery (em inglês).

Para ler o documento completo, clique no botão:

Fazer download do PDF