Guía de migración de Netezza a BigQuery

En este documento, se proporciona una orientación general a las organizaciones que migran de Netezza a BigQuery. Además, se muestran formas en que las organizaciones pueden reconsiderar sus modelos de datos existentes y extraer, transformar y cargar (ETL) procesos para aprovechar BigQuery al máximo.

Introducción

Durante décadas, las organizaciones grandes se basaban en sistemas como Netezza para almacenar y analizar grandes cantidades de datos. Aunque estos sistemas son potentes, requieren grandes inversiones en hardware, mantenimiento y licencias. Además, a medida que aumenta la cantidad de fuentes de datos y el volumen de datos, las organizaciones enfrentan desafíos respecto de la administración de nodos, el volumen de datos por fuente, el costo del archivado y la escalabilidad general del sistema.

Como resultado, cada vez más organizaciones evalúan BigQuery para resolver su necesidad de tener un almacén de datos empresarial basado en la nube. BigQuery es el almacén de datos empresarial (EDW) completamente administrado, sin servidores y con escala de petabytes de Google para estadísticas. No hay infraestructura para administrar y no necesitas un administrador de base de datos. Puedes enfocarte en analizar los datos para encontrar estadísticas valiosas mediante el lenguaje SQL con el que estás familiarizado.

BigQuery puede analizar miles de millones de filas, sin un índice, en decenas de segundos. BigQuery es un servicio de consultas paralelo muy grande basado en la nube que comparte la infraestructura de Google, de modo que puede paralelizar cada consulta y ejecutarla en decenas de miles de servidores de manera simultánea. Las dos tecnologías principales que diferencian BigQuery son el almacenamiento de columnas y la arquitectura de árbol:

  • Almacenamiento en columnas: Los datos se almacenan en columnas en lugar de filas, lo que permite lograr una proporción de compresión y capacidad de procesamiento de análisis muy altas.
  • Arquitectura de árbol: Las consultas se despachan y los resultados se agregan en miles de máquinas en pocos segundos.

La arquitectura técnica de BigQuery se explica con más detalle en An Inside Look at Google BigQuery.

Para leer el documento completo, haz clic en el siguiente botón:

Descargar PDF