Guide de migration de Netezza vers BigQuery

Ce document fournit des conseils généraux aux entreprises qui migrent de Netezza vers BigQuery. Il explique comment les entreprises peuvent repenser leur modèle de données et leurs processus d'extraction, de transformation et de chargement (ETL, Extract-Transform-Load) existants afin d'exploiter tout le potentiel de BigQuery.

Introduction

Depuis des décennies, les grandes entreprises font appel à des systèmes tels que Netezza pour faciliter le stockage et l'analyse d'énormes quantités de données. Bien que ces systèmes soient puissants, ils nécessitent d'importants investissements en matériel, en maintenance et en licence. En outre, à mesure que le nombre de sources de données et le volume de données augmentent, les entreprises sont confrontées à des défis concernant la gestion des nœuds, le volume de données par source, les coûts d'archivage et l'évolutivité globale du système.

C'est la raison pour laquelle de plus en plus d'entreprises se tournent vers BigQuery pour répondre à leurs besoins d'entrepôt de données d'entreprise dans le cloud. BigQuery est l'entrepôt de données d'entreprise sans serveur, à l'échelle du pétaoctet et entièrement géré de Google. Vous n'avez aucune infrastructure à gérer, et vous n'avez pas besoin d'un administrateur de base de données. Vous pouvez vous concentrer sur l'analyse des données pour dégager des insights pertinents grâce au langage SQL qui vous est familier.

BigQuery peut analyser des milliards de lignes, sans index, en quelques dizaines de secondes. Il s'agit d'un service cloud de requête massivement parallèle, qui partage l'infrastructure de Google. Il peut ainsi charger chaque requête en parallèle et l'exécuter simultanément sur des dizaines de milliers de serveurs. Les deux technologies principales qui différencient BigQuery sont le stockage en colonnes et l'architecture sous forme d'arborescence :

  • Stockage en colonnes : les données sont stockées dans des colonnes plutôt que dans des lignes, ce qui permet d'atteindre un taux de compression et un débit d'analyse très élevés.
  • Architecture sous forme d'arborescence : les requêtes sont distribuées, et les résultats sont agrégés sur des milliers de machines en quelques secondes.

L'architecture technique de BigQuery est expliquée plus en détail dans le document Dans les coulisses de Google BigQuery.

Pour consulter le document dans son intégralité, cliquez sur le bouton ci-dessous :

Télécharger le PDF