Netezza から BigQuery への移行ガイド

このドキュメントは、Netezza から BigQuery に移行する組織に対する全体的なガイダンスを提供します。このドキュメントでは、組織が既存のデータモデルと ETL(抽出、変換、読み込み)プロセスを見直し、BigQuery を最大限に活用する方法について説明します。

はじめに

何十年もの間、大規模組織は Netezza のようなシステムを利用して、大量のデータを保存し、分析してきました。これらのシステムは強力ですが、ハードウェア、メンテナンス、ライセンスに多額の投資が必要になります。また、データソースの数とデータ量が増加するにつれて、ノード管理、ソースあたりのデータ量、アーカイブのコスト、システムの全体的なスケーラビリティといった課題に、組織は直面します。

その結果、クラウドベースのエンタープライズ データ ウェアハウスのニーズに対応するソリューションとして、さらに多くの組織が BigQuery を評価するようになっています。BigQuery は、Google がアナリティクス用に提供する、ペタバイト規模のフルマネージド サーバーレス エンタープライズ データ ウェアハウス(EDW)です。管理するインフラストラクチャもなく、データベース管理者も不要です。使い慣れた SQL を使用して、有用な情報を見つけるためのデータ分析に専念できます。

BigQuery は、インデックスが設定されていない数十億行のデータを数十秒でスキャンできます。BigQuery は Google のインフラストラクチャを共有してクラウドで実行される、大規模な並列処理が可能なクエリサービスです。そのため、各クエリを並列化して、数万台におよぶサーバー上で同時にクエリ実行を行うことが可能です。BigQuery 特有のコア テクノロジーとして、カラム型ストレージとツリー アーキテクチャの 2 つを挙げることができます。

  • カラム型ストレージ: データが行単位ではなく列単位で保存されるため、高い圧縮率とスキャン スループットを実現できます。
  • ツリー アーキテクチャ: クエリが送信されると、結果は数千台にわたるマシンで数秒のうちに集約されます。

BigQuery の技術アーキテクチャの詳細については、Google BigQuery の詳細をご覧ください。

ドキュメントの全文を読むには、下のボタンをクリックしてください。

PDF をダウンロード