【Next Tokyo ’24】8/1 - 2 パシフィコ横浜にて開催!最新技術やトレンド、顧客事例、専門家によるセッションなど、ビジネス変革を加速させるヒントが満載です。

データ ウェアハウスとは

データ ウェアハウスはエンタープライズ データ ウェアハウス(EDW)とも呼ばれ、複数のデータソース(POS トランザクション、マーケティングの自動化、顧客管理など)からの構造化データと半構造化データの分析、およびレポートに使用されるエンタープライズ データ プラットフォームです。

データ ウェアハウスには、分析データベースと重要な分析コンポーネントおよび手順が含まれます。アドホック分析やカスタム レポート(データ パイプライン、クエリ、ビジネス アプリケーションなど)をサポートします。現在と過去の大量のデータを 1 か所に集約、統合でき、長期にわたるデータの長期的ビューを提供するように設計されています。このようなデータ ウェアハウス機能により、データ ウェアハウジングは、情報に基づいたビジネス上の意思決定を支援するエンタープライズ分析の主要な要素となっています。

Google Cloud の費用対効果に優れたサーバーレスのマルチクラウド エンタープライズ データ ウェアハウスである BigQuery について学びます。

データ ウェアハウスの定義

データ ウェアハウスとは、POS トランザクション、マーケティング オートメーション、顧客管理などの複数のソースからの構造化データおよび半構造化データの分析とレポート作成に使用される企業システムです。データ ウェアハウスはアドホック分析やカスタム レポート作成に適しています。 また、データ ウェアハウスは現在と過去のデータの両方を 1 か所に保存でき、長期間のデータを表示できるよう設計されていることから、ビジネス インテリジェンスにおける主要なコンポーネントとなっています。

従来のデータ ウェアハウスとクラウドベースのデータ ウェアハウス

従来のデータ ウェアハウスはオンプレミスでホストされており、リレーショナル データベース、トランザクション システム、ビジネス アプリケーション、その他のソースシステムからデータが流れてきます。ただし、通常はデータのサブセットをバッチでキャプチャし、厳格なスキーマに基づいて保存するように設計されているため、自発的なクエリやリアルタイム分析には適していません。また、企業はオンプレミスのデータ ウェアハウスを備えた独自のハードウェアとソフトウェアを購入する必要があるため、スケーリングとメンテナンスに費用がかかります。従来のウェアハウスでは、ストレージは通常コンピューティングに比べて制限されるため、データは迅速に変換されて破棄され、保存容量を空けることができます。

今日のデータ分析活動は、収益の創出、費用の抑制、運用の改善、カスタマー エクスペリエンスの向上など、すべての主要なビジネス活動の中心に変化しています。データの進化と多様化に伴って、組織全体で大量のデータを保存、管理、分析するために、組織はより堅牢なデータ ウェアハウス ソリューションと高度な分析ツールを必要としています。

これらのシステムは、スケーラブルで信頼性が高く、規制の厳しい業界に十分な安全性を備え、さまざまなデータ型やビッグデータのユースケースをサポートできる柔軟性を備えている必要があります。また、柔軟な料金とコンピューティングをサポートし、容量を推測せずに、必要な分だけ支払う必要があります。この要件は、ほとんどの従来のデータ ウェアハウスの機能を超えています。その結果、多くの企業がクラウドベースのデータ ウェアハウス ソリューションに目を向けるようになっています。

クラウド データ ウェアハウスは従来のデータ ウェアハウスと何ら妥協せず、機能を拡張し、クラウド上のフルマネージド サービスで実行します。クラウド データ ウェアハウジングは、変化するビジネス要件に対応する迅速なスケーラビリティと、複雑な分析クエリをサポートする強力なデータ処理を提供します。

クラウド データ ウェアハウスを使用すると、クラウド環境に固有の柔軟性と、より予測可能な費用のメリットを享受できます。オンプレミスのデータ ウェアハウス ソリューションでは、クラウド サービス プロバイダが物理インフラストラクチャを管理、維持するため、一般的に初期投資が少なくなり、リードタイムも短縮されます。

クラウドでのデータ ウェアハウジングの仕組み

従来のデータ ウェアハウスと同様に、クラウド データ ウェアハウスは内部および外部のデータソースからデータを収集、統合、保存します。データは通常、データ パイプラインを使用してソースシステムから転送されます。データはソースシステムから抽出され、変換されてデータ ウェアハウスに読み込まれます。このプロセスは ETL(抽出、変換、読み込み)と呼ばれます。データを中央リポジトリに直接送信してから、ELT(抽出、読み込み、変換)プロセスを使用して変換することもできます。そこから、ユーザーはさまざまなビジネス インテリジェンス(BI)ツールを使用して、データへのアクセス、マイニング、レポート作成を行うことができます。クラウド データ ウェアハウスは、リアルタイムまたはほぼリアルタイムでデータを活用するために、ストリーミング ユースケースもサポートする必要があります。

クラウド データ ウェアハウスは、パブリック クラウド環境内で構造化データと半構造化データの保存、処理、統合、クレンジング、読み込みなどを提供します。また、クラウド データレイクとともに使用して、非構造化データを収集、保存することもできます。プロバイダによっては、データ ウェアハウスとデータレイクを統合して、企業データの単一コピーを維持し、一元管理することもできます。

クラウド データ ウェアハウス サービスに関して採用するアプローチは、クラウド プロバイダによって異なります。たとえば、一部のクラウド データ ウェアハウスでは、従来のデータ ウェアハウスに似たクラスタベースのアーキテクチャを採用している場合があります。一方、データ マネジメントの責任をさらに最小限に抑える最新のサーバーレス アーキテクチャを採用している組織もあります。ただし、ほとんどのクラウド データ ウェアハウスには、データ ストレージと容量管理機能が組み込まれており、自動アップグレードも行っています。

クラウド データ ウェアハウスには、他にも次のような主要な機能があります。

  • 超並列処理(MPP)
  • カラム型データストア
  • セルフサービスの ETL と ELT のデータ統合
  • 障害復旧機能と自動バックアップ
  • コンプライアンス ツールとデータ ガバナンス ツール
  • BI、AI、ML 向けの組み込みの統合機能

クラウドでのデータ ウェアハウジングのメリット

マネージド サービスが実現するコスト削減とスケーラビリティによって、企業はますます従来のデータ ウェアハウスからクラウドへ移行しています。

クラウド データ ウェアハウジングの主なメリットは次のとおりです。

スケーリングを考慮した設計

クラウド データ ウェアハウスは弾力性が高く、ほぼ無制限のストレージと容量を提供します。ビジネスニーズの変化に応じて簡単にスケールアップ / スケールダウンでき、お支払いはご利用いただいた分だけの従量制です。

ML と AI の取り組み

お客様は、データ マイニング、ビジネス成果の予測、そしてさらにデータ ライフサイクル管理からビジネス プロセス、運用コストに至るその他の領域を最適化するために、クラウド データ ウェアハウスに対する ML モデルと AI テクノロジーを迅速に活用して運用化できます。

稼働時間が向上

クラウド プロバイダは、シームレスにスケールする、信頼性の高いクラウド インフラストラクチャを使用して、SLA を守り稼働時間を改善する義務があります。オンプレミスのデータ ウェアハウスは、スケールとリソースの制限があり、パフォーマンスに影響を与える可能性があります。

費用の予測可能性

クラウドでは、より柔軟で予測可能な料金設定になっています。一部のプロバイダでは、1 時間あたりのスループットまたはノード数で課金されます。 一定量のリソースに対して固定料金を請求するプロバイダもあります。いずれの場合にも、リソースが使用中であるかどうかにかかわらず日々休むことなく 24 時間オンプレミスのデータ ウェアハウスを稼働することで発生する莫大なコストを避けることができます。

オペレーション費用の削減

クラウド データ ウェアハウスはフルマネージドであるため、サービスレベル契約(SLA)を満たす必要があるクラウド プロバイダに管理の手間を外注することができます。これによって、運用コストを削減でき、社内チームが成長イニシアチブに集中できます。

リアルタイム分析

クラウド データ ウェアハウスは、ストリーミング データをサポートするより強力なコンピューティングを提供し、リアルタイムでデータをクエリできます。その結果、オンプレミスのデータ ウェアハウスよりもはるかに速くデータにアクセスして使用できるようになり、より正確な分析情報をより迅速に取得し、より多くの情報に基づいたビジネス上の意思決定を行うことができます。

データ ウェアハウスを使用する目的

クラウド データ ウェアハウジングは、組織にメリットをもたらす多様なソリューションを提供します。データ ウェアハウスの最も一般的なユースケースは次のとおりです。

リアルタイムの意思決定: リアルタイムでデータを分析して、課題へのプロアクティブな対応、機会の特定、効率化、費用の削減、ビジネス イベントへのプロアクティブな対応を実現します。

サイロ化されたデータの統合: POS システム、ウェブサイト、メーリング リストなど、組織全体の複数の構造化ソースからデータをすばやく取得して 1 か所にまとめることで、分析を行い、分析情報を得られるようにします。

ビジネス レポートやアドホック分析の実現: 過去のデータを運用データとは別のサーバーに保持することで、オペレーティング システムのパフォーマンスに影響を与えたり、IT 部門から支援を待ったりすることなく、エンドユーザーがオペレーション データにアクセスして独自のクエリやレポートを実行できるようにします。

ML と AI の実装: 履歴データとリアルタイム データを収集して、トラフィックの急増を予測したり、ウェブサイトを閲覧している顧客に関連商品を提案したりするなど、予測的な分析情報を提供できるアルゴリズムを開発します。

一部の企業や業種では、規模が大きいだけでなく、継続的かつリアルタイムなデータ分析が必要です。たとえば、リアルタイムのデータを使用して、一日をとおして動的に価格を調整するサービス プロバイダもあります。保険会社では、ポリシーや売り上げ、保険金請求、給与などを追跡しています。詐欺の予測にも ML を使用しています。ゲーム制作会社は、プレーヤーのエクスペリエンスを向上させるために、ユーザーの行動をリアルタイムに追跡して対応する必要があります。データ ウェアハウスは、これらすべての作業を可能にします。

すでに以下のいずれかが存在する、または行っている企業の場合、データ ウェアハウスが適していると考えられます。

  • 種類が異なる複数のデータソース
  • ビッグデータの分析と可視化 - ともに非同期かつリアルタイム
  • ML モデルとその他の AI ドリブンのプロセス
  • ストリーミング分析
  • カスタム レポートの生成とアドホック分析
  • データ マイニング
  • データ サイエンスと地理空間分析

クラウドベースのデータ ウェアハウス ソリューションの選び方

クラウドベースのデータ ウェアハウスを選択する際は、ソリューションの仕組みを評価し、クラウド データ ウェアハウスでサポートする必要がある既存のユースケースを深く理解することが重要です。

さまざまなプロバイダを選択する際には、ウェアハウジングの機能だけでなく、アーキテクチャ、スケーラビリティ、セキュリティ、料金、パフォーマンスの違いなど、考慮すべき多くの考慮事項があります。たとえば、実装が簡単なソリューションでもスケーリングが容易でなかったり、現在のシステムをアップグレードするために、すべてのデータ アナリストの再トレーニングと追加ライセンスの購入が必要になったりすることがあるかもしれません。

ベンダー間の違いを確認するだけでなく、クラウド データ ウェアハウスへの移行に具体的に何が含まれるか、それが既存の IT 投資や特定のビジネスニーズにどのように関連するかを検討することも重要です。

エンタープライズ データ ウェアハウスは、組織の意思決定において中心的な役割を果たします。そのため、ビジネス要件、現在のユースケース、既存のソリューションとのギャップについて、深く理解する必要があります。プロセスの早い段階で主要な関係者を関与させて、従来のデータ ウェアハウス ソリューションを置き換えた場合の影響、課題に対処するための機能要件、データソース、ツール、フレームワークなどに関する詳細な技術情報を把握することをおすすめします。

Google Cloud でビジネスの課題を解決する

新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
お客様独自の課題については、Google Cloud のセールス スペシャリストまで詳しくご相談ください。

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
コンソール
  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud