データ ウェアハウスとは
今日の企業は、種類の異なるソースからデータを効率的に収集、保存、統合して、分析と知見を取得しなければ成り立ちません。これらのデータ分析アクティビティは、収益の創出、コストの抑制、利益の最適化の中心となっています。当然の帰結として、生成および分析されるデータ量と、データソースの種類が爆発的に増加しています。
データドリブンの企業には、組織全体の大量のデータを管理し、分析するための堅牢なソリューションが必要です。システムはスケーラブルで信頼性が高くなくてはならず、規制産業にも十分なほどの安全性が求められます。また、さまざまなデータの種類とユースケースをサポートできる柔軟性も備えていなければなりません。こうした要件は、従来のデータベースの能力をはるかに上回っています。そこでデータ ウェアハウスの出番です。
Google Cloud の最新のサーバーレス データ ウェアハウジング ソリューションである BigQuery について詳しくご覧ください。
データ ウェアハウスの定義
データ ウェアハウスとは、POS トランザクション、マーケティング オートメーション、顧客管理などの複数のソースからの構造化データおよび半構造化データの分析とレポート作成に使用される企業システムです。データ ウェアハウスはアドホック分析やカスタム レポート作成に適しています。また、データ ウェアハウスは現在と過去のデータの両方を 1 か所に保存でき、長期間のデータを表示できるよう設計されていることから、ビジネス インテリジェンスにおける主要なコンポーネントとなっています。
クラウド データ ウェアハウス
クラウド データ ウェアハウス ソリューションは、クラウド サービス プロバイダによって管理およびホストされます。そのため、クラウド環境本来の柔軟性を備えており、費用の点でも使用量に基づいて、または固定額で請求されるため金額を予想できます。
ハードウェアの購入が不要で CAPEX が少額で済むため、オンプレミスと比べて先行投資ははるかに少なく、リードタイムも短期間です。また、サーバーレスで NoOps であるというクラウド データ ウェアハウスの特性上、運用の効率も向上します。
クラウド データ ウェアハウスのメリット
マネージド サービスが実現するコスト削減とスケーラビリティによって、企業はますます従来のデータ ウェアハウスからクラウドへ移行しています。
クラウドでのデータ ウェアハウジングのメリットは、次のとおりです。
フルマネージドで運用の節約
クラウド データ ウェアハウジングを利用する場合、サービスレベル契約を満たす義務があるクラウド プロバイダに管理作業の手間を外部委託できます。これによって、運用コストを削減でき、社内チームが成長イニシアチブに集中できます。
オンプレミス データ ウェアハウスよりも稼働時間が向上
クラウド プロバイダは、シームレスにスケールする、信頼性の高いクラウド インフラストラクチャを使用して、SLA を守り稼働時間を改善する義務があります。オンプレミスのデータ ウェアハウスは、スケールとリソースの制限があり、パフォーマンスに影響を与える可能性があります。
スケーリングを考慮した設計
クラウド データ ウェアハウスは弾力性があり、ビジネスニーズの変化に合わせてシームレスにスケールアップまたはスケールダウンできます。
費用対効果の高い柔軟な価格設定
クラウドによって、柔軟な料金設定が実現します。使用量に合わせた請求、または請求額を予測できるフラットレート オプションを選択できます。一部のプロバイダでは、1 時間あたりのスループットまたはノード数で課金されます。一定量のリソースに対して固定料金を請求するプロバイダもあります。いずれの場合にも、リソースが使用中であるかどうかにかかわらず日々休むことなく 24 時間オンプレミスのデータ ウェアハウスを稼働することで発生する莫大なコストを避けることができます。
リアルタイム分析
クラウド データ ウェアハウスは、データのストリーミングをサポートします。これによって、迅速で情報に基づいた意思決定を促進するために、リアルタイムでデータをクエリできます。
機械学習と AI のイニシアチブ
ビジネス上の成果を予測するため、機械学習のユースケースをすばやく実現し、運用化できます。
データ ウェアハウスを使う理由
一部の企業や業種では、規模が大きいだけでなく、継続的かつリアルタイムなデータ分析が必要です。たとえば、リアルタイムのデータを使用して、一日をとおして動的に価格を調整するサービス プロバイダもあります。保険会社では、ポリシーや売り上げ、保険金請求、給与などの追跡に加え、詐欺の予測にも機械学習を使用しています。ゲーム制作会社は、プレーヤーのエクスペリエンスを向上させるために、ユーザーの行動をリアルタイムに追跡して対応する必要があります。データ ウェアハウスは、これらすべての作業を可能にします。
すでに以下のいずれかが存在する、または行っている企業の場合、データ ウェアハウスが適していると考えられます。
- 種類が異なる複数のデータソース
- ビッグデータの分析と可視化 - ともに非同期かつリアルタイム
- 機械学習と AI
- ストリーミング分析
- カスタム レポートの生成とアドホック分析
- データ マイニング
- データ サイエンス
ユースケース
サイロ化したデータの統合
POS システム、ウェブサイト、メーリング リストなど、組織全体の構造化されたソースからすばやくデータを pull し、分析を実行して分析情報を取得できるように 1 か所に集めます。
リアルタイムの意思決定
リアルタイムでデータを分析することで、課題への能動的な対処、機会の特定、効率の向上、コスト削減、ビジネス イベントへの早期の対応が実現します。
カスタム レポートとアドホック分析の実現
個別サーバーの過去データを業務データと分けることで、エンドユーザーが業務システムに影響を与えることなく、または IT 部門からサポートを受けることなく、データにアクセスして独自のクエリを実行し、レポートを作成できます。
機械学習と AI の組み込み
過去およびリアルタイムのデータを収集して、トラフィックの急増の予測や、ウェブサイトを閲覧する顧客に対する関連プロダクトの提案など、予測分析情報を提供するアルゴリズムを開発します。
関連プロダクトとサービス
BigQuery は、Google Cloud のフルマネージドでサーバーレスの企業データ ウェアハウス ソリューションです。情報に基づいた意思決定をすばやく行うにあたって役立つように設計されているため、ビジネスの変革と競争力の維持の実現につながります。インフラストラクチャの設定や管理が不要なため、コスト効率よくデータ分析を開始でき、迅速に分析情報を共有し、デジタル変革に向けた取り組みを簡単に加速できます。
Google Cloud のその他のビッグデータ関連プロダクトおよびソリューションを活用すると、コンテキストリッチなアプリケーションを構築し、機械学習を組み込み、データを行動につながるインサイトに変換できます。