データ分析

レガシーなデータ ウェアハウスのままではいけない 5 つの理由

GCP_Data_Analytics.jpg

※この投稿は米国時間 2019 年 8 月 22 日に Google Cloud blog に投稿されたものの抄訳です。


世界中の企業と仕事をするうちに、はっきりと見えてきたことが 1 つあります。膨大なデータからなる複雑なビジネス問題を解決しようとしても、データ プラットフォームのインフラストラクチャがそれを阻むケースが多いということです。1990 年代に設計されたデータ プラットフォーム アーキテクチャでは 2020 年のビジネス問題を解決できません。


世界中の企業で起こっているデータ量の爆発的な増加については言及するまでもないでしょう。データ インフラストラクチャの管理を担当している方であれば、データが激増していることはとっくにご存じのはずです。今日、企業の IT チームに対しては、かつてないほど高速で大規模なデータ ストリームやビジネスのグローバルなニーズへの対応が求められているだけでなく、もっと機敏に速く動けという技術通のユーザーからのプレッシャーがかかっています。


しかし、このような変化にもかかわらず、データ アナリティクスという仕事の大半はレガシーなデータ ウェアハウスで行われていることが多く、すべてのニーズに応えているとは言えません。IT 関連の人々と話をすると、古いテクノロジーを使いながら新しいデータ戦略を構築することによって生じるさまざまな制約のことを耳にします。そういった従来のデータ ウェアハウスはもう使い物にならなくなっているのです。この投稿では、使い物にならない理由と、その解決方法について説明します。


1. ビジネスで必要なアジリティがレガシー ツールでは得られない

企業が業務の完全なデジタル化を目指す最大の理由はビジネス アジリティの向上です。オンライン バンキングや、激しい競争のなかで常時接続の e コマース ニーズを先取りしている小売業者を思い浮かべてください。これらの優れた最先端のイノベーションは文化的および技術的な変化を反映しており、柔軟性が不可欠です。顧客のニーズにより良く応える方法を知りたければ、データを迅速に分析できるように管理して、社内のチームが最良のデータで最良の成果を生み出せるようにしなければなりません。


現在、データ ウェアハウスの多くは 95 % とか 100 % という稼働率で動作しており、ビジネス向けに提供できる情報は限界に達しています。オンプレミスのデータ ウェアハウスであれ、大々的にクラウドに移行した既存のデータ ウェアハウスであれ、それらはデータに対するユーザーのすべてのニーズに応えきれていないというのが実情です。そうした問題の管理と防止にはかなりの時間がかかるため、多くの場合、それらの問題は時間の経過とともに悪化します。キャパシティが限界に達すると、ユーザーは機敏に動けなくなり、データベース管理者も身動きが取れなくなります。


データ インフラストラクチャの観点から見ると、ビジネス アジリティを高めるためには、コンピューティング レイヤとストレージ レイヤの分離が不可欠です。データ ウェアハウスがスケーラビリティのニーズに対応し、パフォーマンスを自己管理できるようになって初めて、攻めの姿勢を取れるようになれるのです。


2. レガシーなデータ ウェアハウスでは管理に多くの時間を取られてしまう

ビジネスで求められるレポートやクエリの大半は時間が勝負であり、ユーザーやチームがデータ アナリティクスの可能性に注目すればするほど、そういった切迫感はますます高まっていきます。しかし、お客様と一緒に仕事をしていると、システム サポートに膨大な時間が使われていて、データ分析に費やされる時間は 15 % ほどでしかないとの印象を受けます。要は、メンテナンスにかかる時間が長すぎるのです。旧式のインフラストラクチャは、データ戦略やアジリティに寄与するわけでもないのに複雑です。実際、そうした賞味期限切れのシステムを管理するために人員を増強し続けている企業の話をよく耳にします。


20190904.png

BigQuery が実現したように、システム サポートを自動化してアナリティクスの仕事から取り除いてしまえば、管理に要する時間は削減されます。両者を切り離すと、アナリティクスの仕事がステージの中央に躍り出て、ユーザーが管理者に依存しにくくなります。また、BigQuery は古いデータ ウェアハウスにありがちなアクセス問題の解決にも効果的です。これにより、ユーザーはレポートの作成やデータセットの探索、信頼できる結果の迅速な共有に集中しやすくなります。


3. レガシーなデータ ウェアハウスのコスト構造では戦略への投資が困難になる

他のオンプレミス システムと同様に、従来のデータ ウェアハウスは、テクノロジーに対価を支払うという伝統的なモデルに従っています。ハードウェアとライセンス料、継続的なシステム サポートのためにコストをかけているのです。この種の非効率なアーキテクチャは、さらなる非効率を呼びます。ビジネスがデータドリブンの方向に向かうと、もっと多くのデータを求められるようになるでしょう。しかし、そのニーズに応えようとすると、あっという間に予算がなくなってしまいます。


インフラストラクチャ スタック全体に対価を払って管理するわけではないクラウドなら、コストのかけ方に対する柔軟性の幅が広がります。もちろん、古くて非効率なシステムであっても、それをそのままパブリック クラウドに移植することは可能です。それを避けていただくために、私たちはデータ ウェアハウスの総所有コスト(TCO)についてお客様と話をするようにしています。そうすれば、レガシーなテクノロジーは膨大なコストがかかる割にビジネスのアジリティを高めていないことがよくわかるからです。BigQuery への移行は、単なるクラウドへの移行ではなく、インフラストラクチャやシステム サポートに余計なお金を使わない新しいコスト モデルへの移行なのです。クラウド データ ウェアハウスのコスト構造については、ESG の TCO 比較レポートをご覧ください。


4. レガシーなデータ ウェアハウスではビジネス ニーズに柔軟に対応できない

かつては夜間のデータ操作が一般的でしたが、現在ではビジネスのグローバルな展開に合わせて、データ ウェアハウスもクエリを並行処理しながらデータのストリーミングとバッチ処理をこなす必要があります。そうした中、レガシーなシステムにおいて最大の制約となっているのは、稼働維持のために四苦八苦しているハードウェアです。


この問題は、既存のアーキテクチャをクラウドに移してもそのまま残るため、データ アナリストやユーザーが最も必要としているリアルタイム ストリーミングを実現できないとの声をよく耳にします。一方、BigQuery のようなプラットフォームを使用すれば、データ ウェアハウス自体に演算能力を移行することになるので、アナリティクスにアクセスするユーザーが増えれば、それに合わせて演算能力も増強されます。


演算能力を無限大にすることは、ビジネスのデジタル化を進めるうえで非常に優れた方法です。ユーザーのリクエストに応えることに右往左往することがなくなり、新機能の開発に集中できます。また、クラウドならセキュリティも強化されます。クラウド データ ウェアハウスは、データの自動レプリケートや復元、バックアップといった機能を持ち、機密データの分類や秘匿化の方法を提供します。


5. レガシーなデータ ウェアハウスには成熟した予測分析ソリューションが組み込まれていない

レガシーなデータ ウェアハウスは、財務や営業部門などへのレポート提供など、日々のデータ ニーズをこなすのに精一杯であることが少なくありません。これでは、プロビジョニングや演算の能力に余裕はなく、新たに予測分析を始める時間やリソースを確保することなど、とても考えられません。


私たちは、インフラストラクチャの簡素化や、AI、機械学習、ビジネス ユーザー向けのセルフサービス アナリティクスといった新機能の追加を任されている多くのお客様とよく話をします。そこで耳にするのが、デジタル トランスフォーメーションにとって最高のサクセス ストーリーは、テクノロジーの変更と、ビジネスまたはカルチャーの変化が同時に起こるということです。あるお客様は、BigQuery では使い慣れた SQL のインターフェースを使用できるため、データ アナリティクスの作業を、オーバーワークになっている少数のデータ サイエンティストのグループだけでなく、より多くの従業員に委ねられるようになったと述べています。これにより、無数のサイロ化されたデータ レイク(データ サイエンティストが機械学習モデルのトレーニング用として 1 つのプロジェクトからさまざまなリポジトリにデータを抽出することで発生)を削除できたという効果もあったそうです。


こうした大規模演算が可能になると、所要時間やオーバーヘッドが削減されるだけでなく、成長に向けた新しい道筋も開けてきます。予測分析がより良い意思決定に結びつく小売業などでは、すでに AI と機械学習が業界の様相を大きく変えつつあります。BigQuery を使用すれば、データを移行したりサードパーティ ツールを導入したりしなくても、高度な機械学習タスクを実行できます。


BigQuery は、スケーリングの必要に応じてエンジニアがリソースをデプロイできるように設計されています。これによって、より高い柔軟性がもたらされ、ユーザーはビジネス ニーズへの対応に集中できるようになります。BigQuery は完全にサーバーレスであり、Google のインフラストラクチャ上で実行されるため、データおよびパートナー企業のアナリティクス ツールで構成されるエコシステムと完全に連携します。そのため、最新のソフトウェア スタックを継続的に使用できるようになります。スケーリング、リアルタイムでの知見の提供、地理空間情報や機械学習といった最先端技術を備えたアナリティクス機能を SQL インターフェースで操れるのです。


Google Cloud で実証済みのマイグレーション メソドロジーを学び、BigQuery によるデータ ウェアハウスのモダナイゼーションに道筋をつけましょう。そして、こちらのマイグレーション オファーに応募し、新しいデータ ウェアハウスを構築してください。


- By Robert Saxby, Senior Solutions Architect and Saptarshi Mukherjee, Global Head of Product and Solutions Marketing, Data Analytics, Google Cloud