データ分析

ストリーミング分析の基礎: 最新データに基づく意思決定を容易に

GCP_Data_Analytics.jpg

※この投稿は米国時間 2020 年 12 月 11 日に、Google Cloud blog に投稿されたものの抄訳です。

最新のデータ収集の分野において、ストリーミング分析の対象はその名のとおり、イベント ストリームと呼ばれる移動し続けるデータの流れです。これらのストリームはイベントから構成されます。イベントは、ウェブのクリック、トランザクション、不正なアクティビティなどのアクションの結果としていつでも発生します。ストリーミング分析は、これらの業務上のイベントを常にモニタリングし、イベント ストリームが生成されるとすぐにアクションを自動的に実行することを可能にするものです。ストリーミング分析が適切に動作しているとき、データに関する質問を行い得られた回答に基づき、より良い意思決定を行うことができます。たとえば、顧客がどの時点で、どの製品をオンラインで購入しているか、どのようなエラー メッセージがどの程度の頻度で出力されているか、というような質問の回答が得られます。ストリーミング分析を正しく行うには、その分析から得られるものについて考えることをおすすめします。時間とリソースをどこに集中させるべきか、どのデータから最も有効な知見を引き出せるかを考えてみましょう。

ストリーミング分析について検討する理由

IDC によると、2025 年までに全世界で作成されるデータの 1/4 以上が本質的にリアルタイムのデータになると予測されています。何が拡大を推進しているのでしょうか。今日における生活やビジネスでのあらゆる行動は、デジタルの世界に足跡を残していると考えられます。これらのリアルタイム データの生成元はさまざまです。デジタル接続デバイスと接続されたデバイスのイノベーションの成果(産業用センサー、スマートフォン、ウェアラブル、カー ナビゲーションなど)、オンラインでの操作(購入履歴、クリックストリーム、広告、在庫、元帳など)、およびデジタル通信サービス(ソーシャル メディアへの投稿、写真、メール、コラボレーション プラットフォームなど)がこれに該当します。データの量、生成速度、多様性は指数的に増大し、ビジネスの競合力を維持するにはこの新しい膨大なデータの環境に適応する必要があります。

分析用データを編成する最も基本的な方法はバッチです。バッチを使用すると新しいデータは時間、日、または週ごとにのみ処理されます。この方法は履歴情報に特化したもので、ビジネスにとって過去のイベントにしか対応できないという制約を伴います。今日のビジネス環境では多くの場合、データは戦略的な差別化要因となり、データをほぼリアルタイムで処理しなければ意思決定が間に合わなくなる可能性があります。イベントソースからリアルタイムのデータを得ることで、厳しい時間枠の中で鮮度の落ちやすい分析情報を処理し、大きな価値を生み出すことが可能になります。つまり、ビジネスでは迅速な対応が必要とされます。そのためには、アクションが行われた時点でリアルタイムの分析を行う必要があります。これは、不正の防止と不正の検出、購入を行う顧客と購入を途中で止める顧客、そしてプロアクティブで効果的なカスタマー サービスとリアクティブで効果のないカスタマー サービスの違いを決める要因です。

リアルタイムのデータ分析がビジネスの収益に影響する部分は数多く存在します。

  • 対象を絞った価格戦略を作成するビジネスで商品のプロモーションを行う場合、顧客が商品を購入するよう、適切な価格設定のテストは非常に重要です。ストリーミング データにより、それぞれの顧客に対して弾力性のある価格設定、割引の実行時期、個別化されたキャンペーンや販売チャネルなどをより正確に行えます。

  • リアルタイムで不正を検出するリアルタイムのストリーミング データにアクセスできれば、不正な金融取引にも迅速に対応できるため、不正なトランザクションについて、発生した費用を後から損金処理するのではなく、即座にフラグ付けできます。

  • 顧客ロイヤルティを構築しマーケット シェアを獲得する応答性の高い関係を構築することで、顧客の信頼を獲得し、収益を増やすことができます。見込み顧客とほぼリアルタイムで提案や対話を行い、コンテンツ、価格設定、ソリューションについて個別に提供できれば、顧客が満足し引き続き自社を利用することになります。

  • 業務の効率性を追求するリアルタイムのデータ分析によりデータの整合性を継続的にモニタリングし、自動的に対応が可能になります。ストリーミングの採用により、エラーが発生しやすい手動プロセスを排除、他の組織とのデータの相互運用性を改善、データをより実用的なものにすることで市場投入までの期間を短縮できます。

自社のビジネスにストリーミング分析が適切かどうかを評価する方法

すべての問題がストリーミング分析で同様に改善されるわけではありません。また、リアルタイムのデータの活用を開始するには多くの作業が必要です。データをキャプチャ、取り込み、処理する方法は数多く存在し、会社のデータの分析からは膨大な情報が収集されます。収集や分析を行うべきデータはどれでしょうか。リアルタイムでキャプチャすべきデータと、後に回してもかまわないデータをどのような方法で優先度付けすればいいのでしょうか。ストリーミング分析が御社に適切な方法であるかを判定するには、次の点を考慮してください。

  • 現在の環境を評価する: 組織内のどのアプリケーションがデータを生成しているかを特定し、それらのデータ ストリームを重要性に基づいてランク付けします。たとえば小売業では、ウェブサイトのクリックストリームの方が、バックオフィスでの給与支払よりも直接的な収益を生み出す機会を考えた場合、リアルタイム アプリケーションの必要性が高いと判断できるでしょう。

  • リアルタイム分析のユースケースをデータ ストリームにマッピングする: 売上や純益を改善するためには、顧客への対応、欠陥のある製品の検出、セキュリティの強化などのうち、どの作業が重要かを決定します。

  • 購入と構築を比較検討する: 御社のスタッフは、この技術から最大の価値を引き出すために必要なスキルセットをお持ちでしょうか。そのような専門家を雇用する予算があるでしょうか。オープンソースの技術とフルマネージド サービスのどちらを選択するかを決定する際に、これらの要素はどれだけの期間で価値を実現できるかに影響を及ぼします。

Google Cloud は Google のフルマネージドでリアルタイムのストリーミング プラットフォームで、永続的なメッセージ保存とリアルタイムでのメッセージ配信を行う Cloud Pub/Sub、Google のリアルタイムおよびバッチ パイプライン用のデータ処理エンジンである Cloud Dataflow、Google のサーバーレス データ ウェアハウスである BigQuery が含まれています。Google は柔軟性とスケーラビリティを念頭に置いて設計を行っているため、使い慣れたオープンソース ツールに加え、Cloud Storage や Google のデータベースなど、他の Google Cloud ツールもサポートし、統合しています。その結果として、ストリーミングとバッチのソースが 1 か所に取り込まれ、簡単にアクセスでき、強力な分析を行えるため、妥協の必要はありません。

Google は、価値の高いユースケースについてアーキテクチャの使用開始を支援するため、リファレンス パターンを用意しています。

次のステップ

詳細については、, Google Cloud の無料トライアルを試すか、Google Cloud セールスチームにお問い合わせください。

-Google Cloud プロダクト管理担当ディレクター Evren Eryurek