Google Cloud Platform

The Forrester Wave: Streaming Analytics で Google Cloud がリーダーの評価を獲得

Data Analytics B1

※この投稿は米国時間 2019 年 9 月 24 日に Google Cloud blog に投稿されたものの抄訳です。


The Forrester Wave™: Streaming Analytics の 2019 年第 3 四半期レポートで、Google Cloud がリーダーに選出されました。私たちはこの調査結果について、Google Cloud の市場での勢いに加え、ストリーミング アナリティクスの本番環境で Cloud Pub/Sub と Cloud Dataflow を私たちの幅広いプラットフォームとともに使用しているお客様からの高い評価が反映されたものと考えています。


Forrester によると、多くの先進的企業が、リアルタイム アナリティクス(データに現在何が起こっているかの分析)が絶大な競争力をもたらすことを理解しています。企業はリアルタイム アナリティクスを利用することで、お客様に対応したり、オペレーション上の問題を修正したり、IoT(モノのインターネット)アプリケーションを駆動したり、競合他社に断固として対抗したりするために、直ちにアクションを起こすことができます。


Forrester による今回のレポートは、企業の IT チームが選択肢を理解し、十分な情報に基づいて自社のために選択を行うことを手助けするため、ストリーミング アナリティクスに関する 26 種の厳格な基準のもとで上位 11 ベンダーを評価しています。これらの評価基準のうち、スケーラビリティ、可用性、集計、管理、セキュリティ、拡張性、実行能力、ソリューション ロードマップ、パートナー、コミュニティ、顧客の導入において、Google は 5 段階評価で最高の 5 を獲得しました。


Cloud Pub/Sub と Cloud Dataflow はどのようにユーザーに役立つか

企業は現在、データドリブンでなければならないという多くのプレッシャーに直面しています。しかし、企業がデータドリブンであるためには高パフォーマンスのテクノロジーが必要です。大規模なクラウド データ アナリティクス プラットフォームの一部である Cloud Pub/SubCloud Dataflow は、使いやすさやスケーラビリティ、パフォーマンスを考慮して設計されています。


The Forrester Wave: Streaming Analytics レポートでのリーダーという評価にお客様の声が反映されていることを、私たちは特にうれしく思っています。「Google Cloud は、ストリーミング アナリティクスとバッチ処理を望ましい方法で統合しており、そこには妥協が一切ありません」とレポートには記されています。ストリーミング アナリティクスはビジネスの主要な優先課題ですが、実際のユース ケースでは多くの場合、入力としてバッチ データも必要になります。Google Cloud Platform(GCP)のお客様は、Apache Beam を使ってバッチ処理とストリーム処理の両方でコードを再利用することで、パイプライン開発を簡素化できます。Apache Beam はパイプライン ポータビリティも OSS プロジェクトに提供します。


さらに、Google Cloud のデータ アナリティクス ポートフォリオでは、取り込み、処理、分析の自動スケーリングが可能です。そのため、プロビジョニングが不要になり、量が変動するストリーミング データを自動的に処理できます。お客様からは、「これまでよりはるかに速くデータの取り込みと処理を行えるようになり、そのおかげで新しいビジネス洞察をより迅速に得たり、より多くのユーザーにセルスサービス アナリティクスを利用してもらったりしています」との声が寄せられています。


Cloud Pub/Sub はストリーム イベント取り込みサービスであり、パブリッシュ / サブスクライブ パターンを使用して、ストリーム、バッチ、統合パイプラインでイベントを配信します。データ エンジニアがプロビジョニングやパーティショニング、分離を気にすることなく、自動的にスケーリングを行えるようにするグローバル サービスです。ユーザーがこのサービスを選択するのは、導入初日から本番環境に利用でき、エンドツーエンドの暗号化が可能で、ほぼ無限のスループットが得られ、ゾーン間レプリケーションによってデータの高い耐久性と可用性が確保できることが理由です。ユーザーは、より多くのデータに迅速にアクセスして新しい洞察を見いだし、インフラストラクチャ管理ではなく新しいプロジェクトに集中することができます。


「Cloud Dataflow と Cloud Pub/Sub から得られる生産性のメリットをとても喜んでいます。以前は Apache Spark を使って 6 か月以上かけて開発していましたが、今ではそれと同じものを半日で作り直すことができます。」Ocado の技術ディレクター、Paul Clarke 氏

Cloud Dataflow は、1 つのサービスでストリームおよびバッチ処理の簡素化を妥協なく実現します。このことについて Forrester のレポートには、「ソフトウェア アーキテクトが、弾力的なスケーリング、複雑なオペレーションの実行、Rocky Balboa(映画『ロッキー』シリーズの主人公)のような回復力を要求されるストリーミングとバッチの統合ソリューションを構築するときの目標です。Google の Cloud Dataflow は、GCP のためのまさにそうしたソリューションです」と記されています。Cloud Dataflow は、自動スケーリングが可能なだけでなく、他の GCP サービス(特に Cloud Pub/Sub など)と密接に統合されており、フォールト トレランスが組み込まれた「正確に 1 回限り」の処理をサポートし、高いパフォーマンス、可用性、セキュリティ、コンプライアンスを自動化します。


企業は、Cloud Dataflow のストリーミング機能を利用することで、分析に応じたアクションを起こす時間があるうちにリアルタイム イベントを分析し、つかの間のチャンスをとらえることができます。Twitter のスタッフ ソフトウェア エンジニアである Steve Niemitz 氏は、「Google Cloud Dataflow のおかげで、Twitter の次世代データ分析プラットフォームの迅速なプロトタイピング、反復開発、ローンチが可能になりました。このプラットフォームは、私たちのニーズに合わせて簡単にスケーリングでき、1 時間あたり数 TB のストリーミングとバッチ データを処理しています」と評価しています。「Cloud Dataflow は Google によって完全に管理されているため、私たちはオペレーションの問題ではなく、ユーザーへの付加価値の提供に集中できます。さらに、Apache Beam で 1 つのジョブを記述すればストリーミングとバッチの両モードで実行されるので、私たちのコードベースとオペレーションは大幅に簡素化されました。」


私たちは今回の Forrester Wave レポートでリーダーの評価を得たことに満足しています。とはいえ、ソリューション ロードマップに対する評価で最高の 5 を獲得したことが示しているように、私たちが最も胸を躍らせているのは、ストリーミング アナリティクス ソリューションを開発し続け、お客様のためにさらに強力なものにする機会があることです。私たちは今後も新機能の開発を継続し、リアルタイム アナリティクスから真の価値を引き出す方法を広げていきます。どうぞご期待ください。


Forrester レポートの全文はこちらからダウンロードできます。GCP のストリーミング アナリティクスについてはこちらをご覧ください。


- By Evren Eryurek, Director of Product Management, Google Cloud