Dataflow がお客様の生産性を 50% 以上向上させ、費用削減を実現する 3 つの方法
Google Cloud Japan Team
※この投稿は米国時間 2022 年 2 月 9 日に、Google Cloud blog に投稿されたものの抄訳です。
業界をリードするデータと AI のインテグレーション ソリューションである Google Data Cloud を活用したデータドリブン型の変革について、テクノロジー リーダーとの対話の中で、「何が起こったのか」という質問への回答から、「何が起こっているのか」、「何が起こるのか」という質問へと移行するための継続的なインテリジェンスの組み込みが重要なテーマとなっています。この進化の核となるのは、生成に近いところで起きているイベントに対して強力なリアルタイム機能を提供するだけでなく、既存のデータソースを 1 つの統合データ プラットフォームの下にまとめ、組織が全体的な知見を引き出してアクションを起こせるようにするための基礎となるデータ処理の必要性です。Dataflow は、Google のクラウドネイティブなデータ処理およびストリーミング分析プラットフォームです。Dataflow は、ストリーミング、BI エンジン、ML を内蔵した Google のインターネット規模のウェアハウスである BigQuery、グローバルな NoOps のイベント配信サービスである Pub/Sub、最新の BI および組み込み分析プラットフォームである Looker とともに、最新のデータおよび AI アーキテクチャ、データ変換のジャーニーの重要なコンポーネントです。Dataflow が組織にもたらす可能性がある経済的価値は、特にステークホルダーを関与させることが Google が関わる多くのリーダーにとって重要であるという観点から、主要な評価要素の一つです。そこで Google は、Forrester Consulting に委託し、実際のお客様にインタビューすることで、Dataflow が組織に与えた影響に関する包括的な調査を行いました。
本日は、Forrester Consulting が実施した委託調査「Total Economic Impact™ of Google Cloud Dataflow」の結果をご紹介します。この調査結果を検討することで、データリーダーは Dataflow のメリットとそれによって実現するユースケースを理解し、定量化することができます。Forrester は、Dataflow のお客様にインタビューを行い、組織全体で Dataflow に投資することのメリット、コスト、リスクを評価しました。Forrester は、インタビューに基づいて、ビジネスの成長、インフラストラクチャのコスト削減、データエンジニアの生産性、管理の効率化という 4 つの異なる分野で、主な財務上のメリットを特定しました。実際、Forrester の調査によると、Dataflow を採用したお客様は、開発者の生産性を 55% 向上させ、インフラストラクチャのコストを 50% 削減することができます。実際、Forrester は、Dataflow を採用したお客様は、最大 171% の投資収益率(ROI)と 6 か月以内の投資回収期間を達成できると予測しています。お客様は、レポートの数値を使って、投資収益率(ROI)や投資回収期間を計算できます。
「Dataflow は、製品化までの時間、本番運用までの時間、ユースケースに応じたデータの使用方法を把握するまでの時間を短縮して、付加価値の高いタスクにより多くの時間を費やし、取り込みを効率化し、総所有コストを削減するうえで不可欠です。」 - CPG、リード テクニカル アーキテクト
Dataflow が組織の目標を達成し、ビジネスの可能性を引き出すうえでどのように役立つかを、Forrester の調査結果に基づいてさらに詳しく見てみましょう。
メリット 1: データ エンジニアの生産性が 55% 向上
開発者は、さまざまなプログラミング言語の中から好きな言語を選んで、データ ワークフローを定義し実行することができます。また、Dataflow は、他の Google Cloud Platform テクノロジーやオープンソース テクノロジーとシームレスに統合されているため、さまざまなユースケースに対する価値と適用性を最大化します。Dataflow は、コードの再利用性、動的なテンプレート、マネージド サービスのシンプルさにより、ワークフローを合理化します。エンジニアは、パイプラインが正しく実行され、ガバナンスが遵守されていることに対して信頼を寄せています。データ エンジニアは、パフォーマンスの低下、可用性の欠如、ジョブの失敗など、従来の環境でよく見られた面倒な問題のモニタリングや修復作業を回避できます。チームは、言語の柔軟性とオープンソースの基盤を高く評価しています。
「Dataflow は、既存の ETL を置き換え、潜在的なユースケースに向けての無限の可能性を切り開き、データが動いている間でもよりスマートなデータ強化を行うことを可能にしてくれました。」- 金融サービス、データ プロジェクト ディレクター
メリット 2: バッチ ワークロードおよびストリーミング ワークロードのインフラストラクチャ コストを最大 50% 削減
Dataflow のサーバーレス自動スケーリングと、ジョブのニーズ、スケジューリング、リージョンを個別にコントロールすることで、オーバーヘッドを解消し、技術費用を最適化しました。グローバルなデータ処理ソリューションを Dataflow に統合することで、余分なコストをさらに削減しつつ、環境間でのパフォーマンス、回復力、ガバナンスを確保できました。Dataflow の統一されたストリーミングとバッチデータのプラットフォームにより、企業はどちらのワークロードも同じプログラミング モデルで定義し、同じインフラストラクチャ上で実行し、単一の運用管理ツールで管理できる柔軟性を備えています。
「Dataflow を使用するクラウド データプラットフォームのコストは、以前に比べてほんのわずかです。今では、オープンソースをベースにすることでライセンス コストを回避できるため、クラウド インフラストラクチャの消費分のみを支払っています。Dataflow には年間約 12 万ドルを費やしていますが、旧来の技術では数百万ドルを費やしていたことでしょう。」- CPG、リード テクニカル アーキテクト
メリット 3: 顧客体験と定着率の向上による営業収益の増加、投資回収期間が 6 か月未満
ストリーミング分析は、今日のデジタル世界において、リアルタイムで実用的な知見を得るために不可欠な機能です。同様に、機械学習モデルの構築、ビジネス インテリジェンス、高度な分析のために過去のデータを分析するための、柔軟で高性能なバッチ環境も必要です。Dataflow は、リアルタイム ストリーミングのユースケースを可能にし、データ拡充を改善し、データ探索を促進し、パフォーマンスと復元力を向上させ、エラーを減らし、信頼性を高め、スケールの障害を取り除きました。その結果、企業は、より正確で、適切で、その瞬間のデータに裏付けられたサービスや知見をお客様に提供し、顧客体験の向上、新たな収益源の創出、獲得、保持、強化の改善を実現しました。
「Dataflow で お客様に早く結果を出すことができるので、より多くのビジネスを獲得していることが証明されています。」 - 金融サービス テクノロジー、テクノロジー担当バイス プレジデント
「Dataflow を使ってお客様やパートナーにデータを提供すると、数字により一層自信が持てるようになり、1 分以内に正確なデータを提供できるようになりました。お客様やパートナーがこの点に注目し、コメントしてくれています。苦情が減り、解約を防ぐことができました。」- メディア部門シニア ソフトウェア エンジニア
その他のメリット
管理部門のオーバーヘッドと労務の排除
クラウドネイティブなマネージド サービスとして、プロビジョニング、スケーリング、アップデートなどの管理作業はすべて Google Cloud が自動的に行います。従来のデータ処理ソリューションのサーバーや関連ソフトウェアをチームで管理する必要はありません。また、管理者は、データソースの設定、パイプラインの追加、ガバナンスの適用などのプロセスを合理化できます。
サポートチームとデータ エンドユーザーのビジネス オペレーション費用の削減
Dataflow は、一般的なビジネス ユーザーの知見を得るためのデータへのアクセスの速度、品質、信頼性、利便性を向上させることで、時間を節約し、ユーザーがデータに裏付けられたより良い結果を導き出せるようにしました。また、手作業によるジョブ作成を自動化することで、サポートの問い合わせ量を削減しました。
次のステップ
今すぐ Forrester Total Economic Impact 調査をダウンロードし、Dataflow がお客様の組織にもたらす経済的影響の詳細をご覧ください。Google は、お客様のパートナーとして、Dataflow がお客様のチームにもたらす可能性を探りたいと思っています。Google Cloud を活用したデータ トランスフォーメーションについてのご相談は Google Cloud のセールスチームまでご連絡ください。
- データベース、データ分析、Looker 担当バイス プレジデント兼ゼネラル マネージャー、Gerrit Kazmaier