Dataflow

リアルタイムのインテリジェンスと生成 AI のためのストリーミング分析

リアルタイム データの可能性を最大限に引き出します。Dataflow は、リアルタイムの AI / ML を高速化するのに役立つ、使いやすくてスケーラブルなフルマネージド ストリーミング プラットフォームです。

新規のお客様には、Dataflow で使用できる無料クレジット $300 分を差し上げます。

機能

ストリーミング AI と ML を使用して、生成 AI モデルをリアルタイムで強化

リアルタイム データにより、AI / ML モデルに最新情報を提供し、予測精度を高めます。Dataflow ML は、完全な ML パイプラインのデプロイと管理を簡素化します。パーソナライズされた推奨事項、不正行為の検出、脅威の防止などに、すぐに使用できるパターンが用意されています。Vertex AI、Gemini モデル、Gemma モデルを使用してストリーミング AI を構築し、リモート推論を実行し、MLTransform を使用してデータ処理を合理化します。Dataflow GPURight Fitting 機能を使用して、MLOps と ML ジョブの効率を高めます。

エンタープライズ規模での高度なストリーミングのユースケースを実現

Dataflow は、オープンソースの Apache Beam SDK を使用してエンタープライズ規模での高度なストリーミングのユースケースを実現するフルマネージド サービスです。状態と時間変換I/O コネクタなどの豊富な機能を備えています。Dataflow はジョブあたり 4,000 ワーカーまでスケーリングでき、ペタバイト規模のデータを定期的に処理します。自動スケーリングにより、バッチ パイプラインとストリーミング パイプラインの両方で最適なリソース使用率を実現できます。

生成 AI 向けのマルチモーダル データ処理をデプロイする

Dataflow では、画像、テキスト、音声などのマルチモーダル データを並行して取り込み、変換できます。各モダリティに特化した特徴抽出を適用し、それらの特徴を統合表現に融合します。これにより、データフィードが生成 AI モデルに融合され、多様な入力から新しいコンテンツを作成できるようになります。Google 社内チームは Dataflow と FlumeJava を利用して、利用可能な大規模な入力データプールに対して、レイテンシ要件なしでモデル予測を整理して計算します。

テンプレートとノートブックで価値創出までの時間を短縮

Dataflow には、簡単に使い始めることができるツールがあります。Dataflow テンプレート は、ストリーム処理とバッチ処理用に事前に設計されたブループリントであり、効率的な CDC と BigQuery データ統合のために最適化されています。Vertex AI Notebooks を使用して、最新のデータ サイエンス フレームワークでゼロからパイプラインを反復的に構築し、Dataflow ランナーを使用してデプロイします。Dataflow ジョブビルダーは、コードを記述せずに Google Cloud コンソールで Dataflow パイプラインを構築して実行するためのビジュアル UI です。

スマートな診断ツールとモニタリング ツールで時間を節約

Dataflow には包括的な診断ツールとモニタリング ツールが用意されています。ストラグラー検出によりパフォーマンスのボトルネックが自動的に特定され、データ サンプリングにより各パイプライン ステップでデータを観察できます。Dataflow の分析情報は、ジョブの改善に関する推奨事項を提供します。Dataflow UI には、ジョブグラフ実行の詳細指標自動スケーリング ダッシュボードロギングなどの豊富なモニタリング ツールが用意されています。Dataflow には、費用を簡単に見積もることができるジョブ費用モニタリング UI も用意されています。

組み込みのガバナンスとセキュリティ

Dataflow では、Confidential VM のサポートによる使用中のデータの暗号化、顧客管理の暗号鍵(CMEK)、VPC Service Controls の統合、パブリック IP の無効化など、さまざまな方法でデータを保護できます。Dataflow 監査ロギングを使用すると、組織は Dataflow の使用状況を可視化し、「誰がいつどこで何をしたか」を調べられるようになり、ガバナンスが向上します。

仕組み

Dataflow は、バッチとストリーミングのデータ処理のためのフルマネージド プラットフォームです。スケーラブルな ETL パイプライン、リアルタイム ストリーム分析、リアルタイム ML、Apache Beam の統合モデルを使用した複雑なデータ変換をすべてサーバーレスの Google Cloud インフラストラクチャで実現できます。

大きな建物の上に Daflowflow アイコン、右側には Pub/Sub、Cloud Storage、Cloud AutoML のアイコンでジャグリングをする男性のサムネイル画像
Dataflow の仕組みや一般的なユースケースなど、その概要が 1 分でわかります。

一般的な使用例

リアルタイム ML と生成 AI

ストリーミング ML / AI でリアルタイムに対応

瞬時の判断はビジネスにおける価値を高めます。Dataflow のストリーミング AI と ML により、お客様は低レイテンシの予測と推論、リアルタイム パーソナライズ、脅威検出、不正行為防止など、リアルタイム インテリジェンスが重要となるさまざまなユースケースを実装できます。MLTransform を使用してデータを前処理する。これにより、複雑なコードの記述や基盤となるライブラリの管理からデータの変換に集中できます。RunInference を使用して生成 AI モデルに対して予測を行う



Dataflow を使用したリアルタイム ML と生成 AI に関する Google Cloud の略図

ストリーミング ML / AI でリアルタイムに対応

瞬時の判断はビジネスにおける価値を高めます。Dataflow のストリーミング AI と ML により、お客様は低レイテンシの予測と推論、リアルタイム パーソナライズ、脅威検出、不正行為防止など、リアルタイム インテリジェンスが重要となるさまざまなユースケースを実装できます。MLTransform を使用してデータを前処理する。これにより、複雑なコードの記述や基盤となるライブラリの管理からデータの変換に集中できます。RunInference を使用して生成 AI モデルに対して予測を行う



Dataflow を使用したリアルタイム ML と生成 AI に関する Google Cloud の略図

ストリーミング分析

リアルタイムの分析と運用パイプラインのためにストリーミング データを取り込む

ストリーミング データソース(PubSubKafkaCDC イベント、ユーザー クリックストリーム、ログ、センサーデータ)を BigQueryGCS データレイク、Spanner、Bigtable、SQL ストア、Splunk、Datadog などに統合して、データ ストリーミングの取り組みを開始します。最適化された Dataflow テンプレートにより、数回のクリックでノーコードでパイプラインを設定できます。統合された UDF ビルダーを使用してテンプレート ジョブにカスタム ロジックを追加するか、Beam 変換I/O コネクタのエコシステムを最大限に活用してカスタム ETL パイプラインをゼロから作成できます。Dataflow は、ETL で処理されたデータを BigQuery から OLTP ストアに戻して、高速ルックアップとエンドユーザーへのサービスを提供するためにもよく使用されます。Dataflow がストリーミング データを複数のストレージ ロケーションに書き込む一般的なパターンです。


デプロイ用に事前にパッケージ化された Dataflow パイプラインをデプロイできる Dataflow テンプレートの詳細
Google Cloud アーキテクチャでのストリーミング分析

最初の Dataflow ジョブを起動し、Dataflow の基礎に関する自習型コースを受講してください。

リアルタイムの分析と運用パイプラインのためにストリーミング データを取り込む

ストリーミング データソース(PubSubKafkaCDC イベント、ユーザー クリックストリーム、ログ、センサーデータ)を BigQueryGCS データレイク、Spanner、Bigtable、SQL ストア、Splunk、Datadog などに統合して、データ ストリーミングの取り組みを開始します。最適化された Dataflow テンプレートにより、数回のクリックでノーコードでパイプラインを設定できます。統合された UDF ビルダーを使用してテンプレート ジョブにカスタム ロジックを追加するか、Beam 変換I/O コネクタのエコシステムを最大限に活用してカスタム ETL パイプラインをゼロから作成できます。Dataflow は、ETL で処理されたデータを BigQuery から OLTP ストアに戻して、高速ルックアップとエンドユーザーへのサービスを提供するためにもよく使用されます。Dataflow がストリーミング データを複数のストレージ ロケーションに書き込む一般的なパターンです。


デプロイ用に事前にパッケージ化された Dataflow パイプラインをデプロイできる Dataflow テンプレートの詳細
Google Cloud アーキテクチャでのストリーミング分析

最初の Dataflow ジョブを起動し、Dataflow の基礎に関する自習型コースを受講してください。

リアルタイム ETL とデータ統合

リアルタイム データでデータ プラットフォームをモダナイズ

リアルタイムの ETL と統合プロセス、即時のデータの書き込みにより、迅速な分析と意思決定を可能にします。Dataflow のサーバーレス アーキテクチャとストリーミング機能は、リアルタイム ETL パイプラインの構築に最適です。Dataflow の自動スケーリング機能により効率性とスケーラビリティが確保されると同時に、さまざまなデータソースと宛先がサポートされているため、統合が容易になります。

リアルタイム ETL と Dataflow とのデータ統合に関する Google Cloud のスケッチを表示

こちらの Google Cloud Skills Boost コースで、Dataflow でのバッチ処理の基礎知識を習得しましょう。

リアルタイム データでデータ プラットフォームをモダナイズ

リアルタイムの ETL と統合プロセス、即時のデータの書き込みにより、迅速な分析と意思決定を可能にします。Dataflow のサーバーレス アーキテクチャとストリーミング機能は、リアルタイム ETL パイプラインの構築に最適です。Dataflow の自動スケーリング機能により効率性とスケーラビリティが確保されると同時に、さまざまなデータソースと宛先がサポートされているため、統合が容易になります。

リアルタイム ETL と Dataflow とのデータ統合に関する Google Cloud のスケッチを表示

こちらの Google Cloud Skills Boost コースで、Dataflow でのバッチ処理の基礎知識を習得しましょう。

マーケティング インテリジェンス

リアルタイムの分析情報でマーケティングを変革

リアルタイムのマーケティング インテリジェンスで、現在の市場、顧客、競合他社のデータを分析し、情報に基づいた迅速な意思決定を行います。これにより、トレンド、行動、競合アクションに対するアジャイルな対応を可能にし、マーケティングを変革します。次のような利点があります。

  • 一人ひとりに合わせたサービスによるリアルタイムのオムニチャネル マーケティング
  • パーソナライズされたインタラクションによる顧客管理の改善
  • アジャイルなマーケティング ミックスの最適化
  • 動的ユーザー セグメンテーション
  • 競争力を維持するための競合に関する情報
  • ソーシャル メディアでのプロアクティブな危機管理
Dataflow を使用したマーケティング インテリジェンスの Google Cloud スケッチを見る

    リアルタイムの分析情報でマーケティングを変革

    リアルタイムのマーケティング インテリジェンスで、現在の市場、顧客、競合他社のデータを分析し、情報に基づいた迅速な意思決定を行います。これにより、トレンド、行動、競合アクションに対するアジャイルな対応を可能にし、マーケティングを変革します。次のような利点があります。

    • 一人ひとりに合わせたサービスによるリアルタイムのオムニチャネル マーケティング
    • パーソナライズされたインタラクションによる顧客管理の改善
    • アジャイルなマーケティング ミックスの最適化
    • 動的ユーザー セグメンテーション
    • 競争力を維持するための競合に関する情報
    • ソーシャル メディアでのプロアクティブな危機管理
    Dataflow を使用したマーケティング インテリジェンスの Google Cloud スケッチを見る

      クリックストリームの分析

      ウェブとアプリのエクスペリエンスを最適化してパーソナライズする

      リアルタイムのクリックストリーム分析を使用すると、企業はウェブサイトやアプリでのユーザー インタラクションを瞬時に分析できます。これにより、リアルタイムのパーソナライズ、A/B テスト、ファネルの最適化が可能になり、エンゲージメントの向上、プロダクト開発の迅速化、離脱の削減、サービスに関するサポートの強化につながります。最終的には、優れたユーザー エクスペリエンスを実現し、動的な価格設定とパーソナライズされたレコメンデーションを通じてビジネスの成長を促進します。

      Dataflow を使用したリアルタイムのクリックストリーム分析についての Google Cloud のスケッチを参照

        ウェブとアプリのエクスペリエンスを最適化してパーソナライズする

        リアルタイムのクリックストリーム分析を使用すると、企業はウェブサイトやアプリでのユーザー インタラクションを瞬時に分析できます。これにより、リアルタイムのパーソナライズ、A/B テスト、ファネルの最適化が可能になり、エンゲージメントの向上、プロダクト開発の迅速化、離脱の削減、サービスに関するサポートの強化につながります。最終的には、優れたユーザー エクスペリエンスを実現し、動的な価格設定とパーソナライズされたレコメンデーションを通じてビジネスの成長を促進します。

        Dataflow を使用したリアルタイムのクリックストリーム分析についての Google Cloud のスケッチを参照

          料金

          Dataflow の料金の仕組みDataflow の課金とリソースモデルについて学習する。
          サービスと用途説明料金

          Dataflow のコンピューティング リソース

          詳しくは、料金ページをご覧ください

          その他の Dataflow リソース

          すべてのジョブに対して課金されるその他の Dataflow リソースには、Persistent Disk、GPU、スナップショットなどがあります。



          詳しくは、料金ページをご覧ください

          Dataflow の確約利用割引(CUD)

          Dataflow CUD では、コミットメント期間に応じた 2 つのレベルの割引が用意されています。

          • 1 年間の CUD では、オンデマンド料金から 20% 割引となります。
          • 3 年間の CUD では、オンデマンド料金から 40% 割引となります。

          Dataflow CUD の詳細

          Dataflow の料金の詳細すべての料金の詳細を見る

          Dataflow の料金の仕組み

          Dataflow の課金とリソースモデルについて学習する。

          Dataflow のコンピューティング リソース

          説明
          料金

          詳しくは、料金ページをご覧ください

          その他の Dataflow リソース

          説明

          すべてのジョブに対して課金されるその他の Dataflow リソースには、Persistent Disk、GPU、スナップショットなどがあります。



          料金

          詳しくは、料金ページをご覧ください

          Dataflow の確約利用割引(CUD)

          説明

          Dataflow CUD では、コミットメント期間に応じた 2 つのレベルの割引が用意されています。

          • 1 年間の CUD では、オンデマンド料金から 20% 割引となります。
          • 3 年間の CUD では、オンデマンド料金から 40% 割引となります。
          料金

          Dataflow CUD の詳細

          Dataflow の料金の詳細すべての料金の詳細を見る

          料金計算ツール

          リージョン固有の料金と手数料を含む、GKE の毎月の費用を試算する

          カスタムの見積もり

          カスタム見積もりをご希望の場合は、Google のセールスチームにお問い合わせください。

          概念実証を開始する

          新規のお客様には、Dataflow を $300 でお試しいただけます

          大規模なプロジェクトがある場合は、

          Dataflow の使用方法

          事前構築された Dataflow テンプレート

          Dataflow コードサンプルを参照する

          ビジネスケース

          業界をリードするお客様が Dataflow を選ぶ理由


          ANZ Bank、GCP SRE、プロダクト オーナー Namitha Vijaya Kumar 氏

          「Dataflow は、バッチ処理とリアルタイム データ処理の両方に対応しており、エンタープライズのデータレイクにおいてデータを適宜、最新の状態に維持できます。その結果、分析/意思決定のためのダウンストリーム データの使用や、小売業のお客様へのリアルタイム通知の配信が促進されます。」

          お客様事例を読む

          Dataflow のメリット

          ストリーミング ML が簡単に

          AI / ML にストリーミングを導入するターンキー機能: 推論のための RunInference、モデル トレーニングの前処理のための MLTransform、特徴量ストアの検索のための拡充、動的 GPU のサポートはすべて、限られた GPU リソースに無駄な費用をかけずにトイルを削減します。

          堅牢なツールで最適なコスト パフォーマンスを実現

          Dataflow は、パフォーマンスとリソース使用量を最大化する自動最適化により、費用対効果に優れたストリーミングを提供します。あらゆるワークロードに合わせて簡単にスケーリングでき、AI による自己回復機能を備えています。堅牢なツールが運用と理解に役立ちます。

          オープン、移植可能、拡張可能

          Dataflow はオープンソースの Apache Beam 向けに構築されており、バッチとストリーミングの統合をサポートするため、クラウド、オンプレミス、エッジデバイス間でワークロードを移植できます。

          パートナーとインテグレーション

          • Confluent ロゴ
          • Snowplow ロゴ
          • Talend ロゴ
          • Trifacta ロゴ
          • Confluent ロゴ
          • Snowplow ロゴ
          • Talend ロゴ
          • Trifacta ロゴ

          Google Cloud パートナーが Dataflow との統合機能を開発しており、さまざまな規模での強力なデータ処理タスクが迅速かつ容易に行えるようになっています。すべてのパートナーを参照し、今すぐストリーミングを始めましょう。

          Google Cloud
          • ‪English‬
          • ‪Deutsch‬
          • ‪Español‬
          • ‪Español (Latinoamérica)‬
          • ‪Français‬
          • ‪Indonesia‬
          • ‪Italiano‬
          • ‪Português (Brasil)‬
          • ‪简体中文‬
          • ‪繁體中文‬
          • ‪日本語‬
          • ‪한국어‬
          コンソール
          • Google Cloud プロダクト
          • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
          Google Cloud