Cloud Data Fusion

フルマネージドでクラウドネイティブなデータをあらゆる規模で統合できます。

無料トライアル
  • action/check_circle_24px Sketch で作成。

    マウスだけで視覚的に操作できるインターフェースによって、コードを意識せずに ETL / ELT パイプラインをデプロイ可能

  • action/check_circle_24px Sketch で作成。

    事前構成されたコネクタと変換を 150 以上備える幅広いライブラリを追加費用なしで利用可能

  • action/check_circle_24px Sketch で作成。

    ネイティブに統合された最高水準の Google Cloud サービス

  • action/check_circle_24px Sketch で作成。

    エンドツーエンドのデータリネージで根本原因と影響範囲を分析

  • action/check_circle_24px Sketch で作成。

    オープンソースのコアで構成されており(CDAP)パイプラインの移植をサポート

技術的なボトルネックを回避して生産性を改善

Data Fusion はドラッグ&ドロップで直感的に操作でき、既製のコネクタやセルフサービス モデルでコードを意識せずにデータ統合することによって、専門家に依頼することによるボトルネックを解消して、迅速に分析情報を取得できます。

パイプラインの総所有コストを削減

Data Fusion はサーバーレスで Dataproc などの Google サービスの拡張性と信頼性を活用するアプローチであり、オーナー権限についての合計費用を低く抑えながらデータ統合機能のメリットを提供できます。

データ ガバナンス基盤によって構築

Data Fusion にはエンドツーエンドのデータリネージ、統合メタデータ、クラウド ネイティブなセキュリティやデータ保護サービスなどの機能が組み込まれており、根本原因や影響範囲の分析に加え、コンプライアンス対応を支援します。

主な機能

オープンコアでハイブリッドおよびマルチクラウドの統合を実現

Data Fusion はオープンソース プロジェクトである CDAP を使って構築されており、このオープンコアによってデータ パイプラインの移植性をユーザーに対して提供しています。オンプレミスとパブリック クラウドの両方のプラットフォームと幅広く統合できる CDAP は、Cloud Data Fusion ユーザーが部門の垣根を越えてこれまでアクセスできなかった分析情報を供給することを可能にします。

業界をリードする Google のビッグデータ ツールと統合

Data Fusion が Google Cloud と統合されることによってデータ セキュリティを簡単に確保でき、データをすぐに分析できるようになります。Cloud StorageDataproc でデータレイクをキュレートする場合、データを BigQuery に移行してデータ ウェアハウジングを行う場合、またはデータを変換して Cloud Spanner などのリレーショナル ストアに格納する場合、Cloud Data Fusion で統合することにより開発とイテレーションを迅速かつ簡単に行えます。

コラボレーションと標準化によるデータ統合

Cloud Data Fusion は、既製の変換に加え、カスタマイズした接続と変換の内部向けライブラリを作成して、チーム全体で検証、共有、再利用する機能を提供します。そのため、コラボレーション データ エンジニアリングの基盤を構築でき、生産性が向上します。これにより、ETL デベロッパーやデータ エンジニアの作業時間が短縮され、重要な効果として、コードの品質向上にかける労力を軽減できます。

すべての機能を表示

導入事例

Star Media Group の事例紹介
Star Media Group は Cloud Data Fusion を使ってエンゲージメント ビジネスに参入しました。
全文を読む

事例の概要

  • 技術主導の変化による変革

  • パーソナライズされた関連コンテンツがユーザーに提供される

  • 費用対効果と拡張性を満足するための要件

業種

ドキュメント

チュートリアル
Cloud Data Fusion の有効化

Google Cloud プロジェクトで Cloud Data Fusion API を有効にする方法を説明します。

チュートリアル
Cloud Data Fusion のコンセプトの概要

Cloud Data Fusion のコンセプトと機能について学ぶ

チュートリアル
データリネージの探索

このチュートリアルでは、Cloud Data Fusion を使用して、データリネージ(データの起源とその経緯)を調べる方法を説明します。

チュートリアル
Cloud Data Fusion での JDBC ドライバの使用

Cloud Data Fusion パイプラインで Java Database Connectivity(JDBC)ドライバを使用する方法を確認します。

チュートリアル
Google Cloud 上のデータ エンジニアリング

この 4 日間のクラスルーム トレーニングで、Google Cloud 上のデータ処理システムの設計および構築方法を学習します。

ユースケース

ユースケース
Google Cloud 上のより安全で最新のデータレイク

Cloud Data Fusion を使うと、サイロ化されたオンプレミス プラットフォームから取得したデータを統合することで、Google Cloud 上にスケーラブルで分散型のデータレイクを構築できるようになります。クラウドのスケーリングを活用してデータを一元管理できるようになるため、結果的に、データから得られる価値をさらに高めることができます。Cloud Data Fusion のセルフサービス機能を使用すれば、プロセスの可視化をさらに進めて、運用サポート全体の費用を削減できます。

ユースケース
BigQuery を利用したアジャイルなデータ ウェアハウス

Cloud Data Fusion を使うと、組織がデータサイロを分析してお客様をより的確に理解したり、BigQuery 内で、アジャイルなクラウドベースのデータ ウェアハウス ソリューションを開発したりできます。顧客のエンゲージメントと行動の全体像を正しく把握することでカスタマー エクスペリエンスが改善され、お客様の維持率とお客様一人当たりの収益の増加につながります。

ユースケース
分析環境の統合

現在、多くのユーザーが、コストのかかる無数のオンプレミス データマートを統合した分析環境を構築したいと考えています。接続されていないさまざまな種類のツールを使ったり一時しのぎの措置を行うと、データ品質とセキュリティに課題を残します。Cloud Data Fusion には多様なコネクタ、可視化されたインターフェース、ビジネス ロジックに基づく抽象化が備えられているため、TCO を削減し、セルフサービスと標準化を促進して、繰り返しの作業を減らすことができます。

すべての機能

コードを意識させないセルフサービス コードを意識させないグラフィカル インターフェースを使用することで、技術的な知識がなくてもマウス操作だけでデータを統合できるため、ボトルネックがなくなります。
コラボレーション データ エンジニアリング Cloud Data Fusion は、カスタマイズした接続と変換の内部向けライブラリを作成して、組織全体で検証、共有、再利用することを可能にします。
Google Cloud ネイティブ フルマネージドで Google Cloud ネイティブなアーキテクチャにより、Google Cloud のスケーラビリティ、信頼性、セキュリティ、プライバシー機能を実現します。
エンタープライズ クラスのセキュリティ Cloud Identity and Access Management (IAM)プライベート IPVPC-SC、および CMEK の統合により、エンタープライズ セキュリティを提供し、コンプライアンスとデータ保護を実現することでリスクを緩和します。
メタデータと系統の統合 技術的なメタデータとビジネス メタデータを使用することで、統合されたデータセットを検索できます。統合されたすべてのデータセットのリネージを、データセット レベルと項目レベルでトラックできます。
シームレスな運用 REST API、時間ベースのスケジュール、パイプライン状態ベースのトリガー、ログ、指標、モニタリング ダッシュボードを備えているため、ミッション クリティカルな環境でも簡単に運用できます。
包括的な統合ツールキット 最新のものから従来のものまで、さまざまなシステムへの組み込みコネクタ、コードを意識させない変換、条件付き処理、前 / 後処理、アラートと通知、エラー処理によって、包括的なデータ統合を実現します。
ハイブリッド対応 オープンソースを利用することで、ハイブリッド環境とマルチクラウド環境にまたがる標準化されたデータ統合ソリューションを構築するために必要な柔軟性と移植性が提供されます。

料金

Cloud Data Fusion の料金はインターフェースのインスタンス時間と Dataproc の VM に分けられます。なお、Basic エディションでは、1 アカウントにつき毎月最初の 120 時間が無料で利用できます。

エディション Cloud Data Fusion インスタンス時間あたりの料金 サポートされる同時パイプライン数 サポートされるユーザー数
Basic US$1.80 無制限 無制限
Enterprise US$4.20 無制限 無制限