Cloud Data Fusion

フルマネージドでクラウド ネイティブなデータをあらゆる規模で統合できます。

無料トライアル
  • action/check_circle_24px Sketch で作成。

    マウスだけで視覚的に操作できるインターフェースによって、コードを意識せずに ETL/ELT パイプラインをデプロイ可能

  • action/check_circle_24px Sketch で作成。

    事前構成された接続と変換を 150 以上備える幅広いライブラリを追加費用なしで利用可能

  • action/check_circle_24px Sketch で作成。

    ネイティブに統合された最高水準の Google Cloud サービス

  • action/check_circle_24px Sketch で作成。

    根本原因と影響範囲の分析に利用するエンドツーエンドのデータリネージ

  • action/check_circle_24px Sketch で作成。

    オープンソースのコアで構成されており(CDAP)パイプラインの移植をサポート

技術的なボトルネックを回避して生産性が向上する

Data Fusion はドラッグ&ドロップで直感的に操作でき、既製のコネクタやセルフサービス モデルでコードを意識せずにデータ統合することによって、専門家に依頼することによるボトルネックを解消して、迅速に分析情報を取得できます。

パイプラインのオーナー権限について合計費用を削減

Dataproc などの Google サービスの拡張性と信頼性を活用したサーバーレスのアプローチは、Data Fusion がオーナー権限についての合計費用を低く抑えながらデータ統合機能のメリットを提供することを意味します。

データ ガバナンス基盤によって構築

エンドツーエンドのデータリネージ、統合メタデータ、クラウド ネイティブなセキュリティやデータ保護サービスなどの組み込み機能を使って、Data Fusion はチームが根本原因や影響範囲を分析したり、コンプライアンスを遵守できるよう支援します。

主な機能

オープンコアでハイブリッドおよびマルチクラウドの統合を実現

Data Fusion はオープンソース プロジェクトである CDAP を使って構築されており、このオープンコアによってデータ パイプラインの移植性をユーザーに対して提供しています。オンプレミスとパブリック クラウドの両方のプラットフォームと幅広く統合できる CDAP は、Cloud Data Fusion ユーザーが部門の垣根を越えてこれまでアクセスできなかった分析情報を供給することを可能にします。

業界をリードする Google のビッグデータ ツールと統合

Data Fusion が Google Cloud と統合されることによってデータ セキュリティを簡単に確保でき、データをすぐに分析できるようになります。Cloud StorageDataproc でデータレイクをキュレートする場合、データを BigQuery に移行してデータ ウェアハウジングを行う場合、またはデータを変換して Cloud Spanner などのリレーショナル ストアに格納する場合、Cloud Data Fusion で統合することにより開発とイテレーションを迅速かつ簡単に行えます。

コラボレーションと標準化によるデータ統合

Cloud Data Fusion は、既製の変換と内部ライブラリを作成して接続と変換をカスタマイズし、チーム全体で検証、共有、再利用する機能を提供します。そのため、コラボレーション データ エンジニアリングの基盤を構築でき、生産性が向上します。これにより、ETL ディベロッパーやデータ エンジニアの作業時間が短縮され、重要な効果として、コードの品質向上にかける労力を軽減できます。

すべての機能を表示

導入事例

Star Media Group の事例紹介
Star Media Group は Cloud Data Fusion を使ってエンゲージメント ビジネスに参入しました。
全文を読む

事例の概要

  • 技術主導の変化による変革

  • パーソナライズされた関連コンテンツがユーザーに提供される

  • 費用対効果と拡張性を満足するための要件

業種

ドキュメント

チュートリアル
Cloud Data Fusion の有効化

Google Cloud プロジェクトで Cloud Data Fusion API を有効にする方法を説明します。

チュートリアル
Cloud Data Fusion のコンセプトの概要

Cloud Data Fusion のコンセプトと機能について学ぶ

チュートリアル
データリネージの探索

このチュートリアルでは、Cloud Data Fusion を使用して、データリネージ(データの起源とその経緯)を調べる方法を説明します。

チュートリアル
Cloud Data Fusion での JDBC ドライバの使用

Cloud Data Fusion パイプラインで Java Database Connectivity(JDBC)ドライバを使用する方法を確認します。

チュートリアル
Google Cloud 上のデータ エンジニアリング

この 4 日間のクラスルーム トレーニングで、Google Cloud 上のデータ処理システムの設計および構築方法を学習します。

ユースケース

ユースケース
Google Cloud 上のより安全で最新のデータレイク

Cloud Data Fusion を使うと、サイロ化されたオンプレミス プラットフォームから取得したデータを統合することで、Google Cloud 上にスケーラブルで分散型のデータレイクを構築できるようになります。クラウドのスケーリングを活用してデータを一元管理できるようになるため、結果的に、データから得られる価値をさらに高めることができます。Cloud Data Fusion のセルフサービス機能を使用すれば、プロセスの可視化をさらに進めて、運用サポート全体の費用を削減できます。

ユースケース
BigQuery を利用した俊敏性のあるデータ ウェアハウス

Cloud Data Fusion を使うと、組織がデータサイロを分析してお客様をより的確に理解したり、BigQuery 内で、俊敏性のあるクラウドベースのデータ ウェアハウス ソリューションを開発したりできます。顧客のエンゲージメントと行動の全体像を正しく把握することでカスタマー エクスペリエンスが改善され、お客様の維持率とお客様一人当たりの収益の増加につながります。

ユースケース
分析環境の統合

現在、多くのユーザーが、コストのかかる無数のオンプレミス データマートを統合した分析環境を構築したいと考えています。接続されていないさまざまな種類のツールを使ったり一時しのぎの措置を行うと、データ品質とセキュリティに課題を残します。Cloud Data Fusion には多様なコネクタ、可視化されたインターフェース、ビジネス ロジックに基づく抽象化が備えられているため、TCO を削減し、セルフサービスと標準化を促進して、繰り返しの作業を減らすことができます。

すべての機能

コードを意識させないセルフサービス コードを意識させないグラフィカル インターフェースを使用することで、技術的な知識がなくてもマウス操作だけでデータを統合できるため、ボトルネックがなくなります。
コラボレーション データ エンジニアリング Cloud Data Fusion は、内部ライブラリを作成して接続と変換をカスタマイズし、組織全体で検証、共有、再利用できます。
Google Cloud ネイティブ フルマネージドで Google Cloud ネイティブなアーキテクチャにより、Google Cloud のスケーラビリティ、信頼性、セキュリティ、プライバシー機能を実現します。
エンタープライズ クラスのセキュリティ Cloud Identity and Access Management (IAM)Private IPVPC-SC、および CMEK の統合により、エンタープライズ セキュリティを提供し、コンプライアンスとデータ保護を実現することでリスクを緩和します。
メタデータと系統の統合 技術的なメタデータとビジネス メタデータを使用することで、統合されたデータセットを検索できます。統合されたすべてのデータセットの系統を、データセット レベルと項目レベルでトラックできます。
シームレスな運用 REST API、時間ベースのスケジュール、パイプライン状態ベースのトリガー、ログ、指標、モニタリング ダッシュボードを備えているため、ミッション クリティカルな環境でも簡単に運用できます。
包括的な統合ツールキット 最新のものから従来のものまで、さまざまなシステムへの組み込みコネクタ、コードを意識させない変換、条件付き処理、前 / 後処理、アラートと通知、エラー処理によって、包括的なデータ統合を実現します。
ハイブリッド対応 オープンソースを利用することで、ハイブリッド環境とマルチクラウド環境にまたがる標準化されたデータ統合ソリューションを構築するために必要な柔軟性とポータビリティが提供されます。

料金

Cloud Data Fusion の料金はインターフェースのインスタンス時間と Dataproc の VM に分けられます。なお、Basic エディションでは、1 アカウントにつき毎月最初の 120 時間が無料で利用できます。

エディション Cloud Data Fusion インスタンス時間あたりの料金 サポートされる同時パイプライン数 サポートされるユーザー数
Basic US$1.80 無制限 無制限
Enterprise US$4.20 無制限 無制限