Cloud Data Fusion

Google Cloud Next Tokyo：7/30、31 東京ビッグサイトにて開催！

移動

Cloud Data Fusion

フルマネージドでクラウドネイティブなデータをあらゆる規模で統合できます。

新規のお客様には、Data Fusion で使用できる無料クレジット $300 分を差し上げます。すべてのお客様は、1 アカウントにつきに毎月最初の 120 時間のパイプライン開発を無料で利用できます。クレジットに対する課金はありません。

マウスだけで視覚的に操作できるインターフェースによって、コードを意識せずに ETL / ELT パイプラインをデプロイ可能
事前構成されたコネクタと変換を 150 以上備える幅広いライブラリを追加費用なしで利用可能
ネイティブに統合された最高水準の Google Cloud サービス
エンドツーエンドのデータリネージで根本原因と影響範囲を分析
オープンソースのコアで構成されており（CDAP）パイプラインの移植をサポート

動画のサムネイル: 3 人の人たちがウィンドウを通り過ぎて、さまざまなデータストレージアーキテクチャに向かって階段を上っている

Cloud Data Fusion の概要

1:54

利点

技術的なボトルネックを回避して生産性を改善

Data Fusion はドラッグ＆ドロップで直感的に操作でき、既製のコネクタやセルフサービスモデルでコードを意識せずにデータ統合することによって、専門家に依頼することによるボトルネックを解消して、迅速に分析情報を取得できます。

パイプラインの総所有コストを削減

Data Fusion はサーバーレスで Managed Service for Apache Spark などの Google サービスの拡張性と信頼性を活用するアプローチであり、総所有コストを低く抑えながらデータ統合機能のメリットを実現できます。

データガバナンス基盤によって構築

Data Fusion にはエンドツーエンドのデータリネージ、統合メタデータ、クラウドネイティブなセキュリティやデータ保護サービスなどの機能が組み込まれており、根本原因や影響範囲の分析に加え、コンプライアンス対応を支援します。

主な機能

オープンコアでハイブリッドおよびマルチクラウドの統合を実現

Data Fusion はオープンソースプロジェクトである CDAP を使って構築されており、このオープンコアによってデータパイプラインの移植性をユーザーに対して実現しています。オンプレミスとパブリッククラウドの両方のプラットフォームと幅広く統合できる CDAP は、Cloud Data Fusion ユーザーが部門の垣根を越えてこれまでアクセスできなかった分析情報を供給することを可能にします。

業界をリードする Google のビッグデータツールと統合

Data Fusion と Google Cloud を統合することにより、データセキュリティが簡素化され、データをすぐに分析に利用できるようになります。Cloud Storage と Managed Service for Apache Spark でデータレイクをキュレートする場合、データを BigQuery に移行してデータウェアハウジングを行う場合、またはデータを変換して Spanner などのリレーショナルストアに格納する場合、Cloud Data Fusion の統合により開発とイテレーションを迅速かつ簡単に行えます。

コラボレーションと標準化によるデータの統合

Cloud Data Fusion は、バッチ処理とリアルタイム処理の両方に対応する既製の変換を可能にします。カスタマイズした接続と変換の内部向けライブラリを作成して、チーム全体での検証、共有、再利用を可能にします。そのため、コラボレーションデータエンジニアリングの基盤を構築でき、生産性が向上します。これにより、ETL デベロッパーやデータエンジニアの作業時間が短縮され、重要な効果として、コードの品質向上にかける労力を軽減できます。

Data Fusion の経済的メリットとその代替となるデータ統合

レポートをダウンロード

導入事例

Cloud Data Fusion を利用しているお客様

Blog post

Liveramp は Cloud Data Fusion で ID データマネジメントを拡張

所要時間: 5 分

Case study

Star Media Group は Cloud Data Fusion を使ってエンゲージメントビジネスに参入しました。

所要時間: 5 分

最新情報を得る

Google Cloud のニュースレターにご登録いただくと、プロダクトの最新情報、イベント情報、特典のお知らせなどが配信されます。

Video

SAP から Google Cloud にデータを移行する方法動画を見る

Video

Data Fusion による組み込みデータラングリング動画を見る

Blog post

Cloud Data Fusion でデータパイプラインの管理の総保有コストを 80% 削減詳細

Blog post

Data Fusion でデータサイロを統合ブログを読む

リアルタイムの変更データキャプチャを使用した BigQuery へのデータレプリケーションのアイコン

Blog post

リアルタイムの変更データキャプチャを使用した BigQuery へのデータレプリケーションブログを読む

連携してより効率的に: Managed Service for Apache Airflow を使用した Data Fusion パイプラインのオーケストレーションのアイコン

Blog post

連携してより効率的に: Managed Service for Apache Airflow を使用した Data Fusion パイプラインのオーケストレーションブログを読む

ドキュメント

Tutorial

Cloud Data Fusion の有効化

Google Cloud プロジェクトで Cloud Data Fusion API を有効にする方法を説明します。

Tutorial

Cloud Data Fusion のコンセプトの概要

Cloud Data Fusion のコンセプトと機能について学びます。

Tutorial

データリネージの探索

このチュートリアルでは、Cloud Data Fusion を使用して、データリネージ（データの起源とその経緯）を調べる方法を説明します。

Tutorial

Cloud Data Fusion での JDBC ドライバの使用

Cloud Data Fusion パイプラインで Java Database Connectivity（JDBC）ドライバを使用する方法を確認します。

Tutorial

Data Engineering on Google Cloud

この 4 日間のクラスルームトレーニングで、Google Cloud 上のデータ処理システムの設計および構築方法を学習します。

お探しのものが見つからない場合

リリースノート

Cloud Data Fusion の最新リリースについて確認する

ユースケース

Google Cloud 上のより安全で最新のデータレイク

Cloud Data Fusion を使うと、サイロ化されたオンプレミスプラットフォームから取得したデータを統合することで、Google Cloud 上にスケーラブルで分散型のデータレイクを構築できるようになります。クラウドのスケーリングを活用してデータを一元管理できるようになるため、結果的に、データから得られる価値をさらに高めることができます。Cloud Data Fusion のセルフサービス機能を使用すれば、プロセスの可視化をさらに進めて、運用サポート全体の費用を削減できます。

ユースケース

BigQuery を利用したアジャイルなデータウェアハウス

Cloud Data Fusion を使うと、組織がデータサイロを分析してお客様をより的確に理解したり、BigQuery 内で、アジャイルなクラウドベースのデータウェアハウスソリューションを開発したりできます。顧客エンゲージメントと行動の全体像を正しく把握することでカスタマーエクスペリエンスが向上し、お客様の維持率とお客様一人当たりの収益の増加につながります。

ユースケース

分析環境の統合

現在、多くのユーザーが、コストのかかる無数のオンプレミスデータマートを統合した分析環境を構築したいと考えています。接続されていないさまざまな種類のツールを使ったり一時しのぎの措置を行うと、データ品質とセキュリティに課題を残します。Cloud Data Fusion には多様なコネクタ、可視化されたインターフェース、ビジネスロジックに基づく抽象化が備えられているため、TCO を削減し、セルフサービスと標準化を促進して、繰り返しの作業を減らすことができます。

すべての機能

コーディング不要のセルフサービス	コードを意識させないグラフィカルインターフェースを使用することで、技術的な知識がなくてもマウス操作だけでデータを統合できるため、ボトルネックがなくなります。
コラボレーションデータエンジニアリング	Cloud Data Fusion は、内部ライブラリを作成して接続と変換をカスタマイズし、組織全体で検証、共有、再利用できます。
Google Cloud ネイティブ	フルマネージドで Google Cloud ネイティブなアーキテクチャにより、Google Cloud のスケーラビリティ、信頼性、セキュリティ、プライバシー機能を最大限に活用します。
リアルタイムのデータ統合	Data Fusion のレプリケーション機能を使用すると、SQL Server、Oracle、MySQL などのトランザクションデータベースとオペレーショナルデータベースを数回クリックするだけで、BigQuery に直接レプリケートできます。Datastream との統合により、変更ストリームを BigQuery に送信して継続的な分析を行えます。実現可能性評価を使用して、開発イテレーションとパフォーマンス/ヘルスモニタリングのオブザーバビリティを強化します。
バッチ統合	ファイルシステム、オブジェクトストア、リレーショナルデータベースや NoSQL データベース、SaaS システム、メインフレームなどの一般的なデータソースのサポートにより、大量のデータパイプラインの設計、実行、運用を定期的に行います。
エンタープライズグレードのセキュリティ	Cloud Identity and Access Management (IAM)、プライベート IP、VPC-SC、および CMEK の統合により、エンタープライズセキュリティを提供し、コンプライアンスとデータ保護を実現することでリスクを緩和します。
メタデータと系統の統合	技術的なメタデータとビジネスメタデータを使用することで、統合されたデータセットを検索できます。統合されたすべてのデータセットの系統を、データセットレベルと項目レベルでトラックできます。
シームレスな運用	REST API、時間ベースのスケジュール、パイプライン状態ベースのトリガー、ログ、指標、モニタリングダッシュボードを備えているため、ミッションクリティカルな環境でも簡単に運用できます。
包括的な統合ツールキット	最新のものから従来のものまで、さまざまなシステムへの組み込みコネクタ、コードを意識させない変換、条件付き処理、前 / 後処理、アラートと通知、エラー処理によって、包括的なデータ統合を実現します。
ハイブリッド対応	オープンソースを利用することで、ハイブリッド環境とマルチクラウド環境にまたがる標準化されたデータ統合ソリューションを構築するために必要な柔軟性とポータビリティが提供されます。

料金

Cloud Data Fusion の料金は以下の項目に基づいて設定されます。

1. 設計費用: 開発および実行するパイプラインの数ではなく、インスタンスを実行する時間数が基準となります。なお、Basic エディションでは、1 アカウントにつき毎月最初の 120 時間が無料で利用できます。

2. 処理費用: パイプラインの実行に使用される Managed Service for Apache Spark クラスタの費用です。

Edition	Cloud Data Fusion インスタンス時間あたりの料金	サポートされる同時パイプライン数	サポートされるユーザー数
デベロッパー	0.35 米ドル	2（推奨）	2（推奨）
ベーシック	1.80 米ドル	無制限	無制限
Enterprise	4.20 米ドル	無制限	無制限

次のステップ

$300 分の無料クレジットと 20 以上の無料枠プロダクトを活用して、Google Cloud で構築を開始しましょう。

開始にあたりサポートが必要な場合
お問い合わせ
信頼できるパートナーと連携する
パートナーを探す
もっと見る
すべてのプロダクトを見る

技術的なボトルネックを回避して生産性を改善

パイプラインの総所有コストを削減

データ ガバナンス基盤によって構築

主な機能

オープンコアでハイブリッドおよびマルチクラウドの統合を実現

業界をリードする Google のビッグデータ ツールと統合

コラボレーションと標準化によるデータの統合

Cloud Data Fusion を利用しているお客様

最新情報を得る

ドキュメント

Cloud Data Fusion の有効化

Cloud Data Fusion のコンセプトの概要

データリネージの探索

Cloud Data Fusion での JDBC ドライバの使用

Data Engineering on Google Cloud

お探しのものが見つからない場合

その他のドキュメントを見る

ユースケース

Google Cloud 上のより安全で最新のデータレイク

BigQuery を利用したアジャイルなデータ ウェアハウス

分析環境の統合

すべての機能

料金

次のステップ

開始にあたりサポートが必要な場合

信頼できるパートナーと連携する

もっと見る

データガバナンス基盤によって構築

業界をリードする Google のビッグデータツールと統合

BigQuery を利用したアジャイルなデータウェアハウス