【Next Tokyo ’24】セッションのアーカイブ動画とスライドを公開中です。生成 AI を中心とした Google Cloud のアップデートや顧客事例をチェックしましょう。
移動
Cloud Data Fusion

Cloud Data Fusion

フルマネージドでクラウドネイティブなデータをあらゆる規模で統合できます。

新規のお客様には、Data Fusion で使用できる無料クレジット $300 分を差し上げます。すべてのお客様は、1 アカウントにつきに毎月最初の 120 時間のパイプライン開発を無料で利用できます。クレジットに対する課金はありません。

  • マウスだけで視覚的に操作できるインターフェースによって、コードを意識せずに ETL / ELT パイプラインをデプロイ可能

  • 事前構成されたコネクタと変換を 150 以上備える幅広いライブラリを追加費用なしで利用可能

  • ネイティブに統合された最高水準の Google Cloud サービス

  • エンドツーエンドのデータリネージで根本原因と影響範囲を分析

  • オープンソースのコアで構成されており(CDAP)パイプラインの移植をサポート

利点

技術的なボトルネックを回避して生産性を改善

Data Fusion はドラッグ&ドロップで直感的に操作でき、既製のコネクタやセルフサービス モデルでコードを意識せずにデータ統合することによって、専門家に依頼することによるボトルネックを解消して、迅速に分析情報を取得できます。

パイプラインの総所有コストを削減

Data Fusion はサーバーレスで Dataproc などの Google サービスの拡張性と信頼性を活用するアプローチであり、オーナー権限についての合計費用を低く抑えながらデータ統合機能のメリットを提供できます。

データ ガバナンス基盤によって構築

Data Fusion にはエンドツーエンドのデータリネージ、統合メタデータ、クラウド ネイティブなセキュリティやデータ保護サービスなどの機能が組み込まれており、根本原因や影響範囲の分析に加え、コンプライアンス対応を支援します。

主な機能

主な機能

オープンコアでハイブリッドおよびマルチクラウドの統合を実現

Data Fusion はオープンソース プロジェクトである CDAP を使って構築されており、このオープンコアによってデータ パイプラインの移植性をユーザーに対して提供しています。オンプレミスとパブリック クラウドの両方のプラットフォームと幅広く統合できる CDAP は、Cloud Data Fusion ユーザーが部門の垣根を越えてこれまでアクセスできなかった分析情報を供給することを可能にします。

業界をリードする Google のビッグデータ ツールと統合

Data Fusion と Google Cloud を統合することにより、データ セキュリティが簡素化され、データをすぐに分析に利用できるようになります。Cloud StorageDataproc でデータレイクをキュレートする、データを BigQuery に移行してデータ ウェアハウジングを行う、データを変換して Cloud Spanner などのリレーショナル ストアに格納するといったさまざまなケースで、Cloud Data Fusion の統合により開発とイテレーションを迅速かつ簡単に行えます。

コラボレーションと標準化によるデータ統合

Cloud Data Fusion は、バッチ処理とリアルタイム処理の両方に対応する既製の変換を提供します。カスタマイズした接続と変換の内部向けライブラリを作成して、チーム全体での検証、共有、再利用を可能にします。そのため、コラボレーション データ エンジニアリングの基盤を構築でき、生産性が向上します。これにより、ETL デベロッパーやデータ エンジニアの作業時間が短縮され、重要な効果として、コードの品質向上にかける労力を軽減できます。

すべての機能を表示

ドキュメント

ドキュメント

Tutorial

Cloud Data Fusion の有効化

Google Cloud プロジェクトで Cloud Data Fusion API を有効にする方法を説明します。
Tutorial

Cloud Data Fusion のコンセプトの概要

Cloud Data Fusion のコンセプトと機能について説明します。
Tutorial

データリネージの探索

このチュートリアルでは、Cloud Data Fusion を使用して、データリネージ(データの起源とその経緯)を調べる方法を説明します。
Tutorial

Cloud Data Fusion での JDBC ドライバの使用

Cloud Data Fusion パイプラインで Java Database Connectivity(JDBC)ドライバを使用する方法を確認します。
Tutorial

Google Cloud 上のデータ エンジニアリング

この 4 日間のクラスルーム トレーニングで、Google Cloud 上のデータ処理システムの設計および構築方法を学習します。

お探しのものが見つからない場合

ユースケース

ユースケース

使用例
Google Cloud 上のより安全で最新のデータレイク

Cloud Data Fusion を使うと、サイロ化されたオンプレミス プラットフォームから取得したデータを統合することで、Google Cloud 上にスケーラブルで分散型のデータレイクを構築できるようになります。クラウドのスケーリングを活用してデータを一元管理できるようになるため、結果的に、データから得られる価値をさらに高めることができます。Cloud Data Fusion のセルフサービス機能を使用すれば、プロセスの可視化をさらに進めて、運用サポート全体の費用を削減できます。

使用例
BigQuery を利用したアジャイルなデータ ウェアハウス

Cloud Data Fusion を使うと、組織がデータサイロを分析してお客様をより的確に理解したり、BigQuery 内で、アジャイルなクラウドベースのデータ ウェアハウス ソリューションを開発したりできます。顧客のエンゲージメントと行動の全体像を正しく把握することでカスタマー エクスペリエンスが改善され、お客様の維持率とお客様一人当たりの収益の増加につながります。

使用例
分析環境の統合

現在、多くのユーザーが、コストのかかる無数のオンプレミス データマートを統合した分析環境を構築したいと考えています。接続されていないさまざまな種類のツールを使ったり一時しのぎの措置を行うと、データ品質とセキュリティに課題を残します。Cloud Data Fusion には多様なコネクタ、可視化されたインターフェース、ビジネス ロジックに基づく抽象化が備えられているため、TCO を削減し、セルフサービスと標準化を促進して、繰り返しの作業を減らすことができます。

すべての機能

すべての機能

コードを意識させないセルフサービス
コードを意識させないグラフィカル インターフェースを使用することで、技術的な知識がなくてもマウス操作だけでデータを統合できるため、ボトルネックがなくなります。
コラボレーション データ エンジニアリング
Cloud Data Fusion は、カスタマイズした接続と変換の内部向けライブラリを作成して、組織全体で検証、共有、再利用することを可能にします。
Google Cloud ネイティブ
フルマネージドで Google Cloud ネイティブなアーキテクチャにより、Google Cloud のスケーラビリティ、信頼性、セキュリティ、プライバシー機能を実現します。
リアルタイム データ統合
Data Fusion のレプリケーション機能を使用すると、SQL Server、Oracle、MySQL などのトランザクション データベースとオペレーショナル データベースを数回クリックするだけで、BigQuery に直接レプリケートできます。 Datastream との統合により、変更ストリームを BigQuery に送信して継続的な分析を行えます。実現可能性評価を使用して、開発イテレーションとパフォーマンス/ヘルス モニタリングのオブザーバビリティを強化します。
バッチ処理での統合
ファイル システム、オブジェクト ストア、リレーショナル データベースや NoSQL データベース、SaaS システム、メインフレームなどの一般的なデータソースのサポートにより、大量のデータ パイプラインの設計、実行、運用を定期的に行います。
エンタープライズ クラスのセキュリティ
Cloud Identity and Access Management (IAM)プライベート IPVPC-SC、および CMEK の統合により、エンタープライズ セキュリティを提供し、コンプライアンスとデータ保護を実現することでリスクを緩和します。
メタデータと系統の統合
技術的なメタデータとビジネス メタデータを使用することで、統合されたデータセットを検索できます。統合されたすべてのデータセットのリネージを、データセット レベルと項目レベルでトラックできます。
シームレスな運用
REST API、時間ベースのスケジュール、パイプライン状態ベースのトリガー、ログ、指標、モニタリング ダッシュボードを備えているため、ミッション クリティカルな環境でも簡単に運用できます。
包括的な統合ツールキット
最新のものから従来のものまで、さまざまなシステムへの組み込みコネクタ、コードを意識させない変換、条件付き処理、前 / 後処理、アラートと通知、エラー処理によって、包括的なデータ統合を実現します。
ハイブリッド対応
オープンソースを利用することで、ハイブリッド環境とマルチクラウド環境にまたがる標準化されたデータ統合ソリューションを構築するために必要な柔軟性と移植性が提供されます。

料金

料金

Cloud Data Fusion の料金は以下の項目に基づいて設定されます。

1. 設計費用: 開発および実行するパイプラインの数ではなく、インスタンスを実行する時間数が基準となります。なお、Basic エディションでは、1 アカウントにつき毎月最初の 120 時間が無料で利用できます。

2. 処理費用: パイプラインの実行に使用される Dataproc クラスタの費用です。

エディション
Cloud Data Fusion インスタンス時間あたりの料金
サポートされる同時パイプライン数
サポートされるユーザー数
デベロッパー
US$0.35
2(推奨)
2(推奨)

基本

US$1.80
無制限
無制限

Enterprise

US$4.20
無制限
無制限

次のステップ

$300 分の無料クレジットと 20 以上の Always Free プロダクトを活用して、Google Cloud で構築を開始しましょう。

Google Cloud
  • ‪English‬
  • ‪Deutsch‬
  • ‪Español‬
  • ‪Español (Latinoamérica)‬
  • ‪Français‬
  • ‪Indonesia‬
  • ‪Italiano‬
  • ‪Português (Brasil)‬
  • ‪简体中文‬
  • ‪繁體中文‬
  • ‪日本語‬
  • ‪한국어‬
コンソール
  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud