フルマネージドでクラウドネイティブなデータをあらゆる規模で統合できます。
新規のお客様には、Data Fusion で使用できる無料クレジット $300 分を差し上げます。すべてのお客様は、1 アカウントにつきに毎月最初の 120 時間のパイプライン開発を無料で利用できます。クレジットに対する課金はありません。
利点
Data Fusion はドラッグ&ドロップで直感的に操作でき、既製のコネクタやセルフサービス モデルでコードを意識せずにデータ統合することによって、専門家に依頼することによるボトルネックを解消して、迅速に分析情報を取得できます。
Data Fusion はサーバーレスで Dataproc などの Google サービスの拡張性と信頼性を活用するアプローチであり、オーナー権限についての合計費用を低く抑えながらデータ統合機能のメリットを提供できます。
Data Fusion にはエンドツーエンドのデータリネージ、統合メタデータ、クラウド ネイティブなセキュリティやデータ保護サービスなどの機能が組み込まれており、根本原因や影響範囲の分析に加え、コンプライアンス対応を支援します。
主な機能
Data Fusion はオープンソース プロジェクトである CDAP を使って構築されており、このオープンコアによってデータ パイプラインの移植性をユーザーに対して提供しています。オンプレミスとパブリック クラウドの両方のプラットフォームと幅広く統合できる CDAP は、Cloud Data Fusion ユーザーが部門の垣根を越えてこれまでアクセスできなかった分析情報を供給することを可能にします。
Data Fusion と Google Cloud を統合することにより、データ セキュリティが簡素化され、データをすぐに分析に利用できるようになります。Cloud Storage と Dataproc でデータレイクをキュレートする、データを BigQuery に移行してデータ ウェアハウジングを行う、データを変換して Cloud Spanner などのリレーショナル ストアに格納するといったさまざまなケースで、Cloud Data Fusion の統合により開発とイテレーションを迅速かつ簡単に行えます。
Cloud Data Fusion は、バッチ処理とリアルタイム処理の両方に対応する既製の変換を提供します。カスタマイズした接続と変換の内部向けライブラリを作成して、チーム全体での検証、共有、再利用を可能にします。そのため、コラボレーション データ エンジニアリングの基盤を構築でき、生産性が向上します。これにより、ETL デベロッパーやデータ エンジニアの作業時間が短縮され、重要な効果として、コードの品質向上にかける労力を軽減できます。
ドキュメント
ユースケース
Cloud Data Fusion を使うと、サイロ化されたオンプレミス プラットフォームから取得したデータを統合することで、Google Cloud 上にスケーラブルで分散型のデータレイクを構築できるようになります。クラウドのスケーリングを活用してデータを一元管理できるようになるため、結果的に、データから得られる価値をさらに高めることができます。Cloud Data Fusion のセルフサービス機能を使用すれば、プロセスの可視化をさらに進めて、運用サポート全体の費用を削減できます。
Cloud Data Fusion を使うと、組織がデータサイロを分析してお客様をより的確に理解したり、BigQuery 内で、アジャイルなクラウドベースのデータ ウェアハウス ソリューションを開発したりできます。顧客のエンゲージメントと行動の全体像を正しく把握することでカスタマー エクスペリエンスが改善され、お客様の維持率とお客様一人当たりの収益の増加につながります。
現在、多くのユーザーが、コストのかかる無数のオンプレミス データマートを統合した分析環境を構築したいと考えています。接続されていないさまざまな種類のツールを使ったり一時しのぎの措置を行うと、データ品質とセキュリティに課題を残します。Cloud Data Fusion には多様なコネクタ、可視化されたインターフェース、ビジネス ロジックに基づく抽象化が備えられているため、TCO を削減し、セルフサービスと標準化を促進して、繰り返しの作業を減らすことができます。
すべての機能
コードを意識させないセルフサービス | コードを意識させないグラフィカル インターフェースを使用することで、技術的な知識がなくてもマウス操作だけでデータを統合できるため、ボトルネックがなくなります。 |
コラボレーション データ エンジニアリング | Cloud Data Fusion は、カスタマイズした接続と変換の内部向けライブラリを作成して、組織全体で検証、共有、再利用することを可能にします。 |
Google Cloud ネイティブ | フルマネージドで Google Cloud ネイティブなアーキテクチャにより、Google Cloud のスケーラビリティ、信頼性、セキュリティ、プライバシー機能を実現します。 |
リアルタイム データ統合 | Data Fusion のレプリケーション機能を使用すると、SQL Server、Oracle、MySQL などのトランザクション データベースとオペレーショナル データベースを数回クリックするだけで、BigQuery に直接レプリケートできます。 Datastream との統合により、変更ストリームを BigQuery に送信して継続的な分析を行えます。実現可能性評価を使用して、開発イテレーションとパフォーマンス/ヘルス モニタリングのオブザーバビリティを強化します。 |
バッチ処理での統合 | ファイル システム、オブジェクト ストア、リレーショナル データベースや NoSQL データベース、SaaS システム、メインフレームなどの一般的なデータソースのサポートにより、大量のデータ パイプラインの設計、実行、運用を定期的に行います。 |
エンタープライズ クラスのセキュリティ | Cloud Identity and Access Management (IAM)、プライベート IP、VPC-SC、および CMEK の統合により、エンタープライズ セキュリティを提供し、コンプライアンスとデータ保護を実現することでリスクを緩和します。 |
メタデータと系統の統合 | 技術的なメタデータとビジネス メタデータを使用することで、統合されたデータセットを検索できます。統合されたすべてのデータセットのリネージを、データセット レベルと項目レベルでトラックできます。 |
シームレスな運用 | REST API、時間ベースのスケジュール、パイプライン状態ベースのトリガー、ログ、指標、モニタリング ダッシュボードを備えているため、ミッション クリティカルな環境でも簡単に運用できます。 |
包括的な統合ツールキット | 最新のものから従来のものまで、さまざまなシステムへの組み込みコネクタ、コードを意識させない変換、条件付き処理、前 / 後処理、アラートと通知、エラー処理によって、包括的なデータ統合を実現します。 |
ハイブリッド対応 | オープンソースを利用することで、ハイブリッド環境とマルチクラウド環境にまたがる標準化されたデータ統合ソリューションを構築するために必要な柔軟性と移植性が提供されます。 |
料金
Cloud Data Fusion の料金は以下の項目に基づいて設定されます。
1. 設計費用: 開発および実行するパイプラインの数ではなく、インスタンスを実行する時間数が基準となります。なお、Basic エディションでは、1 アカウントにつき毎月最初の 120 時間が無料で利用できます。
2. 処理費用: パイプラインの実行に使用される Dataproc クラスタの費用です。
エディション | Cloud Data Fusion インスタンス時間あたりの料金 | サポートされる同時パイプライン数 | サポートされるユーザー数 |
---|---|---|---|
デベロッパー | US$0.35 | 2(推奨) | 2(推奨) |
基本 | US$1.80 | 無制限 | 無制限 |
Enterprise | US$4.20 | 無制限 | 無制限 |