フルマネージドでクラウドネイティブなデータをあらゆる規模で統合できます。
新規のお客様には、Data Fusion で使用できる無料クレジット $300 分を差し上げます。すべてのお客様は、1 アカウントにつきに毎月最初の 120 時間のパイプライン開発を無料で利用できます。クレジットに対する課金はありません。
利点
技術的なボトルネックを回避して生産性を改善
Data Fusion はドラッグ&ドロップで直感的に操作でき、既製のコネクタやセルフサービス モデルでコードを意識せずにデータ統合することによって、専門家に依頼することによるボトルネックを解消して、迅速に分析情報を取得できます。
パイプラインの総所有コストを削減
Data Fusion はサーバーレスで Managed Service for Apache Spark などの Google サービスの拡張性と信頼性を活用するアプローチであり、総所有コストを低く抑えながらデータ統合機能のメリットを実現できます。
データ ガバナンス基盤によって構築
Data Fusion にはエンドツーエンドのデータリネージ、統合メタデータ、クラウド ネイティブなセキュリティやデータ保護サービスなどの機能が組み込まれており、根本原因や影響範囲の分析に加え、コンプライアンス対応を支援します。
主な機能
Data Fusion はオープンソース プロジェクトである CDAP を使って構築されており、このオープンコアによってデータ パイプラインの移植性をユーザーに対して実現しています。オンプレミスとパブリック クラウドの両方のプラットフォームと幅広く統合できる CDAP は、Cloud Data Fusion ユーザーが部門の垣根を越えてこれまでアクセスできなかった分析情報を供給することを可能にします。
Data Fusion と Google Cloud を統合することにより、データ セキュリティが簡素化され、データをすぐに分析に利用できるようになります。Cloud Storage と Managed Service for Apache Spark でデータレイクをキュレートする場合、データを BigQuery に移行してデータ ウェアハウジングを行う場合、またはデータを変換して Spanner などのリレーショナル ストアに格納する場合、Cloud Data Fusion の統合により開発とイテレーションを迅速かつ簡単に行えます。
Cloud Data Fusion は、バッチ処理とリアルタイム処理の両方に対応する既製の変換を可能にします。カスタマイズした接続と変換の内部向けライブラリを作成して、チーム全体での検証、共有、再利用を可能にします。そのため、コラボレーション データ エンジニアリングの基盤を構築でき、生産性が向上します。これにより、ETL デベロッパーやデータ エンジニアの作業時間が短縮され、重要な効果として、コードの品質向上にかける労力を軽減できます。
ドキュメント
ユースケース
Cloud Data Fusion を使うと、サイロ化されたオンプレミス プラットフォームから取得したデータを統合することで、Google Cloud 上にスケーラブルで分散型のデータレイクを構築できるようになります。クラウドのスケーリングを活用してデータを一元管理できるようになるため、結果的に、データから得られる価値をさらに高めることができます。Cloud Data Fusion のセルフサービス機能を使用すれば、プロセスの可視化をさらに進めて、運用サポート全体の費用を削減できます。
Cloud Data Fusion を使うと、組織がデータサイロを分析してお客様をより的確に理解したり、BigQuery 内で、アジャイルなクラウドベースのデータ ウェアハウス ソリューションを開発したりできます。顧客エンゲージメントと行動の全体像を正しく把握することでカスタマー エクスペリエンスが向上し、お客様の維持率とお客様一人当たりの収益の増加につながります。
現在、多くのユーザーが、コストのかかる無数のオンプレミス データマートを統合した分析環境を構築したいと考えています。接続されていないさまざまな種類のツールを使ったり一時しのぎの措置を行うと、データ品質とセキュリティに課題を残します。Cloud Data Fusion には多様なコネクタ、可視化されたインターフェース、ビジネス ロジックに基づく抽象化が備えられているため、TCO を削減し、セルフサービスと標準化を促進して、繰り返しの作業を減らすことができます。
すべての機能
| コーディング不要のセルフサービス | コードを意識させないグラフィカル インターフェースを使用することで、技術的な知識がなくてもマウス操作だけでデータを統合できるため、ボトルネックがなくなります。 |
| コラボレーション データ エンジニアリング | Cloud Data Fusion は、内部ライブラリを作成して接続と変換をカスタマイズし、組織全体で検証、共有、再利用できます。 |
| Google Cloud ネイティブ | フルマネージドで Google Cloud ネイティブなアーキテクチャにより、Google Cloud のスケーラビリティ、信頼性、セキュリティ、プライバシー機能を最大限に活用します。 |
| リアルタイムのデータ統合 | Data Fusion のレプリケーション機能を使用すると、SQL Server、Oracle、MySQL などのトランザクション データベースとオペレーショナル データベースを数回クリックするだけで、BigQuery に直接レプリケートできます。Datastream との統合により、変更ストリームを BigQuery に送信して継続的な分析を行えます。実現可能性評価を使用して、開発イテレーションとパフォーマンス/ヘルス モニタリングのオブザーバビリティを強化します。 |
| バッチ統合 | ファイル システム、オブジェクト ストア、リレーショナル データベースや NoSQL データベース、SaaS システム、メインフレームなどの一般的なデータソースのサポートにより、大量のデータ パイプラインの設計、実行、運用を定期的に行います。 |
| エンタープライズ グレードのセキュリティ | |
| メタデータと系統の統合 | 技術的なメタデータとビジネス メタデータを使用することで、統合されたデータセットを検索できます。統合されたすべてのデータセットの系統を、データセット レベルと項目レベルでトラックできます。 |
| シームレスな運用 | REST API、時間ベースのスケジュール、パイプライン状態ベースのトリガー、ログ、指標、モニタリング ダッシュボードを備えているため、ミッション クリティカルな環境でも簡単に運用できます。 |
| 包括的な統合ツールキット | 最新のものから従来のものまで、さまざまなシステムへの組み込みコネクタ、コードを意識させない変換、条件付き処理、前 / 後処理、アラートと通知、エラー処理によって、包括的なデータ統合を実現します。 |
| ハイブリッド対応 | オープンソースを利用することで、ハイブリッド環境とマルチクラウド環境にまたがる標準化されたデータ統合ソリューションを構築するために必要な柔軟性とポータビリティが提供されます。 |
料金
Cloud Data Fusion の料金は以下の項目に基づいて設定されます。
1. 設計費用: 開発および実行するパイプラインの数ではなく、インスタンスを実行する時間数が基準となります。なお、Basic エディションでは、1 アカウントにつき毎月最初の 120 時間が無料で利用できます。
2. 処理費用: パイプラインの実行に使用される Managed Service for Apache Spark クラスタの費用です。
Edition | Cloud Data Fusion インスタンス時間あたりの料金 | サポートされる同時パイプライン数 | サポートされるユーザー数 |
|---|---|---|---|
デベロッパー | 0.35 米ドル | 2(推奨) | 2(推奨) |
ベーシック | 1.80 米ドル | 無制限 | 無制限 |
Enterprise | 4.20 米ドル | 無制限 | 無制限 |