Dataplex
Dataplex のインテリジェントなデータ ファブリックを使用して、データ サイロを解消します。これにより、組織は一貫性のある制御を備えて、データレイク、データ ウェアハウス、データマートの全体を対象にしたデータの一元管理、モニタリング、統制ができるようになり、信頼できるデータへのアクセスを提供し、大規模な分析を強化します。
-
単一画面での一元化されたメタデータ主導のデータ管理
-
分散型所有権によるグローバル コントロールを実現する一元化されたセキュリティとガバナンス
-
データを移動せずに分散データを統合する組み込みのデータ インテリジェンス
-
オープンソース ツールと堅牢なパートナー エコシステムをサポートするオープン プラットフォーム
利点
選択の自由
オープンソースやクラウド ネイティブの最適な分析ツールを自由に選択して、最適な価格とパフォーマンスを実現するデータを保存し、分析のライフサイクル全体を高速化できます。
インテリジェントな自動化
Google の最高水準の AI/ML 機能を使用した組み込みのデータ インテリジェンスで、データの検出、メタデータ収集、データ ライフサイクル管理、データ品質を自動化し、管理コストを削減します。
統合されたガバナンス
分散データ全体の一貫性を保つために、メタデータ、セキュリティ ポリシー、ガバナンス、データ分類の標準化と統合を可能にします。
主な機能
主な機能
一元化されたセキュリティとガバナンス
一元化されたポリシー管理、モニタリング、監査によるデータの認証、分類。データおよび関連アーティファクト(機械学習モデルなど)全体にわたるグローバルなモニタリングとガバナンスでデータの所有は分散されます。
メタデータ管理
組み込みのデータ インテリジェンスにより、データサイロ全体での構造化データ、半構造化データ、非構造化データのデータ検出、分類、スキーマ検出、メタデータの収集と登録を自動化します。さまざまな分析ツールやデータ サイエンス ツールからこのデータに簡単にアクセスできます。
データ品質
分散データ全体にわたってデータ品質の管理を自動化して、信頼できるデータにすぐにアクセスできるようにします。データ品質を DataOps の不可欠な要素にします。
データ ライフサイクル管理
Dataplex レイクとデータゾーンを使用して、複数のストレージ サービスにまたがるデータをビジネス固有のドメインに論理的に編成します。データの管理、キュレート、階層化、アーカイブをワンクリックで簡単に行えます。
分散データ用に構築
移動や重複を回避してデータを統合します。 コストを最小限に抑え、パフォーマンスを最大化するために、データを残します。
「Google Cloud には数 PB のデータが格納されており、毎日数千人の内部ユーザーがアクセスしています。Dataplex を使用することで、データ所有権が分散されていてもガバナンスと表示設定が一元化され、分散データ全体でビジネス ドメイン固有のセルフサービス データ プラットフォームが実現されます。Dataplex を中央コンポーネントとして導入し、分析データ全体にわたる統合データメッシュを構築できることをとてもうれしく思います。」
Snap Inc. エンジニアリング担当ディレクター Saral Jain 氏
最新情報
Dataplex の詳細情報
ドキュメント
ドキュメント
Dataplex の仕組み
新しいデータソースが特定されると、Dataplex は組み込みのデータ品質チェックを使用して構造化データと非構造化データの両方のメタデータを収集し、整合性を高めます。
Dataplex のスタートガイド
レイクとゾーンに保存されたデータを論理的に編成し、そのデータ全体にわたるデータ管理とガバナンスを自動化して、大規模な分析を強化します。
Dataplex のベスト プラクティス
次のベスト プラクティスに従って、Dataplex のエクスペリエンスを最適化しましょう。
Cloud Dataplex API
Dataplex API を使用してデータレイクのライフサイクルを管理します。
ユースケース
ユースケース
Dataplex を使用して、Cloud Storage と BigQuery のデータ間でビジネス ドメイン固有のデータメッシュ アーキテクチャを構築します。データ所有権の分散を可能にしながらも、企業全体でデータを一元的に管理、モニタリング、統制して、さまざまな分析ツールやデータ サイエンス ツールでこのデータに安全にアクセスできるようにします。
料金
料金
Dataplex の料金は、以下の従量課金制に基づいて計算されます。
- Dataplex Processing(Data Compute Unit(DCU)により計測)。Dataplex でのデータ検出とデータ探索の機能が対象となります。1 DCU は 1 個の vCPU と 4 GB の RAM に相当します。
- Dataplex Shuffle Storage(GB/月)。Dataplex でのデータ探索に対応するために必要なディスク ストレージが対象となります。
このプロダクトはプレビューです。プロダクトのリリース ステージの詳細をご覧ください。
Cloud AI プロダクトは、Google の SLA ポリシーに準拠しています。これらの SLA ポリシーで保証されているレイテンシや可用性は、他の Google Cloud サービスと異なる場合があります。