利用 Dataplex 的智能数据结构脉络摆脱数据孤岛,使组织能够通过一致的控制集中发现、管理、监控和治理跨数据湖、数据仓库和数据集市的数据,提供对可信数据的访问并支持大规模分析和 AI。
跨数据孤岛管理数据的单一管理平台
通过全球控制进行集中式安全和治理,从而实现分布式数据所有权
基于业务情境在分布式数据中进行统一搜索和数据发现
内置的数据智能可实现对数据的信任,并更快获取数据洞见
一个开放平台,支持开源工具和强大的合作伙伴生态系统
优势
在选择出色分析工具(开源或云原生)的同时,以较优的价格和性能自由地将数据存储在您想要的位置,以加快整个分析生命周期。
使用 Google 出色的 AI/机器学习功能自动完成数据发现、元数据收集、数据生命周期管理、数据分析、数据质量评估和沿袭,以降低管理费用。
实现元数据、安全政策、治理和数据分类的标准化和统一,以实现跨分布式数据的一致性。
主要特性
利用内置的数据智能,对存储在 Google Cloud 以及其他位置的结构化、半结构化和非结构化数据自动执行数据发现、分类和元数据丰富。在统一、灵活且强大的 Data Catalog 中管理所有数据的技术、运营和业务元数据。 内置使用与 Gmail 相同的搜索技术的分面搜索界面,您可以轻松搜索、查找和理解数据。
使用 Dataplex 数据湖和数据可用区,将跨多个存储服务的数据按逻辑整理为特定业务领域。只需点击一下,即可轻松管理、挑选、分层和归档数据。
支持跨数据孤岛对数据授权和分类进行集中的政策管理、监控和审核。通过全球监控和治理,基于公司网域确定分布式数据所有权。
自动处理分布式数据中的数据质量,实现对可信数据的访问。使用自动捕获的数据沿袭可更好地理解数据,跟踪依赖关系,并有效地排查数据问题。
通过端到端数据沿袭轻松了解数据来源和经历的转换过程。针对 Google Cloud 数据源自动处理,并可扩展至第三方数据源。
我们在 Google Cloud 中存储了数 PB 的数据,每天有数千个内部用户访问这些数据。借助 Dataplex,我们能够跨分布式数据提供一个业务领域特定的自助式数据平台,同时实现分散式数据所有权以及集中式治理和可见性。我们很高兴能采用 Dataplex 作为跨分析数据构建统一数据网格的核心组件。
Snap Inc 工程总监 Saral Jain
文档
使用场景
使用 Dataplex 跨 Cloud Storage 和 BigQuery 中的数据构建特定于业务领域的数据网格架构。实现分散式数据所有权,同时仍可集中管理、监控和治理整个企业内的数据,并使各种分析和数据科学工具能够安全地访问这些数据。
您可以使用 Dataplex 中的全代管式无服务器 Data Catalog 轻松地跨数据孤岛搜索和发现数据资产。Data Catalog 内置众多功能,可自动注入技术元数据,使用相关的业务上下文丰富元数据,使组织中的每个用户都可以使用强大的分面搜索界面轻松查找和理解其数据。
价格
Dataplex 价格基于随用随付的用量,包括:
- Dataplex 处理,涵盖 Dataplex 中的数据发现功能
- Data Catalog 元数据存储
- Data Catalog 读取、写入和搜索 API 调用
Cloud AI 产品遵循我们的服务等级协议 (SLA) 政策。这些产品在延迟时间或可用性方面的保证可能与其他 Google Cloud 服务有所不同。