Dataplex

智能数据治理

在您的数据平台上集中发现、管理、监控和治理数据和 AI 工件,从而提供对可信数据的访问权限,并为分析和 AI 提供大规模支持。

功能

使用 Data Catalog 简化数据发现

利用内置的数据智能,对存储在 Google Cloud 以及其他位置的结构化、半结构化和非结构化数据自动执行数据发现、分类和元数据丰富。在统一、灵活且强大的 Data Catalog 中管理所有数据的技术、运营和业务元数据。使用内置的业务术语表,通过相关的业务上下文来丰富元数据。利用内置的全局分面搜索,轻松搜索、查找和理解您的数据

端到端数据沿袭

通过端到端数据沿袭轻松了解数据来源和经历的转换过程。针对 Google Cloud 数据源自动处理,并可扩展至第三方数据源。

自动评估数据质量

使用自动捕获的数据沿袭和内置的数据分析功能来更好地了解您的数据、跟踪依赖关系,并有效地排查数据问题。自动处理分布式数据中的数据质量,实现对可信数据的访问。

BigQuery 中的数据治理

为了支持端到端数据生命周期,并让客户更轻松地管理、发现和治理数据,我们正在将 Dataplex 功能直接引入 BigQuery,包括数据质量、数据沿袭和数据剖析。现在,您无需离开 BigQuery 即可将数据治理直接应用于数据。

依托生成式 AI 技术的数据分析和语义搜索

通过您可以就自己的数据提出的一系列精心整理的问题,快速启动分析。数据分析功能利用元数据和先进的 Gemini 模型的强大功能,生成量身定制的查询,从您的数据中挖掘隐藏的模式和有价值的数据洞见。数据的语义元数据搜索可帮助您使用所选语言发现数据。用户可以使用自然语言查询来搜索数据资产,而无需重新调用搜索语法和限定符。

使用 Vertex AI 和 Dataplex 实现数据到 AI 治理

在单一搜索体验中跨项目和区域即时发现您需要的 AI 模型、数据集、功能和相关数据工件,同时遵循 IAM 权限。使用 Dataplex 充实包含关键业务元数据的 AI 工件,从而做出明智的决策,例如所有权、关键属性和相关上下文。



工作方式

借助 Dataplex,您可以管理、监控和治理数据湖、仓库和数据库中的数据和 AI 工件。它可帮助用户智能地建立数据剖析、评估数据质量、确定数据沿袭、对数据进行分类、将数据整理到不同的领域,以及管理和治理数据生命周期。

使用 Dataplex 治理数据
观看:使用 Dataplex 管理和治理分布式数据

常见用途

数据到 AI 治理

利用 Dataplex 和 Vertex AI 实现数据到 AI 治理

在单一搜索体验中,您可以发现整个组织的数据和 AI 资产,并即时发现跨项目和区域的 AI 模型、数据集和相关数据工件,同时遵循 IAM 权限。此外,您还可以利用业务上下文来增强资产,并使用业务元数据丰富 AI 工件,从而做出明智的决策,例如所有权、关键属性和相关情境。

使用 Data Catalog 搜索 Vertex AI 模型和数据集资源

    利用 Dataplex 和 Vertex AI 实现数据到 AI 治理

    在单一搜索体验中,您可以发现整个组织的数据和 AI 资产,并即时发现跨项目和区域的 AI 模型、数据集和相关数据工件,同时遵循 IAM 权限。此外,您还可以利用业务上下文来增强资产,并使用业务元数据丰富 AI 工件,从而做出明智的决策,例如所有权、关键属性和相关情境。

    使用 Data Catalog 搜索 Vertex AI 模型和数据集资源

      构建数据网格

      使用 Dataplex 构建数据网格

      数据网格是一种策略,其中数据所有权是分散的,由网域数据所有者处理,跨地点的分布式数据集可以提高数据可访问性和运营效率。Dataplex 有助于以逻辑方式将数据和相关工件整理到 Dataplex 数据湖(即数据网域)中,从而让您能够统一分布式数据并根据业务上下文对其进行整理。

      阅读关于如何使用 Dataplex 构建数据网格的指南
      数据网格架构

      使用 Dataplex 构建数据网格

      数据网格是一种策略,其中数据所有权是分散的,由网域数据所有者处理,跨地点的分布式数据集可以提高数据可访问性和运营效率。Dataplex 有助于以逻辑方式将数据和相关工件整理到 Dataplex 数据湖(即数据网域)中,从而让您能够统一分布式数据并根据业务上下文对其进行整理。

      阅读关于如何使用 Dataplex 构建数据网格的指南
      数据网格架构

      普及数据分析

      使用 Dataplex Data Catalog 普及数据洞见

      使用 Dataplex 中的全托管式无服务器 Data Catalog,跨孤岛搜索和发现您的数据和 AI 工件。Data Catalog 拥有诸多内置功能,可自动注入技术元数据,使用相关业务上下文来丰富元数据,并让组织中的每个用户都能使用强大的分面搜索界面轻松查找和理解其数据和 AI 工件。

      阅读指南,了解如何使用 Data Catalog 更好地发现数据、管理元数据及进行其他操作

      使用 Dataplex Data Catalog 普及数据洞见

      使用 Dataplex 中的全托管式无服务器 Data Catalog,跨孤岛搜索和发现您的数据和 AI 工件。Data Catalog 拥有诸多内置功能,可自动注入技术元数据,使用相关业务上下文来丰富元数据,并让组织中的每个用户都能使用强大的分面搜索界面轻松查找和理解其数据和 AI 工件。

      阅读指南,了解如何使用 Data Catalog 更好地发现数据、管理元数据及进行其他操作

      价格

      Dataplex 价格Dataplex 价格基于随用随付的用量。
      服务和用量说明价格 (USD)

      Dataplex 处理

      Dataplex 标准处理和高级处理按数据计算单元 (DCU) 计量。DCU 小时数是 Dataplex 的抽象结算单位,实际计量单位取决于您使用的各项功能。

      免费层级 Dataplex 处理

      每月前 100 DCU 小时(用于 Dataplex 标准处理)。

      免费

      标准 Dataplex 处理

      Dataplex 标准层级涵盖自动从 Cloud Storage 中发现表和文件集元数据的数据发现功能

      Starting at

      $0.060

      每 DCU-小时

      高级 Dataplex 处理

      Dataplex 高级处理层级涵盖 Dataplex 的数据探索工作台数据沿袭数据质量数据剖析功能。

      $0.089

      每 DCU-小时

      Data Catalog 价格

      元数据存储价格

      Data Catalog 会以很短的时间间隔计量存储的平均元数据量。计费时,系统会综合计算这些计量结果,得出一个月内的平均值,然后将此平均值乘以每月费率。


      Dataplex 免费层级

      平均每月存储空间最多 1 MiB。

      免费

      元数据存储

      月平均存储空间超过 1 MiB。

      Starting at

      $2

      每月每 GiB

      API 费用

      若有针对 Data Catalog APIData Lineage API 进行的 API 调用,Data Catalog 会收取相关费用。

      API 调用

      每月 100 万次。

      免费

      API 调用

      每月 100 万次以上。

      Starting at

      $10

      每 10 万次 API 调用

      Dataplex Shuffle 存储价格

      Shuffle 存储价格涵盖为数据探索工作台配置的环境中指定的任何磁盘存储空间。

      Starting at

      $0.040

      每 GB-月

      其他使用情况

      Dataplex 中的数据组织功能(数据湖、可用区或资产设置)以及安全政策的应用和传播是免费的。

      某些 Dataplex 功能通过 DataprocBigQueryDataflow 触发作业执行。系统会按照每种价格模式分别收取这些用量的费用,并按相应价格显示费用。

      Dataplex 价格

      Dataplex 价格基于随用随付的用量。

      Dataplex 处理

      说明

      Dataplex 标准处理和高级处理按数据计算单元 (DCU) 计量。DCU 小时数是 Dataplex 的抽象结算单位,实际计量单位取决于您使用的各项功能。

      价格 (USD)

      免费层级 Dataplex 处理

      每月前 100 DCU 小时(用于 Dataplex 标准处理)。

      说明

      免费

      标准 Dataplex 处理

      Dataplex 标准层级涵盖自动从 Cloud Storage 中发现表和文件集元数据的数据发现功能

      说明

      Starting at

      $0.060

      每 DCU-小时

      高级 Dataplex 处理

      Dataplex 高级处理层级涵盖 Dataplex 的数据探索工作台数据沿袭数据质量数据剖析功能。

      说明

      $0.089

      每 DCU-小时

      Data Catalog 价格

      说明

      元数据存储价格

      Data Catalog 会以很短的时间间隔计量存储的平均元数据量。计费时,系统会综合计算这些计量结果,得出一个月内的平均值,然后将此平均值乘以每月费率。


      价格 (USD)

      Dataplex 免费层级

      平均每月存储空间最多 1 MiB。

      说明

      免费

      元数据存储

      月平均存储空间超过 1 MiB。

      说明

      Starting at

      $2

      每月每 GiB

      API 费用

      若有针对 Data Catalog APIData Lineage API 进行的 API 调用,Data Catalog 会收取相关费用。

      说明

      API 调用

      每月 100 万次。

      说明

      免费

      API 调用

      每月 100 万次以上。

      说明

      Starting at

      $10

      每 10 万次 API 调用

      Dataplex Shuffle 存储价格

      说明

      Shuffle 存储价格涵盖为数据探索工作台配置的环境中指定的任何磁盘存储空间。

      价格 (USD)

      Starting at

      $0.040

      每 GB-月

      其他使用情况

      说明

      Dataplex 中的数据组织功能(数据湖、可用区或资产设置)以及安全政策的应用和传播是免费的。

      价格 (USD)

      某些 Dataplex 功能通过 DataprocBigQueryDataflow 触发作业执行。系统会按照每种价格模式分别收取这些用量的费用,并按相应价格显示费用。

      说明

      按区域了解价格

      估算您的每月费用,包括特定于区域的价格和费用。

      定制报价

      请与我们的销售团队联系,获取为贵组织量身定制的报价。

      开始概念验证

      新客户可获 $300 赠金

      什么是数据治理?

      Dataplex 的工作原理

      Dataplex 最佳实践

      探索 Data Catalog 代码示例

      合作伙伴与集成

      与行业领导者合作
      • accenture
      • Confluent
      • Collibra 徽标
      • HCL
      • Informatica 徽标
      • Nvidia 徽标
      • Starburst 徽标
      • Tableau
      • accenture
      • Confluent
      • Collibra 徽标
      • HCL
      • Informatica 徽标
      • Nvidia 徽标
      • Starburst 徽标
      • Tableau

      请前往 Google Cloud 合作伙伴中心探索所有合作伙伴。

      Google Cloud
      • ‪English‬
      • ‪Deutsch‬
      • ‪Español‬
      • ‪Español (Latinoamérica)‬
      • ‪Français‬
      • ‪Indonesia‬
      • ‪Italiano‬
      • ‪Português (Brasil)‬
      • ‪简体中文‬
      • ‪繁體中文‬
      • ‪日本語‬
      • ‪한국어‬
      控制台
      • 利用我们透明的定价方法节省资金
      • Google Cloud 的随用随付价格方案会根据预付费资源的每月用量和折扣费率自动为您节省费用。请立即联系我们,获取报价。
      Google Cloud