使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。
我们诚邀您参加 2 月 22 日的线上实操研讨会,了解如何使用 BigLake 减少数据孤岛。  立即报名。
跳转到

BigLake

BigLake 是一种统一数据仓库和数据湖的存储引擎,它支持 BigQuery 和开源框架(如 Spark),以通过精细的访问权限控制来访问数据。BigLake 可提高多云存储空间和 Apache Iceberg 等开放格式的查询性能。

  • 跨数据仓库和数据湖存储具有统一特征的数据的单个副本。

  • 针对分布式数据实现精细的访问权限控制和多云治理。

  • 与开源分析工具和开放数据格式无缝集成。

优势

自由选择

无论在何处存储以及如何存储,您都能获得对分布式数据的分析,同时还可以针对数据的单个副本选择出色的分析工具(开源工具或云原生工具)。

安全可靠、性能强大的数据湖

可对 Apache Spark、Presto 和 Trino 等开源引擎以及 Parquet 等开放格式进行精细的访问权限控制。基于 BigQuery 支持的数据湖进行高性能查询。

大规模统一治理和管理

Dataplex 集成,支持大规模管理,包括逻辑数据整理、集中式政策和元数据管理、质量和生命周期管理,以实现分布式数据的一致性。

主要特性

主要特性

精细的安全控制

BigLake 不需要向最终用户授予文件级访问权限。将表、行、列级安全政策应用于对象存储表(与现有 BigQuery 表类似)。

多计算分析

维护一份数据副本,使其可在 Google Cloud 和开源引擎(包括 BigQueryVertex AIDataflow、Spark、Presto、Trino 和 Hive)上通过 BigLake 连接器统一访问。在一个地方集中管理安全政策,并通过连接器内置的 API 接口在所有查询引擎中一致地执行政策。

多云治理

探索所有 BigLake 表,包括在 Data Catalog 中通过 Amazon S3 和 Azure 数据湖第 2 代定义的表。配置精细的访问权限控制,并在使用 BigQuery Omni 进行查询时跨云强制执行。

性能提升

凭借成熟的 BigQuery 基础架构在 Google Cloud、AWS 和 Azure 上的数据湖表中实现行业领先的性能。

基于开放格式构建

访问热门的开放数据格式,包括 Parquet、Avro、ORC、CSV、JSON。API 通过 Apache Arrow 为多个计算引擎提供服务。

bol.com 的徽标

“作为一家快速发展的电子商务公司,我们的数据增长迅速。BigLake 让我们能够实现对视图的访问权限控制,同时为用户提供统一的界面并保持较低的数据存储费用,从而发掘数据湖的价值。这使得我们的用户可以更快地分析我们的数据集。”

文档

文档

Google Cloud 基础知识
BigLake 简介

介绍 BigLake 的概念以及它如何简化分析体验。

快速入门
BigLake 使用入门

了解如何创建和管理 BigLake 表,以及使用连接器通过 BigQuery 或其他开源引擎查询 BigLake 表。

价格

价格

BigLake 的价格基于 BigLake 表查询,包括:

1. BigQuery 价格适用于对 Google Cloud Storage 上定义的 BigLake 表的查询。

2. BigQuery Omni 价格适用于对 Amazon S3 和 Azure 数据湖第 2 代上定义的 BigLake 表的查询。

3.使用 BigLake 连接器从开源引擎查询:BigLake 连接器使用 BigQuery Storage API,并适用相应的价格 - 按读取字节数和出站流量结算。

示例:*每月可使用 BigQuery 免费处理 1 TB 数据。