BigLake
BigLake 是一种统一数据仓库和数据湖的存储引擎,它支持 BigQuery 和开源框架(如 Spark),以通过精细的访问权限控制来访问数据。BigLake 可提高多云存储空间和 Apache Iceberg 等开放格式的查询性能。
-
跨数据仓库和数据湖存储具有统一特征的数据的单个副本。
-
针对分布式数据实现精细的访问权限控制和多云治理。
-
与开源分析工具和开放数据格式无缝集成。
优势
自由选择
无论在何处存储以及如何存储,您都能获得对分布式数据的分析,同时还可以针对数据的单个副本选择出色的分析工具(开源工具或云原生工具)。
安全可靠、性能强大的数据湖
可对 Apache Spark、Presto 和 Trino 等开源引擎以及 Parquet 等开放格式进行精细的访问权限控制。基于 BigQuery 支持的数据湖进行高性能查询。
大规模统一治理和管理
与 Dataplex 集成,支持大规模管理,包括逻辑数据整理、集中式政策和元数据管理、质量和生命周期管理,以实现分布式数据的一致性。
主要特性
主要特性
精细的安全控制
BigLake 不需要向最终用户授予文件级访问权限。将表、行、列级安全政策应用于对象存储表(与现有 BigQuery 表类似)。
多云治理
探索所有 BigLake 表,包括在 Data Catalog 中通过 Amazon S3 和 Azure 数据湖第 2 代定义的表。配置精细的访问权限控制,并在使用 BigQuery Omni 进行查询时跨云强制执行。
性能提升
凭借成熟的 BigQuery 基础架构在 Google Cloud、AWS 和 Azure 上的数据湖表中实现行业领先的性能。
基于开放格式构建
访问热门的开放数据格式,包括 Parquet、Avro、ORC、CSV、JSON。API 通过 Apache Arrow 为多个计算引擎提供服务。
“作为一家快速发展的电子商务公司,我们的数据增长迅速。BigLake 让我们能够实现对视图的访问权限控制,同时为用户提供统一的界面并保持较低的数据存储费用,从而发掘数据湖的价值。这使得我们的用户可以更快地分析我们的数据集。”
最新资讯
最新资讯
文档
文档
BigLake 简介
介绍 BigLake 的概念以及它如何简化分析体验。
BigLake 使用入门
了解如何创建和管理 BigLake 表,以及使用连接器通过 BigQuery 或其他开源引擎查询 BigLake 表。
价格
价格
BigLake 的价格基于 BigLake 表查询,包括:
1. BigQuery 价格适用于对 Google Cloud Storage 上定义的 BigLake 表的查询。
2. BigQuery Omni 价格适用于对 Amazon S3 和 Azure 数据湖第 2 代上定义的 BigLake 表的查询。
3.使用 BigLake 连接器从开源引擎查询:BigLake 连接器使用 BigQuery Storage API,并适用相应的价格 - 按读取字节数和出站流量结算。
示例:*每月可使用 BigQuery 免费处理 1 TB 数据。