바로 이동

BigLake

BigLake는 분석 및 AI 엔진이 안전하고 제어되며 성능이 우수한 방식으로 멀티포맷, 멀티 클라우드, 멀티모달 데이터를 쿼리할 수 있는 통합 인터페이스를 제공하는 스토리지 엔진입니다. 커스텀 데이터 인프라의 관리와 필요성을 줄일 수 있도록 설계된 단일 사본 AI 레이크하우스를 빌드합니다.

  • 2024 SIGMOD 이벤트에서 발표될 새로운 연구인 BigQuery의 멀티 클라우드 레이크하우스를 향한 진화를 비롯한 지속적인 혁신입니다.

  • 정형 데이터와 비정형 데이터 모두의 저장, 처리, 분석을 위해 데이터 레이크와 데이터 웨어하우스를 통합하는 Google 권장 솔루션을 배포합니다.

  • 분석과 AI를 사용해 정형 데이터와 비정형 데이터 및 쿼리의 단일 사본을 저장합니다.

  • 분산된 데이터에 대한 세밀한 액세스 제어 및 멀티 클라우드 거버넌스

  • 개방형 형식인 레이크하우스의 자동 데이터 관리를 지원하는 완전 관리형 환경

이점

자유로운 선택

데이터 저장 위치와 저장 방식을 불문하고 분산된 데이터에서 분석을 수행하는 한편, 단일 데이터 사본에서 최적의 분석 도구, 오픈소스 또는 클라우드 기반 도구를 선택할 수 있습니다.

안전하고 성능이 우수한 데이터 레이크

Apache Spark, Presto, Trino와 같은 오픈소스 엔진 및 Parquet 같은 개방형 형식에 대한 세분화된 액세스 제어 BigQuery에서 제공하는 데이터 레이크에 대한 고성능 쿼리입니다.

대규모 통합 거버넌스 및 관리

Dataplex와 통합되어 논리 데이터 조직, 중앙 집중식 정책 및 메타데이터 관리, 분산된 데이터 전체에 걸친 일관성을 위한 품질 및 수명주기 관리 등 대규모 관리 기능을 제공합니다.

주요 특징

주요 특징

세분화된 보안 제어

BigLake는 최종 사용자에게 파일 수준 액세스 권한을 부여할 필요가 없습니다. 기존 BigQuery 테이블과 유사한 객체 스토리지 테이블에 테이블, 행, 열 수준 보안 정책을 적용합니다.

멀티 컴퓨팅 분석

정형 및 비정형 데이터의 단일 사본을 유지하고 BigLake 커넥터를 사용하는 BigQuery, Vertex AI, Dataflow, Spark, Presto, Trino, Hive를 포함한 오픈소스 엔진과 Google Cloud에서 균일하게 액세스할 수 있습니다. 보안 정책을 한곳에서 중앙집중식으로 관리하고 커넥터에 내장된 API 인터페이스로 여러 쿼리 엔진에 걸쳐 정책을 일관되게 적용할 수 있습니다.

멀티 클라우드 거버넌스

Data Catalog에서 Amazon S3, Azure Data Lake Gen 2를 통해 정의된 테이블을 포함한 모든 BigLake 테이블을 탐색하세요. BigQuery Omni를 사용하여 쿼리할 때 세분화된 액세스 제어를 구성하고 여러 클라우드에 적용합니다.

인공지능(AI)용으로 빌드

객체 테이블을 사용하면 제어되는 AI 워크로드에 멀티모달 데이터를 사용할 수 있습니다. BigQuery SQL 및 Vertex AI 통합을 사용해 AI 사용 사례를 손쉽게 빌드하세요. 

개방형 형식에 기반

Parquet, Avro, ORC, CSV, JSON 등의 열린 테이블 및 파일 형식을 지원합니다. API는 Apache Arrow를 통해 여러 컴퓨팅 엔진에 서비스를 제공합니다. 테이블 형식은 매니페스트를 통해 Apache Iceberg, Delta, Hudi를 기본적으로 지원합니다.

빠르게 성장하는 전자상거래 회사로서 데이터는 빠르게 성장했습니다. BigLake를 사용하면 뷰에서 액세스 제어를 사용 설정하는 동시에 사용자에게 통합 인터페이스를 제공하고 데이터 스토리지 비용을 절감하여 데이터 레이크의 가치를 활용할 수 있습니다. 따라서 사용자가 데이터 세트를 더 빠르게 분석할 수 있습니다.

문서

문서

Google Cloud Basics

BigLake 소개

BigLake 개념을 소개하고 고객이 분석 환경을 간소화하는 데 어떤 도움이 되는지 알아봅니다.
Quickstart

BigLake 시작하기

커넥터를 사용하여 BigQuery 또는 기타 오픈소스 엔진을 통해 BigLake 테이블을 만들고 관리하는 방법, BigLake 테이블을 쿼리하는 방법을 알아보세요.
Quickstart

BigLake 테이블에서 Cloud Storage 데이터 쿼리

Cloud Storage BigLake 테이블에 저장된 데이터를 쿼리하는 방법을 알아봅니다.

원하는 내용을 찾을 수 없으신가요?

가격 책정

가격 책정

BigLake 가격은 다음을 포함한 BigLake 테이블을 기준으로 책정됩니다.

1. BigQuery 가격 책정은 Google Cloud Storage에 정의된 BigLake 테이블을 통한 쿼리에 적용됩니다. 

2. Amazon S3 및 Azure Data Lake 2세대에 정의된 BigLake 테이블에 걸친 쿼리에 BigQuery Omni 가격 책정이 적용됩니다.

3. BigLake 커넥터를 사용하는 오픈소스 엔진의 쿼리: BigLake 커넥터는 BigQuery Storage API를 사용하며 해당하는 가격이 적용되는 기준은 읽은 바이트와 이그레스입니다.

4. 메타데이터 캐싱, 객체 테이블, BigLake Metastore를 사용한 쿼리 가속화에는 추가 비용이 적용됩니다.

예: * 매달 BigQuery로 처리되는 데이터의 처음 1TB는 무료입니다.

다음 단계 수행

$300의 무료 크레딧과 20여 개의 항상 무료 제품으로 Google Cloud에서 빌드하세요.

Google Cloud