Lakehouse for Apache Iceberg(이전 명칭: BigLake)

에이전트 시대에 맞는 개방형 교차 클라우드 레이크하우스

통합된 교차 클라우드 및 멀티모달 개방형 레이크하우스에서 확장 가능한 분석, 운영, 실시간 AI 사용 사례를 빌드하기 위한 엔터프라이즈 스토리지, 거버넌스, 성능

Apache Iceberg는 Apache Software Foundation의 상표입니다.



기능

읽기/쓰기 상호 운용성을 갖춘 완전 관리형 Iceberg

Lakehouse Iceberg REST 카탈로그를 사용하여 관리되는 Apache Iceberg 테이블은 BigQuery와 Google Cloud Managed Service for Apache Spark는 물론 Spark, Trino, Flink와 같은 Iceberg 호환 OSS 엔진 간에 읽기 및 쓰기 상호 운용성을 제공하며, 이제 Snowflake 및 Databricks(프리뷰)와 같은 서드 파티 엔진도 지원합니다. 이를 통해 Iceberg 테이블을 BigQuery 및 Google Managed Spark와 같은 엔진에 직접 연결하여 AI 워크로드를 가속화할 수 있습니다.

교차 클라우드 Iceberg 데이터에 연결된 Google의 AI

Cross-Cloud Interconnect 및 캐싱(프리뷰)을 활용하여 S3 Iceberg 데이터에 짧은 지연 시간으로 빠르게 액세스합니다. 기본 데이터 플랫폼 솔루션과 비슷한 가격 대비 성능 특성을 갖춘 AWS 데이터에서 대화형 분석 API 작업을 통해 BigQuery, Spark, Gemini Enterprise를 실행합니다. 또한 새로운 Lakehouse 런타임 카탈로그 제휴(프리뷰)는 생태계를 원활하게 통합하여 BigQuery와 Google Managed Spark가 Snowflake, Databricks, AWS Glue 전반에서 엔터프라이즈 데이터를 검색하고 분석할 수 있도록 지원합니다.

Iceberg의 가격 대비 성능 가속화

BigQuery의 향상된 벡터화 실행은 이제 BigQuery 카탈로그의 Iceberg 및 Parquet 테이블뿐만 아니라 Lakehouse Iceberg REST 카탈로그 테이블에도 기본적으로 적용됩니다. 압축, 클러스터링, 가비지 컬렉션과 같은 일상적인 Iceberg 유지보수를 Google Lakehouse에 직접 오프로드합니다. 테이블 관리, 파티셔닝, 클러스터링, 기록 기반 최적화(BigQuery 카탈로그의 Iceberg 테이블은 정식 버전, REST 카탈로그는 프리뷰)를 포함한 새로운 자동화 기능은 수동 오버헤드 없이 가격 대비 성능을 가속화합니다.

차별화된 BigQuery 및 Spark

BigQuery 스트리밍을 사용하여 읽기 지연 시간이 0인 고처리량 수집을 통해 Iceberg로 실시간 인사이트를 강화하세요. 멀티 문 트랜잭션과 BigQuery 변경 데이터 복제를 Iceberg 테이블(BigQuery 카탈로그는 정식 버전, REST 카탈로그는 프리뷰)에 적용하여 복잡한 처리 파이프라인을 빌드합니다. BigQueryObjectRefs를 사용하여 정형 데이터와 비정형 데이터를 통합하여 멀티모달, 벡터, 그래프 분석을 활용하세요. 최대 4.5배 더 빠른 성능을 제공하는 Lightning Engine으로 Spark 데이터 과학 워크로드를 강화하세요.

에이전트를 위한 실시간 컨텍스트 및 거버넌스

실시간 트랜잭션 데이터로 AI 에이전트의 역량을 강화하세요. Spanner, AlloyDB, Cloud SQL의 운영 데이터를 BigQuery 및 관리형 Iceberg 테이블로 스트리밍하여 즉시 분석하고, 이러한 분석 인사이트를 AlloyDB 또는 Spanner로 직접 다시 푸시하여 밀리초 미만의 높은 QPS 지연 시간으로 제공할 수 있습니다. Knowledge Catalog(이전 명칭: Dataplex) 통합을 통해 계보, 프로파일링, 데이터 품질을 포함한 통합 거버넌스를 확보하세요. 트랜잭션 데이터, 비정형 데이터, Iceberg 데이터를 비즈니스 로직에 매핑하여 에이전트가 정확하고 신뢰할 수 있으며 완전히 제어되는 결과를 제공하는 데 필요한 심층적인 컨텍스트를 제공합니다.

작동 방식

Lakehouse REST 카탈로그는 Iceberg 테이블의 중앙 허브 역할을 합니다. BigQuery, Managed Service for Apache Spark, OSS 엔진, 파트너 전반에 걸쳐 범용 읽기/쓰기 액세스를 제공하여 데이터를 모든 엔진에 원활하게 연결하여 AI를 가속화합니다.

일반적인 용도

레이크하우스 기반 및 현대화

개방형 통합 레이크하우스 아키텍처로 현대화

Google의 Lakehouse로 데이터 기반을 현대화하세요. 기존 Hadoop을 서버리스 Cloud Storage로 이전하고 BigQuery에서 Iceberg 및 Delta Lake를 직접 쿼리하여 교차 클라우드 데이터를 통합합니다. Lakehouse Iceberg REST 카탈로그는 사일로를 제거하여 Spark, Trino, Flink를 위한 상호 운용 가능한 런타임을 제공합니다. Hive 카탈로그 지원을 통해 Hadoop 워크로드를 Iceberg로 쉽게 현대화할 수 있습니다.

    개방형 통합 레이크하우스 아키텍처로 현대화

    Google의 Lakehouse로 데이터 기반을 현대화하세요. 기존 Hadoop을 서버리스 Cloud Storage로 이전하고 BigQuery에서 Iceberg 및 Delta Lake를 직접 쿼리하여 교차 클라우드 데이터를 통합합니다. Lakehouse Iceberg REST 카탈로그는 사일로를 제거하여 Spark, Trino, Flink를 위한 상호 운용 가능한 런타임을 제공합니다. Hive 카탈로그 지원을 통해 Hadoop 워크로드를 Iceberg로 쉽게 현대화할 수 있습니다.

      멀티 엔진 상호 운용성

      BigQuery와 OSS 엔진 간의 원활한 읽기/쓰기 공유

      기존 Iceberg 파이프라인을 가져와 BigQuery 또는 Managed Spark를 사용하여 이러한 테이블을 원활하게 읽거나 쓸 수 있으며, 고급 BigQuery 기능을 통해 쉽게 현대화할 수 있습니다. 데이터 이동 없이 동일한 Iceberg 테이블에서 Spark ETL과 BigQuery AI를 실행하여 데이터 과학을 강화합니다. S3의 데이터로 작업하는 대화형 분석 에이전트를 BigQuery에서 빌드합니다.

        BigQuery와 OSS 엔진 간의 원활한 읽기/쓰기 공유

        기존 Iceberg 파이프라인을 가져와 BigQuery 또는 Managed Spark를 사용하여 이러한 테이블을 원활하게 읽거나 쓸 수 있으며, 고급 BigQuery 기능을 통해 쉽게 현대화할 수 있습니다. 데이터 이동 없이 동일한 Iceberg 테이블에서 Spark ETL과 BigQuery AI를 실행하여 데이터 과학을 강화합니다. S3의 데이터로 작업하는 대화형 분석 에이전트를 BigQuery에서 빌드합니다.

          AI 워크플로에 Iceberg 데이터 통합

          멀티모달 데이터 분석 및 가속화된 AI 워크플로

          BigQuery AI를 사용해 정형 Iceberg 테이블과 비정형 데이터를 BigQuery ObjectRefs로 결합하여 단일 SQL 추론을 수행함으로써 멀티모달 분석을 강화할 수 있습니다. 시간 이동을 사용하여 Gemini Enterprise Agent Platform 모델을 학습시켜 데이터 드리프트를 디버깅합니다. 글로벌 REST 카탈로그를 통합 데이터 메시로 통합하고, 대규모 로그를 저렴하게 분석하며, 통합 노트북에서 직접 모델을 빌드하여 AI 워크플로를 가속화하세요.


            멀티모달 데이터 분석 및 가속화된 AI 워크플로

            BigQuery AI를 사용해 정형 Iceberg 테이블과 비정형 데이터를 BigQuery ObjectRefs로 결합하여 단일 SQL 추론을 수행함으로써 멀티모달 분석을 강화할 수 있습니다. 시간 이동을 사용하여 Gemini Enterprise Agent Platform 모델을 학습시켜 데이터 드리프트를 디버깅합니다. 글로벌 REST 카탈로그를 통합 데이터 메시로 통합하고, 대규모 로그를 저렴하게 분석하며, 통합 노트북에서 직접 모델을 빌드하여 AI 워크플로를 가속화하세요.


              동급 최고의 Spark 환경

              개발자 환경 전반에서 데이터 과학 워크로드 지원

              원활한 Spark 환경을 활용하세요. 통합 IDE를 사용하여 단일 Iceberg 데이터 사본에서 SQL, Spark, Python을 실행합니다. 새로운 Antigravity VS Code 확장 프로그램은 AI 파트너 역할을 하여 자연어로 파이프라인을 생성하고, 코드를 디버깅하고, CI/CD를 자동화합니다. 또한 Google Cloud의 벡터화된 Lightning Engine은 코드 변경 없이도 Spark 실행 속도를 최대 4.5배까지 가속화합니다.

                개발자 환경 전반에서 데이터 과학 워크로드 지원

                원활한 Spark 환경을 활용하세요. 통합 IDE를 사용하여 단일 Iceberg 데이터 사본에서 SQL, Spark, Python을 실행합니다. 새로운 Antigravity VS Code 확장 프로그램은 AI 파트너 역할을 하여 자연어로 파이프라인을 생성하고, 코드를 디버깅하고, CI/CD를 자동화합니다. 또한 Google Cloud의 벡터화된 Lightning Engine은 코드 변경 없이도 Spark 실행 속도를 최대 4.5배까지 가속화합니다.

                  BigQuery를 사용한 고성능 분석

                  BigQuery를 사용한 성능 최적화

                  유연한 스토리지를 유지하면서 BigQuery의 확장성을 활용하세요. BigQuery에서 멀티 문 트랜잭션을 실행하여 여러 Iceberg 테이블을 단일 원자 단위로 업데이트하고 금융 등급의 일관성을 보장합니다. BigQuery의 고급 런타임과 Iceberg의 파티셔닝 지원을 사용하여 블록 가지치기를 활용하는 파티션을 나눈 테이블/클러스터형 테이블을 만들어 비용 효율적인 고속 쿼리 실행을 지원합니다.

                    BigQuery를 사용한 성능 최적화

                    유연한 스토리지를 유지하면서 BigQuery의 확장성을 활용하세요. BigQuery에서 멀티 문 트랜잭션을 실행하여 여러 Iceberg 테이블을 단일 원자 단위로 업데이트하고 금융 등급의 일관성을 보장합니다. BigQuery의 고급 런타임과 Iceberg의 파티셔닝 지원을 사용하여 블록 가지치기를 활용하는 파티션을 나눈 테이블/클러스터형 테이블을 만들어 비용 효율적인 고속 쿼리 실행을 지원합니다.

                      실시간, 지능형

                      에이전트 AI를 위한 트랜잭션 및 분석 결합

                      트랜잭션 데이터와 분석 데이터를 통합하여 이벤트 기반 AI 에이전트를 강화하세요. Spanner 및 AlloyDB에서 Lakehouse Iceberg 테이블로 직접 지속적인 CDC 복제를 자동화합니다. 다음으로 SQL 연속 쿼리를 사용하여 이 스트리밍 데이터를 모니터링하고, AI 추론을 즉시 실행하고, 다운스트림 작업을 트리거하여 가장 중요한 운영 워크로드에 대한 실시간 인텔리전스를 제공합니다.

                        에이전트 AI를 위한 트랜잭션 및 분석 결합

                        트랜잭션 데이터와 분석 데이터를 통합하여 이벤트 기반 AI 에이전트를 강화하세요. Spanner 및 AlloyDB에서 Lakehouse Iceberg 테이블로 직접 지속적인 CDC 복제를 자동화합니다. 다음으로 SQL 연속 쿼리를 사용하여 이 스트리밍 데이터를 모니터링하고, AI 추론을 즉시 실행하고, 다운스트림 작업을 트리거하여 가장 중요한 운영 워크로드에 대한 실시간 인텔리전스를 제공합니다.

                          엔드 투 엔드 레이크하우스 거버넌스

                          Knowledge Catalog로 레이크하우스 제어

                          Knowledge Catalog는 Cloud Storage에서 Iceberg 테이블을 자동으로 검색하고 메타데이터를 Lakehouse 런타임 카탈로그에 직접 등록하여 통합된 거버넌스 레이어를 제공합니다. 이 통합을 통해 중앙 집중식 보안 정책을 정의하여 BigQuery와 오픈소스 처리 엔진 모두에서 일관된 행 수준 및 열 수준 액세스 제어를 보장할 수 있습니다.

                            Knowledge Catalog로 레이크하우스 제어

                            Knowledge Catalog는 Cloud Storage에서 Iceberg 테이블을 자동으로 검색하고 메타데이터를 Lakehouse 런타임 카탈로그에 직접 등록하여 통합된 거버넌스 레이어를 제공합니다. 이 통합을 통해 중앙 집중식 보안 정책을 정의하여 BigQuery와 오픈소스 처리 엔진 모두에서 일관된 행 수준 및 열 수준 액세스 제어를 보장할 수 있습니다.

                              가격 책정

                              Lakehouse(BigLake) 가격 책정 방식Lakehouse(BigLake) 가격은 테이블 관리, 메타데이터 스토리지, 메타데이터 액세스를 기준으로 책정됩니다.
                              서비스 및 사용량설명가격(USD)

                              Lakehouse(BigLake) 테이블 관리

                              자동 테이블 스토리지 최적화에 사용되는 Lakehouse(BigLake) 테이블 관리 컴퓨팅 리소스입니다.

                              시작 가격

                              $0.12

                              DCU-시간당

                              Lakehouse(BigLake) 메타데이터 스토리지

                              Lakehouse for Apache Iceberg metastore(Lakehouse 런타임 카탈로그)는 저장된 메타데이터에 대해 요금을 부과합니다. 무료 등급에는 월 1GiB의 메타데이터 스토리지가 포함됩니다.

                              시작 가격

                              $0.04

                              매월 1GiB당

                              Lakehouse(BigLake) 메타데이터 액세스

                              클래스 A 작업: 쓰기, 업데이트, 목록, 생성, 구성 작업에 대한 Lakehouse(BigLake) 메타데이터 액세스 요금으로, 무료 등급(월 5,000회 작업)이 포함됩니다.

                              시작 가격

                              $6.00

                              작업 백만 개당

                              클래스 B 작업: 읽기, 가져오기, 삭제 작업에 대한 Lakehouse(BigLake) 메타데이터 액세스 요금으로, 무료 등급(월 50,000회 작업)이 포함됩니다.

                              시작 가격

                              $0.90

                              작업 백만 개당

                              Lakehouse(BigLake) 가격 책정 방식

                              Lakehouse(BigLake) 가격은 테이블 관리, 메타데이터 스토리지, 메타데이터 액세스를 기준으로 책정됩니다.

                              Lakehouse(BigLake) 테이블 관리

                              설명

                              자동 테이블 스토리지 최적화에 사용되는 Lakehouse(BigLake) 테이블 관리 컴퓨팅 리소스입니다.

                              가격(USD)

                              Starting at

                              $0.12

                              DCU-시간당

                              Lakehouse(BigLake) 메타데이터 스토리지

                              설명

                              Lakehouse for Apache Iceberg metastore(Lakehouse 런타임 카탈로그)는 저장된 메타데이터에 대해 요금을 부과합니다. 무료 등급에는 월 1GiB의 메타데이터 스토리지가 포함됩니다.

                              가격(USD)

                              Starting at

                              $0.04

                              매월 1GiB당

                              Lakehouse(BigLake) 메타데이터 액세스

                              설명

                              클래스 A 작업: 쓰기, 업데이트, 목록, 생성, 구성 작업에 대한 Lakehouse(BigLake) 메타데이터 액세스 요금으로, 무료 등급(월 5,000회 작업)이 포함됩니다.

                              가격(USD)

                              Starting at

                              $6.00

                              작업 백만 개당

                              클래스 B 작업: 읽기, 가져오기, 삭제 작업에 대한 Lakehouse(BigLake) 메타데이터 액세스 요금으로, 무료 등급(월 50,000회 작업)이 포함됩니다.

                              설명

                              Starting at

                              $0.90

                              작업 백만 개당

                              가격 계산기

                              리전별 가격 및 수수료를 포함한 월별 Lakehouse 비용을 예측해 볼 수 있습니다.

                              커스텀 견적

                              영업팀에 문의하여 조직에 대한 커스텀 견적을 받아 보세요.

                              개념 증명 시작

                              무료 체험판 시작하기

                              대규모 프로젝트가 있나요?

                              완전 관리형 Apache Iceberg 테이블

                              Apache Iceberg REST 카탈로그 사용

                              Apache Iceberg 데이터 쿼리

                              Google Cloud