단일 SQL로 분산 데이터를 탐색하는 새로운 Big Query 글로벌 쿼리
Wawrzek Hyska
Product Manager
Oleh Khoma
Software Engineer
* 본 아티클의 원문은 2026년 02월 18일 Google Cloud 블로그(영문)에 게재되었습니다.
글로벌 경제 환경에서 데이터는 전 세계 곳곳에서 생성되고 저장됩니다. 다국적 기업의 경우 고객 데이터는 미국 본사에 두고, 트랜잭션 로그는 유럽과 아시아에 분산 저장하는 경우가 많습니다. 이는 성능 최적화, 규정 준수, 데이터 주권 요구사항을 충족하는 데 도움이 됩니다. 하지만 이러한 방식은 '데이터가 여러 대륙에 분산되어 있는데, 어떻게 비즈니스 전체를 아우르는 단일 통합 뷰를 확보할 것인가?'라는 새로운 과제를 안겨줍니다.
과거에는 이 문제를 해결하기 위해 분석 전 데이터를 복사하고 중앙 집중하하기 위해 복잡하고 시간이 오래 걸리며 비용이 많이 드는 ETL 파이프라인이 필요했습니다. 이로 인해 지연이 발생하고 복잡성이 가중되며 팀이 적시에 임시 분석을 수행하는 데 방해가 되었습니다.
오늘 소개하는 Big Query의 글로벌 쿼리가 이러한 판도를 바꿉니다. 이제 ETL 없이도 단일 표준 SQL 쿼리만으로 서로 다른 지리적 위치에 저장된 데이터를 쿼리할 수 있습니다. 글로벌 쿼리는 현재 프리뷰 버전으로 이용 가능합니다.
글로벌 쿼리란 무엇인가요?
글로벌 쿼리는 여러 지역에 분산된 데이터 세트 간의 장벽을 허물어 줍니다. 이제 이 다국적 기업은 Big Query 콘솔에서 직접 단일 쿼리를 실행하여 모든 데이터를 조인, 통합, 분석할 수 있습니다.
백그라운드에서 Big Query가 쿼리를 실행하는 데 필요한 데이터 이동을 자동으로 처리하여 다중 지역 분석을 위한 원활한 제로 ETL 환경을 제공합니다. Big Query는 서로 다른 리전에서 실행되어야 하는 쿼리의 여러 부분을 식별하고 그에 따라 실행합니다. 다음으로, 각 부분의 쿼리 결과는 기본 쿼리가 실행될 때 선택한 위치로 전송됩니다. 이때 전송 크기를 최소화하기 위한 최적화 작업이 병행됩니다. 마지막으로 모든 데이터가 결합되고 최종 쿼리 결과가 반환됩니다.
BigQuery 사용자 Essilor Luxottica는 글로벌 쿼리를 조기에 도입하여 큰 성과를 거두었습니다.
“EssilorLuxottica는 데이터 보안과 규정 준수를 최우선으로 생각합니다. 이것이 바로 데이터가 발생한 해당 리전에 항상 저장되어야 하는 이유입니다. Big Query의 글로벌 쿼리를 사용하면 이렇게 분산된 데이터를 원활하게 통합할 수 있습니다. 이를 통해 규정 준수를 타협하지 않으면서도 교차 리전의 집계된 분석을 수행할 수 있습니다. 보안을 유지하면서도 데이터 기반의 의사 결정을 내릴 수 있는 강력한 방법입니다.” - 루벤스 발라비오, EssilorLuxottica 고객 데이터 플랫폼 관리자
이와 동시에, 리전 간 데이터 전송은 추가 비용이 발생하며, 다양한 규제들로 인해 개인 식별 정보(PII)가 원래 위치를 벗어나서는 안 되는 경우가 많습니다. 이러한 이유로 Google Cloud는 지리적 경계를 넘어 데이터를 전송하는 과정에 강력한 거버넌스가 필요하다는 것을 인지하고 있습니다. 따라서 글로벌 쿼리는 보안과 사용자 제어를 최우선으로 두고 설계되었습니다. 구체적인 방법은 다음과 같습니다.
-
명시적 활성화 필수: 실수로 인한 의도치 않은 데이터 전송이나 비용 발생을 방지하기 위해 글로벌 쿼리 기능은 기본적으로 비활성화되어 있습니다. 이 기능을 사용하려면 관리자가 프로젝트에 글로벌 쿼리를 명시적으로 활성화해야 하며, 실행하는 사용자 또는 서비스 계정별로 특별 권한이 필요합니다.
-
위치 제어권 보유: 글로벌 쿼리가 실행되는 위치를 사용자가 직접 지정할 수 있습니다. 이를 통해 데이터가 처리되는 위치를 통제하고 데이터 상주 및 규정 준수 요구사항을 준수할 수 있습니다.
-
거버넌스 제어 준수: 글로벌 쿼리는 VPC 서비스 제어를 포함한 기존 보안 설정을 준수하므로 설정된 보안 정책을 위반하는 방식으로는 데이터가 이동하지 않습니다.
글로벌 쿼리 실제 작동 예시
실제 작동 예시로 단일 쿼리로 생성된 글로벌 매출 통합 보고서를 살펴보겠습니다. 이전에는 이러한 보고서를 만들이 위해 별도의 데이터 엔지니어링 프로젝트가 필요했습니다. 하지만 이제 권한이 있는 분석가라면 누구나 단일 쿼리로 몇 초 만에 답을 얻을 수 있습니다.
보시는 것처럼 이 모든 과정은 표준 SQL로 이루어집니다. 유럽 및 아시아 데이터 세트에 저장된 모든 트랜잭션을 가져와 미국에 보관된 고객 데이터와 결합합니다. 이전과 다른 점은 이제 Big Query가 수천 마일 떨어진 데이터 세트에서 이 작업을 직접 수행한다는 것입니다. 이를 통해 아키텍처를 획기적으로 간소화할 뿐만 아니라, 인사이트를 얻기까지의 시간 역시 대폭 단축해 줍니다.
지금 바로 글로벌 쿼리를 시작해 보세요
글로벌 쿼리를 사용하면 분산된 데이터 전반에서 새로운 인사이트를 도출하고, 팀원들이 진정한 온디맨드 글로벌 분석 역량을 갖추도록 지원할 수 있습니다.
기능 활성화 및 사용 방법에 대한 자세한 내용은 official documentation를 참고하시기 바랍니다. Google Cloud는 정식 버전 출시를 목표로 기능을 지속적으로 발전시켜 나가고 있으며 여러분의 소중한 의견을 기다리고 있습니다.
