정식 버전으로 출시된 새로운 BigQuery의 Gemini 기능 사용해 보기
Deepak Dayama
Product Manager, Google Cloud
Honza Fedak
Director of Engineering
* 본 아티클의 원문은 2024년 8월 29일 Google Cloud 블로그(영문)에 게재되었습니다.
Google의 2024년 데이터 및 AI 트렌드 보고서에 따르면 생성형 AI로 인해 인사이트를 얻는 속도가 빨라질 것으로 생각하는 조직은 84%에 달하며, 특히 비기술직 사용자 중 52%는 이미 생성형 AI를 활용해 유용한 인사이트를 도출하고 있습니다.
Google Cloud는 Google의 데이터 클라우드를 통해 수십 년간 진행한 AI 연구 및 투자 결과를 데이터 관리와 분석에 혁신적으로 적용하여 조직이 환경을 새롭게 조성하고 조직의 독점 데이터로 그라운딩된 데이터 에이전트를 빌드할 수 있도록 지원하고 있습니다. Google Cloud Next 2024에서 Google Cloud가 소개한 BigQuery의 Gemini 프리뷰는 데이터 검색 및 탐색부터 데이터 준비 및 엔지니어링, 분석 및 인사이트 생성 등 데이터 여정 전반을 지원하는 AI 기반 경험과 함께 사용자 생산성을 높이고 비용을 최적화하는 지능형 추천도 제공합니다.
“BigQuery의 Gemini는 Julo의 쿼리 생성 프로세스에 혁신을 일으켰습니다. BigQuery에 통합되어 SQL 템플릿을 쉽게 생성할 수 있게 되었고, 중요한 머신러닝 모델 모니터링 쿼리를 포함한 라벨 및 특성 추출의 효율성을 높이는 데 도움이 되었습니다. 복잡한 데이터 구조를 이해하고 정확한 쿼리를 제공하는 Gemini의 기능 덕분에 워크플로가 그 어느 때보다 빠르고 원활합니다.” - Martijn Wieriks, Julo 최고 데이터 책임자
오늘 Google Cloud는 SQL 코드 생성 및 설명, Python 코드 생성, 데이터 캔버스, 데이터 인사이트 및 파티셔닝, 클러스터링 추천을 비롯한 다양한 BigQuery의 Gemini 기능을 정식 버전으로 출시했습니다.
그중 바로 활용할 수 있는 몇 가지 BigQuery의 Gemini 기능을 자세히 살펴보겠습니다.
BigQuery의 Gemini가 보여주는 차별성
BigQuery의 Gemini에는 비즈니스 니즈에 최적화된 최첨단 모델과 함께 데이터 관리 및 AI 인프라 부문에 관한 Google의 기능이 결집되어 있습니다.
-
컨텍스트 인식: 사용자 의도를 파악하고 목표를 이해하고 능동적인 소통을 통해 워크플로를 가속화함
-
자체 데이터 그라운딩: 비즈니스 데이터를 지속적으로 학습하고 이에 맞게 변화해 새로운 기회를 발굴하고 문제를 예측함
-
통합 환경: BigQuery 인터페이스 내에서 직접 액세스 가능하며 분석 워크플로 전반에 걸쳐 원활한 경험을 제공함
데이터 인사이트 시작하기
데이터 분석 여정은 먼저 데이터를 발견하고 데이터 애셋에서 얻을 수 있는 인사이트를 평가하는 것으로 시작됩니다. 자사 데이터에 특화된 인사이트를 얻을 수 있는 질문 라이브러리가 있다고 상상해 보세요. 물어봐야 하는지조차 몰랐던 질문도 있을 수 있습니다. 데이터 인사이트는 사전 검증되고 즉시 실행할 수 있는 쿼리를 통해 즉각적으로 인사이트를 제공하므로 추측이 필요하지 않습니다. 예를 들어 고객 이탈 데이터가 포함된 테이블을 살펴볼 때 데이터 인사이트는 특정 고객 세그먼트에서 이탈이 발생한 요인을 살펴볼 것을 추천하는 등 미처 생각하지 못한 시각을 제시할 수 있습니다.
이처럼 실행 가능한 쿼리가 BigQuery Studio에 기본 제공되어 있어 클릭 한 번으로 필요한 순간에 인사이트를 얻어 분석을 진행할 수 있습니다.


BigQuery의 Gemini는 클릭 한 번으로 실행할 수 있는 테이블에 대한 실행 쿼리를 자연어 인사이트로 추천합니다.
SQL 코드 및 Python 코드 지원을 통한 생산성 향상
BigQuery의 Gemini는 직관적인 자연어 프롬프트를 사용하고 관련 스키마와 메타데이터를 참조하면서 SQL 코드 또는 Python 코드를 작성 및 수정하는 데 도움이 됩니다. 코드의 오류와 불일치를 줄이는 한편 코딩 경험이 부족한 사용자도 복잡하고 정확한 쿼리를 작성할 수 있도록 지원합니다.
“Unerry의 데이터팀은 BigQuery의 Gemini를 통해 더욱 신속하게 인사이트를 도출하고 데이터 파이프라인 및 분석의 주기를 단축하는 데 도움을 얻고 있습니다. AI를 사용해 SQL 코드를 생성하고 텍스트를 임베딩하면 생산성이 향상되어 효과가 큰 이니셔티브에 집중할 시간을 더 많이 확보할 수 있습니다. 결과적으로 고객에게 행동 기반 인텔리전스를 제공한다는 Unerry의 사명을 실현하는 데 도움이 되리라 기대합니다.” - Okayasu, Unerry, Inc. 최고 데이터 과학자
데이터 내 구조와 관계를 이해하는 BigQuery의 Gemini를 활용하면 단순한 자연어 프롬프트를 사용해 맞춤 코드를 추천받을 수 있습니다. 사용자가 요청할 수 있는 내용을 예로 들면 다음과 같습니다.
-
“테이블에 있는 제품별로 총매출액을 계산하는 SQL 쿼리를 생성해 줘.”
-
“Pandas를 사용해서 제품 판매량과 고객 리뷰 수 간의 상관관계를 분석하는 Python 코드를 작성해 줘.”
-
“구독자 유형별로 평균 이동 거리를 계산해 줘.”


BigQuery의 Gemini를 사용한 SQL 코드 생성
BigQuery의 Gemini는 복잡한 SQL 쿼리 및 Python 쿼리의 이해를 돕는 설명과 인사이트도 제공하여 모든 수준의 사용자가 코드 이면의 논리를 더 쉽게 이해할 수 있게 합니다. 이는 특히 SQL과 파이썬을 처음 접하거나 익숙하지 않은 데이터 세트를 다루는 사용자에게 유용합니다.


BigQuery의 Gemini를 활용한 SQL 코드 설명
자연어를 사용하는 분석 워크플로 재정립
BigQuery의 Gemini에는 데이터 탐색, 선별, 랭글링, 분석, 시각화를 위한 혁신적인 자연어 기반 인터페이스인 데이터 캔버스가 포함되어 있습니다. 데이터 캔버스를 통해 사용자는 그래픽 워크플로로 데이터 여정을 탐색하고 구조화할 수 있으며 원활하고 직관적인 데이터 탐색과 분석이 가능합니다.
“여러 쿼리가 나올 수밖에 없는 탐색 또는 조사 작업을 진행할 때 데이터 캔버스를 대체할 도구는 없습니다. 덕분에 시간을 절약하고 정신적 수고를 덜 수 있었습니다.” - Scott Schaen, Wunderkind 분석 부문 부사장
예를 들어 소매점 전반의 매출을 분석할 때 하나의 사용자 인터페이스에서 간단한 자연어 프롬프트를 사용하여 POS 시스템 같은 여러 소스의 데이터를 수집하거나 인벤토리, CRM, 외부 데이터와 통합하거나 매장 위치, 제품 카테고리, 매출 같은 요소 사이의 관계를 밝히거나 이해관계자를 위한 보고서와 시각화를 개발할 수 있습니다. BigQuery 데이터 캔버스에 대해 자세히 알아보려면 이 블로그를 참고하고 아래 데모를 시청하세요.

성능 및 속도를 위한 분석 최적화
데이터양이 증가하면서 데이터 관리자와 기타 분석 전문가는 효과적으로 용량을 관리하고 쿼리 성능을 개선하는 데 어려움을 겪고 있습니다. 이러한 어려움을 해결하기 위해 BigQuery의 Gemini는 테이블을 파티셔닝하고 클러스터링하기 위한 AI 기반 추천을 제공합니다. 이 추천 기능은 쿼리를 수정할 필요 없이 테이블을 최적화하여 결과 도출 속도를 높이고 쿼리 비용을 절감하기 위해 마련되었습니다.
시작하기
SQL 코드 생성 및 설명, Python 코드 생성, 데이터 캔버스, 데이터 인사이트, 파티셔닝 및 클러스터링 추천이 포함된 BigQuery의 Gemini 정식 버전 기능이 오늘부터 몇 개월에 걸쳐 단계적으로 출시될 예정입니다.
이번에 출시되는 정식 버전(GA) 기능은 모든 고객에게 추가 비용 없이 제공됩니다. 자세한 내용은 가격 책정 세부정보를 참고하세요.