Google BigQuery

어떤 규모에서든 분석이 가능한 빠르고 확장성이 뛰어나며 경제적인 완전 관리형 기업용 데이터 웨어하우스

무료로 사용해 보기

BigQuery는 모든 데이터 분석가의 생산성을 높일 수 있도록 설계된 Google의 확장성이 뛰어난 서버리스 저비용 기업용 데이터 웨어하우스입니다. 관리할 인프라가 없기 때문에 익숙한 SQL로 데이터를 분석해 의미 있는 유용한 정보를 찾는 데 집중할 수 있으며 데이터베이스 관리자가 필요하지 않습니다. BigQuery를 사용하면 관리형 열 형식 저장소는 물론 스프레드시트와 객체 저장소의 데이터를 통해 논리적 데이터 웨어하우스를 만들어 모든 데이터를 분석할 수 있습니다. BigQuery를 통해 데이터세트, 쿼리, 스프레드시트, 보고서 형태로 안전하게 조직 내외에서 유용한 정보를 공유할 수 있습니다. BigQuery를 사용하면 조직에서 강력한 스트리밍 내부 데이터화 기능으로 데이터를 실시간으로 캡처하고 분석할 수 있으므로 유용한 정보가 항상 최신 상태로 유지됩니다. BigQuery에서 매월 최대 1TB의 분석 데이터와 10GB의 저장 데이터가 무료로 제공됩니다.

빠른 준비 및 실행

몇 초 만에 데이터 웨어하우스를 설정하고 즉시 데이터를 쿼리할 수 있습니다. Google BigQuery는 기가바이트에서 페타바이트에 이르는 데이터에서 엄청난 속도로 SQL 쿼리를 실행하며 공개 또는 상용 데이터세트를 데이터와 쉽게 결합할 수 있습니다. 시간이 오래 걸리는 인프라 프로비저닝 작업을 할 필요가 없어지며, 패치 및 업그레이드를 포함한 지속적인 모든 유지관리 작업을 처리하는 서버리스 인프라를 통해 다운타임이 줄어듭니다. Google BigQuery는 익숙한 ANSI 호환 SQL을 사용하며 데이터를 빠르고 쉽게 통합할 수 있도록 ODBC 및 JDBC 드라이버를 제공합니다.

빠른 준비 및 실행

원활한 확장

데이터 웨어하우스 용량을 계획해야 하는 부담이 사라지고 제한 없는 탄력적인 용량 확장을 통해 무한 확장할 수 있습니다. Google BigQuery는 자동 확장 및 고성능 스트리밍 내부 데이터화로 데이터를 로드하는 Google의 서버리스 인프라를 활용하여 실시간 분석의 난제를 해결합니다. BigQuery의 관리형 열 형식 저장소가 대량으로 동시 로드를 실행하고 자동으로 성능을 최적화하므로 사용자 수나 데이터 크기와 관계없이 모든 사용자가 신속하게 동시에 데이터를 분석할 수 있습니다.

원활한 확장

강력한 분석으로 유용한 정보를 빠르게 확보

데이터를 복사하거나 이동할 필요 없이 데이터로부터 더욱 빠르게 정보를 얻을 수 있습니다. Google BigQuery가 BigQuery의 관리형 열 형식 저장소, Google Cloud Storage, Google Cloud Bigtable, Google 스프레드시트, Google 드라이브에 저장된 데이터를 원활하게 쿼리하여 모든 데이터를 전체적으로 볼 수 있습니다. BigQuery가 Informatica 및 Talend와 같은 기존 ETL 도구와 통합하여 이미 사용 중인 데이터도 보강합니다. BigQuery는 Tableau, MicroStrategy, Looker, Google 데이터 스튜디오 등의 인기 BI 도구를 즉시 사용할 수 있도록 지원하므로 누구나 쉽게 뛰어난 보고서와 대시보드를 만들 수 있습니다. BigQuery 데이터 전송 서비스로 Google Ads 및 마케팅 데이터를 자동으로 내부 데이터화하고 시각화하여 클릭 몇 번만으로 강력한 마케팅 데이터 웨어하우스가 설정됩니다.

강력한 분석으로 유용한 정보를 빠르게 확보

비즈니스 데이터 및 투자 보호

예산에 맞는 비용으로 탁월한 성능, 보안, 기능을 경험해 보세요. Google BigQuery가 추가 비용 없이 재해 복구용 자동 데이터 복제와 높은 처리 가용성을 제공하므로 데이터 운영 부담이 없어집니다. Google BigQuery는 99.9% SLA를 제공하며 미국과 유럽 연합 간의 세이프 하버 협정을 준수합니다. BigQuery의 세밀한 ID 및 액세스 관리 제어로 강력한 보안을 쉽게 유지할 수 있습니다. BigQuery 데이터는 미사용 상태와 전송 중에 항상 암호화됩니다.

비즈니스 데이터 및 투자 보호

BigQuery의 특장점

어떤 규모에서든 분석이 가능한 빠르고 확장성이 뛰어나며 경제적인 완전 관리형 기업용 데이터 웨어하우스

서버리스
리소스가 필요할 때 서버리스 데이터 웨어하우스가 필요한 리소스를 제공합니다. BigQuery를 사용하면 직접 컴퓨팅 리소스를 운영하고 크기를 설정하는 대신 데이터와 분석에 집중할 수 있습니다.
실시간 분석
BigQuery의 고속 스트리밍 삽입 API가 실시간 분석을 위한 강력한 기반을 제공합니다. BigQuery를 통해 최신 비즈니스 데이터를 즉시 분석에 사용할 수 있으므로 현재 상황을 분석할 수 있습니다.
자동 고가용성
여러 위치에서 무료 데이터 및 컴퓨팅 복제가 제공되므로 심각한 장애가 발생한 경우에도 데이터를 쿼리할 수 있습니다. BigQuery는 추가 비용과 설정 없이 투명하게 자동으로 내구성 있는 복제 저장소와 고가용성을 제공합니다.
표준 SQL
BigQuery는 ANSI:2011과 호환되는 표준 SQL 언어를 지원하므로 코드를 다시 작성할 필요가 줄어들며 고급 SQL 기능을 활용할 수 있습니다. BigQuery는 ODBC 및 JDBC 드라이버를 제공하므로 현재 애플리케이션에서 BigQuery의 강력한 엔진을 활용할 수 있습니다.
통합 쿼리 및 논리적 데이터 웨어하우스
BigQuery는 데이터 고립을 없애므로 한곳에서 모든 데이터 애셋을 분석할 수 있습니다. 강력한 통합 쿼리를 통해 BigQuery가 데이터 중복 없이 객체 저장소(Cloud Storage), 트랜잭션 데이터베이스(Cloud Bigtable) 또는 Google 드라이브 스프레드시트의 데이터를 처리할 수 있습니다. 도구 하나로 모든 데이터 소스를 쿼리할 수 있습니다.
저장소와 컴퓨팅 분리
BigQuery는 비용 및 액세스 권한에 대한 세밀한 제어 기능을 제공합니다. BigQuery의 저장소 및 컴퓨팅이 분리되어 있으므로 사용한 리소스에 대한 비용만 지불하면 됩니다. 비즈니스에 적합한 저장소와 처리 솔루션을 선택하고 각각의 액세스 권한을 제어할 수 있습니다.
자동 백업 및 간편한 복원
BigQuery가 자동으로 데이터를 복제하고 변경 기록을 7일 동안 유지하므로 예상하지 못한 데이터 변경에 대한 우려가 줄어듭니다. 이를 통해 다른 시점의 데이터를 쉽게 복원하고 비교할 수 있습니다.
데이터 전송 서비스
데이터가 SaaS 애플리케이션에 있는 경우에도 BigQuery로 쉽게 데이터 웨어하우스를 시작할 수 있습니다. BigQuery 데이터 전송 서비스가 예약에 따라 완전 관리형으로 DoubleClick, 애드워즈, YouTube등의 외부 데이터 소스에서 BigQuery로 데이터를 자동으로 전송합니다.
빅데이터 생태계 통합
Cloud Dataproc 및 Cloud Dataflow와 함께 BigQuery가 Apache 빅데이터 생태계와의 통합을 제공하므로 기존 Hadoop, Spark, Beam 작업에서 BigQuery의 데이터를 바로 읽거나 쓸 수 있습니다. BigQuery를 사용하면 간편하게 SQL을 분석하고 기존 빅데이터 작업과 통합하여 구조화된 데이터를 최대한 활용할 수 있으므로 기존에 진행한 작업을 폐기할 필요가 없습니다.
페타바이트급 규모
데이터 크기와 관계없이 BigQuery를 빠르고 쉽게 사용할 수 있습니다. BigQuery로 뛰어난 데이터 성능을 얻으면서 매끄럽게 확장하여 용량을 추가 구매할 필요 없이 페타바이트 이상의 데이터를 저장하고 분석할 수 있습니다.
유연한 가격 모델
BigQuery에서 가장 잘 맞는 가격 모델을 선택할 수 있습니다. 주문형 가격의 경우 사용한 저장소와 컴퓨팅에 해당하는 비용만 지불하면 됩니다. 정액제의 경우 대용량 사용자나 기업에서 월정액 분석 요금을 선택할 수 있습니다. 자세한 내용은 BigQuery 가격을 참조하세요.
데이터 암호화 및 보안
Google BigQuery에 저장된 데이터에 액세스할 수 있는 사람을 완전하게 관리할 수 있습니다. BigQuery를 사용하면 Google Cloud IAM의 세밀한 ID 및 액세스 관리로 강력한 보안을 쉽게 유지할 수 있으며, 데이터는 미사용 상태와 전송 중에 항상 암호화됩니다.
데이터 위치
완전 관리형 서비스의 혜택을 계속 누리면서 미국 및 유럽 내의 위치에 BigQuery 데이터를 저장할 수 있습니다. 지역 내에서 클러스터 및 기타 컴퓨팅 리소스를 설정하고 관리할 부담 없이 BigQuery가 지리적 데이터 제어 옵션을 제공합니다.
AI를 위한 기반
BigQuery는 머신러닝과 인공지능을 위한 유연하고 강력한 기반을 제공합니다. BigQuery가 제공하는 CloudML Engine 및 TensorFlow 통합으로 구조화된 데이터에서 강력한 모델을 학습시킬 수 있습니다. 또한 BigQuery로 데이터를 변환하고 분석할 수 있으므로 데이터를 머신러닝에 맞게 만들 수 있습니다.
유연한 내부 데이터화
Google Cloud Storage 또는 Google Cloud Datastore 백업에서 데이터를 로드하거나 초당 수천 행으로 BigQuery에 스트리밍하면 데이터를 실시간으로 분석할 수 있습니다. Informatica, Talend 및 기타 익숙한 데이터 통합 도구를 즉시 사용할 수 있습니다.
데이터 통제
BigQuery는 Google Cloud IAM 통합을 통해 API에서 데이터에 대한 세밀한 액세스 제어와 역할 기반 제어를 제공합니다. BigQuery와 Cloud IAM을 함께 사용하면 승인되지 않은 액세스로부터 데이터가 안전하게 보호됩니다.
프로그래매틱 상호작용
BigQuery는 간편한 프로그래매틱 액세스와 애플리케이션 통합을 위해 REST API를 제공합니다. 모든 유형의 프로그래머를 지원하기 위해 BigQuery는 Java, Python, Node.js, C#, Go, Ruby, PHP로 클라이언트 라이브러리를 제공합니다. 비즈니스 사용자는 Google AppScript를 사용하여 Google 스프레드시트에서 BigQuery에 액세스할 수 있습니다.
Stackdriver를 통한 풍부한 모니터링 및 로그 기록
BigQuery는 Stackdriver 감사 로그를 통해 풍부한 모니터링, 로그 기록, 알림을 제공합니다. BigQuery 리소스를 한눈에 모니터링할 수 있으며, BigQuery가 Stackdriver Logging을 사용하는 모든 애플리케이션이나 서비스의 로그 저장소 역할을 할 수 있습니다.
비용 관리
BigQuery의 비용 관리 메커니즘으로 고객은 일일 비용을 제한할 수 있습니다. 비용 관리에 대한 자세한 내용은 여기를 클릭하세요.

BigQuery 솔루션 및 사용 사례

실시간 인벤토리 관리 시스템
사물 인터넷
대규모 이벤트 및 로그 분석
예측 디지털 마케팅
상용 데이터세트로 데이터 배포
공개 데이터세트

BigQuery 가격

BigQuery에서 데이터 저장소, 스트리밍 삽입, 데이터 쿼리 비용을 청구하지만 데이터 로드 및 내보내기는 무료입니다. 자세한 가격 정보는 가격 책정 가이드를 참조하세요.

항목 가격
저장소 GB당 $0.02/월
장기 저장소의 경우 GB당 $0.01/월
스트리밍 삽입 200MB당 $0.01
데이터 로드, 복사, 내보내기
메타데이터 작업
무료
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

데이터를 쿼리하는 경우에는 다음 두 가지 가격 책정 옵션 중에서 선택할 수 있습니다.

기능 가격
종량제 TB당 $5
매달 처음 1테라바이트(1TB)는 무료*
고정 요금제 최저가 $40,000/월(전용 슬롯 2,000개 예약)
자세한 내용은 정액제를 참조하세요.
USD 외의 통화로 지불하는 경우 Cloud Platform SKU에 해당 통화로 표기된 가격이 적용됩니다.

* 매달 Google BigQuery로 처리되는 데이터의 처음 1테라바이트(1TB)는 무료입니다.
참고: 이러한 작업에 BigQuery의 할당량 정책이 적용됩니다.

BigQuery 파트너

Google BigQuery는 수많은 도구 및 파트너들이 클라우드 기반 데이터 웨어하우스의 잠재력을 최대한 활용할 수 있도록 지원합니다. 데이터 통합에서 분석에 이르기까지 Google Cloud 파트너는 업계 최고 수준의 데이터 로드, 변환, 시각화 도구 등을 BigQuery와 통합하여, 고객이 BigQuery의 민첩성, 성능, 사용 편의성을 활용하여 더욱 빠르고 강력한 정보를 제공할 수 있게 되었습니다.

ETL 파트너

BI 및 데이터 시각화

BigQuery 추천 블로그

BigQuery에서 스프레드시트의 비즈니스 데이터를 고속으로 처리하는 방법
Dan McClary(제품 관리자)
Google BigQuery 내부 구조
Jordan Tigani(BigQuery 기술 리드) 및 Tino Tereshko(BigQuery 기술 프로그램 관리자)
빅데이터의 가치를 평가할 때 기능이 아닌 경제성을 고려하기
ESG
Google BigQuery 쿼리 분석
Jordan Tigani(BigQuery 기술 리드) 및 Tino Tereshko(BigQuery 기술 프로그램 관리자)
완전 관리형의 의미를 새로 정의해 나가는 Google BigQuery
Tereshko(BigQuery 기술 프로그램 관리자)
Google의 대규모 정렬 실험 기록
Marian Dvorsky(Google Cloud Platform 소프트웨어 엔지니어)
BigQuery의 차세대 열 형식 저장소 형식인 Capacitor 알아보기
Mosha Pasumansky, Dremel(BigQuery 기술 리드)
Google BigQuery의 인메모리 쿼리 실행
Hossein Ahmadi(BigQuery 기술 리드)
대규모 확장: Motorola에서 Google Cloud Platform을 통해 데이터 웨어하우스 및 분석을 변환한 방법
Alex Barrett(Google Cloud Platform 블로그 편집자)

블로그 글을 더 읽어보고 BigQuery에 대해 자세히 알아보려면 Google Cloud 빅데이터 및 머신러닝 블로그를 방문하세요. Twitter(@GCPDataML)에서도 팔로우할 수 있습니다.