Netezza에서 BigQuery로 마이그레이션 가이드

이 문서에서는 Netizza에서 BigQuery로 마이그레이션하는 조직에 대한 개략적인 안내를 제공합니다. 이 문서에서는 조직이 BigQuery를 최대한 활용하도록 기존 데이터 모델과 추출, 변환, 로드(ETL) 프로세스를 재고하는 방법을 보여줍니다.

소개

수십 년 동안 대규모 조직에서는 방대한 양의 데이터를 저장하고 분석하는 데 Netezza와 같은 시스템을 사용했습니다. 이러한 시스템은 강력하지만 하드웨어, 유지보수, 라이선스에 대한 많은 투자가 필요합니다. 또한 데이터 소스 수와 데이터 볼륨이 증가함에 따라 조직은 노드 관리, 소스당 데이터 볼륨, 보관처리 비용, 시스템의 전반적인 확장성에 관한 문제에 직면합니다.

따라서 갈수록 더 많은 조직에서 클라우드 기반 엔터프라이즈 데이터 웨어하우스의 요구사항을 해결하기 위해 BigQuery를 평가하고 있습니다. BigQuery는 분석을 위한 Google의 완전 관리형 페타바이트 규모의 서버리스 엔터프라이즈 데이터 웨어하우스(EDW)입니다. 관리할 인프라가 없고 데이터베이스 관리자가 필요하지 않습니다. 익숙한 SQL로 데이터를 분석해 의미 있고 유용한 정보를 찾는 데 집중할 수 있습니다.

BigQuery는 색인이 없는 수십억 개의 행을 수십 초 내에 스캔할 수 있습니다. BigQuery는 Google의 인프라를 공유하는 대량의 클라우드 기반 병렬 쿼리 서비스로서, 각 쿼리를 병렬 처리하고 수만 개의 서버에서 동시에 실행할 수 있습니다. BigQuery와 차별화되는 2가지 핵심 기술은 열 형식 스토리지와 트리 아키텍처입니다.

  • 열 형식 스토리지: 데이터는 행이 아닌 열에 저장되므로 매우 높은 압축 비율과 스캔 처리량을 확보할 수 있습니다.
  • 트리 아키텍처: 쿼리는 디스패치되고 결과는 몇 초 내에 수천 개의 머신에서 집계됩니다.

BigQuery의 기술 아키텍처는 Google BigQuery 자세히 살펴보기에 자세히 설명되어 있습니다.

문서를 모두 보려면 버튼을 클릭하세요.

PDF 다운로드