Presto란?

Presto는 Facebook 개발자가 대량의 데이터에 대해 대화형 분석을 실행하기 위해 만든 오픈소스 분산 SQL 쿼리 엔진입니다. Presto를 사용하는 조직은 새로운 복잡한 언어를 학습하지 않고도 기존 SQL 기술을 사용하여 빅데이터를 쿼리할 수 있습니다.

Dataproc의 Presto가 데이터 분석을 가속화하는 방법을 알아보세요.

Presto의 정의

오픈소스 Presto(SQL 쿼리 엔진)는 업계 표준 SQL 쿼리 언어를 사용하여 온프레미스 시스템과 클라우드에서 여러 소스의 빅데이터를 빠르고 쉽게 처리하고 임시 분석을 수행할 수 있는 방법을 제공합니다.

Presto 아키텍처는 하나의 마스터 노드가 여러 워커 노드를 조정하는 분산 컴퓨팅을 사용하는 기본 온라인 분석 처리(OLAP) 시스템과 매우 유사합니다.

Presto의 용도

Presto를 사용하면 조직은 BigQuery, Hadoop 분산 파일 시스템, Cloud Storage, MySQL용 Cloud SQL, Apache Cassandra, Apache Kafka 등 대규모 데이터 스토리지에서 통합 쿼리를 원활하게 실행할 수 있습니다. 몇 가지 구체적인 사용 사례는 다음과 같습니다.

데이터 웨어하우징

Presto를 사용하면 개방형 분산형 SQL 쿼리 엔진을 사용하여 기존의 OLAP 워크로드와 같은 데이터베이스 엔진 쿼리를 실행할 수 있습니다.

임시 비즈니스 인텔리전스

빠른 데이터 탐색과 간단한 보고를 위해 작은 Presto 쿼리 엔진을 만들어 여러 데이터 소스에 대한 쿼리를 실행한 다음 전원 종료합니다.

간단한 데이터 준비

데이터를 신속하게 조인하고 집계하여 임시 쿼리를 위한 데이터 세트와 파생 변수를 준비합니다.

Dataproc용 Presto 선택적 구성요소는 빠른 클러스터 시작 시간 및 나머지 Dataproc과의 통합 테스트 등 Google Cloud의 전체 지원 제품군을 제공합니다.

BigQueryCloud Storage는 데이터 분석을 위해 Dataproc 및 Presto 쿼리 엔진 구성요소를 사용하는 Google Cloud 솔루션의 일부가 될 수 있습니다.