跳至

什麼是 Presto?

Presto 是 Facebook 開發人員打造的開放原始碼分散式 SQL 查詢引擎,可針對大量資料進行互動式分析。只要採用 Presto,機構就能直接運用現有的 SQL 技巧查詢大數據,不需要學習新的複雜語言。

如要瞭解 Dataproc 中的 Presto 如何加快資料分析速度,請按這裡

Presto 的定義

開放原始碼 Presto (SQL 查詢引擎) 使用符合業界標準的 SQL 查詢語言,能讓您以簡單、快速的方式處理內部部署系統和雲端上多個來源的大數據,並對這些數據進行個案式分析。

Presto 架構與使用分散式運算的傳統線上分析處理 (OLAP) 系統非常類似,也就是透過一個主要節點協調多個工作站節點。

Presto 的用途有哪些?

有了 Presto,機構就能順利地對大規模的資料存放區 (如 BigQuery、Hadoop 分散式檔案系統、Cloud Storage、MySQL 適用的 Cloud SQL、Apache Cassandra 或 Apache Kafka) 進行聯合查詢。以下列舉幾項特定用途。

資料倉儲

如果採用 Presto,您就能使用開放的分散式 SQL 查詢引擎,執行資料庫引擎查詢作業,如傳統 OLAP 工作負載。

依個案需求使用商業智慧功能

為了快速探索資料,並簡化報表作業,請建立小型 Presto 查詢引擎,對多個資料來源執行查詢,然後再關閉該引擎。

簡單的資料準備

快速彙整及匯總資料,準備好資料集及衍生變數以進行臨時查詢。

Dataproc 的選用元件 Presto 提供 Google Cloud 的全套支援,包括叢集啟動時間極短,以及與 Dataproc 其他部分的整合測試。

BigQueryCloud Storage 也可納入 Google Cloud 解決方案,搭配 Dataproc 和 Presto 查詢引擎元件來進行資料分析。