Presto は Facebook 開発者が作成したオープンソースの分散 SQL クエリエンジンで、大量のデータに対してインタラクティブな分析を実行します。Presto を使用することで、組織は既存の SQL スキルを使用して、新しい複雑な言語を学習することなくビッグデータに対してクエリを実行できます。
Dataproc の Presto でデータ分析を高速化する方法を学びます。
準備ができたら新規のお客様には、Google Cloud で使用できる無料クレジット $300 分を差し上げます。
オープンソースの Presto(SQL クエリエンジン)は、業界標準の SQL クエリ言語を使用して、オンプレミス システムとクラウドにまたがる複数のソースからビッグデータのアドホック分析を迅速かつ容易に処理して実行する方法を提供します。
Presto アーキテクチャは、分散コンピューティングを使用した従来のオンライン分析処理(OLAP)システムと非常によく似ており、1 つのマスターノードで複数のワーカーノードを調整します。
Presto を使用することで、組織は BigQuery、Hadoop 分散ファイル システム、Cloud Storage、Cloud SQL for MySQL、Apache Cassandra、Apache Kafka などの大規模なデータ リポジトリ間の連携クエリをシームレスに実行できます。一部の具体的なユースケースを以下に示します。
データ ウェアハウジング
Presto では、オープン型の分散 SQL クエリエンジンを使用して、従来の OLAP ワークロードなどのデータベース エンジン クエリを実行できます。
アドホック ビジネス インテリジェンス
データ探索を迅速化し、シンプルなレポートを作成するには、小規模な Presto クエリエンジンを作成して、複数のデータソースにクエリを実行し、電源を切ります。
軽量データの準備
データをすばやく結合して集計し、アドホック クエリ用のデータセットと派生変数を準備します。