Accéder à

Qu'est-ce que Presto ?

Presto est un moteur de requêtes SQL Open Source distribué et créé par des développeurs Facebook qui exécute des analyses interactives sur de grands volumes de données. Avec Presto, les entreprises peuvent simplement utiliser leurs compétences SQL existantes pour 'interroger des données de type Big Data sans avoir à apprendre de nouveaux langages complexes.

Découvrez comment Presto sur Dataproc permet d'accélérer l'analyse de données.

Définition de Presto

Presto (moteur de requête SQL) Open Source utilise un langage de requête SQL standard dans l'industrie pour fournir un moyen rapide et simple de traiter et d'effectuer des analyses ad hoc de big data provenant de plusieurs sources, à travers plusieurs systèmes sur site et dans le cloud.

L'architecture Presto est très semblable aux systèmes de traitement analytique en ligne (OLAP) classiques qui utilisent un calcul distribué, où un nœud maître coordonne plusieurs nœuds de calcul.

À quoi sert Presto ?

Avec Presto, les entreprises peuvent exécuter de manière fluide des requêtes fédérées dans des dépôts de données à grande échelle tels que BigQuery, Hadoop Distributed File System, Cloud Storage, Cloud SQL pour MySQL, Apache Cassandra ou Apache Kafka. Voici quelques cas d'utilisation spécifiques.

Entreposage de données

Avec Presto, vous pouvez exécuter votre requête de moteur de base de données, telle que les charges de travail OLAP traditionnelles, à l'aide d'un moteur de requêtes SQL ouvert et distribué.

Informatique décisionnelle ad hoc

Pour accélérer l'exploration de données et simplifier la création de rapports, créez un moteur de requêtes Presto mineur afin d'exécuter des requêtes sur plusieurs sources de données, puis désactivez-les.

Préparation de données légères

Fusionnez et regroupez rapidement des données afin de préparer votre ensemble de données et vos variables dérivées pour des requêtes ad hoc.

Le composant facultatif de Presto pour Dataproc offre la suite complète d'assistance de Google Cloud, y compris un temps de démarrage rapide des clusters et des tests d'intégration avec le reste de Dataproc.

BigQuery et Cloud Storage peuvent faire partie d'une solution Google Cloud utilisant Dataproc et le composant de moteur de requête Presto pour l'analyse de données.