Vai a

Che cos'è Presto?

Presto è un motore di query SQL distribuito in open source creato dagli sviluppatori di Facebook per eseguire analisi interattive su grandi volumi di dati. Grazie a Presto, le organizzazioni possono usare le loro competenze relative a SQL per eseguire query sui big data senza dover apprendere nuovi linguaggi complessi.

Scopri in che modo Presto su Dataproc può accelerare l'analisi dei dati.

Definizione di Presto

Presto open source (motore di query SQL) utilizza il linguaggio di query SQL standard di settore per fornire un modo rapido e semplice di elaborare ed eseguire analisi ad hoc di big data da più origini e nei sistemi on-premise e nel cloud.

L'architettura di Presto è molto simile a quella dei sistemi classici di elaborazione dell'analisi online (OLAP) che utilizzano il computing distribuito, in cui un nodo master coordina più nodi worker.

A che cosa serve Presto?

Con Presto le organizzazioni possono eseguire senza problemi le query federate su repository di dati su larga scala come BigQuery, Hadoop Distributed File System, Cloud Storage, Cloud SQL per MySQL, Apache Cassandra o Apache Kafka. Ecco alcuni casi d'uso specifici.

Data warehousing

Con Presto, puoi eseguire la query del motore di database, ad esempio dei carichi di lavoro OLAP tradizionali, utilizzando un motore di query SQL aperto e distribuito.

Business intelligence ad hoc

Per velocizzare l'esplorazione dei dati e semplificare il reporting, crea un piccolo motore di query Presto per eseguire le query verso più origini dati e quindi interrompile.

Preparazione leggera dei dati

Unisci e aggrega rapidamente i dati per preparare il set di dati e le variabili derivate per le query ad hoc.

Il componente facoltativo Presto per Dataproc offre la suite completa di assistenza di Google Cloud, compresi i tempi di avvio rapido del cluster e i test di integrazione con il resto di Dataproc.

BigQuery e Cloud Storage possono essere parte di una soluzione Google Cloud che utilizza Dataproc e il componente del motore di query Presto per l'analisi dei dati.