• Temas
  • ¿Qué es Presto?

¿Qué es Presto?

Presto es un motor de consultas de SQL distribuido con código abierto creado por los desarrolladores de Facebook para ejecutar estadísticas interactivas con grandes volúmenes de datos. Con Presto, las organizaciones pueden usar sus habilidades de SQL existentes para buscar en macrodatos sin tener que aprender nuevos lenguajes complejos.

Descubre cómo Presto en Dataproc puede acelerar el análisis de datos.

Definición de Presto

Presto de código abierto (motor de consultas de SQL) usa el lenguaje de consulta de SQL estándar de la industria para proporcionar una forma rápida y fácil de procesar y realizar análisis ad hoc de macrodatos, en sistemas locales y en la nube.

La arquitectura de Presto es muy similar a los sistemas clásicos de procesamiento analítico en línea (OLAP) que usan el procesamiento distribuido, en el que un nodo principal coordina varios nodos trabajadores.

¿Para qué se usa Presto?

Con Presto, las organizaciones pueden ejecutar sin interrupciones búsquedas federadas en repositorios de datos a gran escala, como BigQuery, sistemas de archivos distribuidos Hadoop, Cloud Storage, Cloud SQL para MySQL, Apache Cassandra o Apache Kafka Estos son algunos casos de uso específicos.

Almacenamiento de datos

Con Presto, puedes ejecutar tu búsqueda en el motor de base de datos, como las cargas de trabajo OLAP tradicionales, con un motor de búsqueda de SQL abierto y distribuido.

Inteligencia empresarial ad hoc

Si deseas explorar con rapidez y crear informes simples, crea un motor de búsqueda Presto para ejecutar búsquedas en varias fuentes de datos y, luego, apagar el motor.

Preparación de datos básicos

Une y agrega datos rápidamente a fin de preparar tu conjunto de datos y tus variables derivadas para búsquedas ad hoc.

El componente opcional de Presto para Dataproc ofrece el kit completo de asistencia de Google Cloud, que incluye tiempos de inicio rápidos para los clústeres y pruebas de integración con el resto de Dataproc.

BigQuery y Cloud Storage pueden ser parte de una solución de Google Cloud mediante Dataproc y el componente del motor de búsqueda Presto para el análisis de datos.