• Temas
  • ¿Qué es Presto?

¿Qué es Presto?

Presto es un motor de consulta de SQL distribuido de código abierto creado por los desarrolladores de Facebook para ejecutar análisis interactivos de grandes volúmenes de datos. Con Presto, las organizaciones pueden aplicar sus conocimientos en SQL para consultar Big Data sin tener que aprender nuevos lenguajes complejos.

Descubre cómo Presto en Dataproc puede agilizar el análisis de datos.

Definición de Presto

Presto, un motor de consulta de SQL de código abierto, usa un lenguaje de consultas SQL estándar del sector para ofrecer un modo rápido y sencillo de procesar y realizar análisis ad hoc de Big Data de varias fuentes en distintos sistemas on‑premise y en la nube.

La arquitectura de Presto es muy parecida a la de los sistemas de procesamiento analítico online (OLAP) que utilizan la informática distribuida, de forma que un nodo maestro coordina varios nodos de trabajador.

¿Para qué se usa Presto?

Con Presto, las organizaciones pueden ejecutar consultas federadas en repositorios de datos a gran escala, como BigQuery, el sistema de archivos distribuidos de Hadoop, Cloud Storage, Cloud SQL para MySQL, Apache Cassandra o Apache Kafka. A continuación, se muestran algunos ejemplos de casos prácticos.

Almacenamiento de datos

Con Presto, puedes ejecutar la consulta de motor de base de datos, como cargas de trabajo OLAP tradicionales, a través de un motor de consultas SQL distribuido de código abierto.

Inteligencia empresarial ad hoc

Para agilizar la exploración de datos y generar informes sencillos, crea un pequeño motor de consulta Presto, ejecuta consultas en varias fuentes de datos y, a continuación, apaga el dispositivo.

Preparación de datos sencilla

Agrupa y agrega datos rápidamente para preparar un conjunto de datos y las variables derivadas para las consultas ad hoc.

El componente opcional de Presto para Dataproc proporciona una solución completa de asistencia de Google Cloud que incluye las horas de inicio rápido de los clústeres y las pruebas de integración con el resto de Dataproc.

BigQuery y Cloud Storage pueden formar parte de una solución de Google Cloud mediante Dataproc y el componente del motor de consulta de Presto para analizar datos.