Presentamos Lightning Engine, la nueva generación del rendimiento de Apache Spark. Echa un vistazo a la entrada del blog.

Lightning Engine

Acelera el rendimiento de Apache Spark

Nuestro motor vectorizado es una forma más sencilla de optimizar Spark con un motor más inteligente que ofrece un rendimiento de Spark más de 4,3 veces más rápido*, lo que reduce los costes de computación.

*Las consultas se derivan del estándar TPC-DS y del estándar TPC-H y, como tal, no se pueden comparar con los resultados publicados del estándar TPC-DS y del estándar TPC-H, ya que estas ejecuciones no cumplen todos los requisitos de la especificación del estándar TPC-DS y del estándar TPC-H.

Apache Spark es una marca de The Apache Software Foundation.

Características

Reduce los tiempos de ejecución de las tareas y los costes

Disfruta de una forma más rápida de ejecutar Spark. Acelera tus cargas de trabajo de ETL, ciencia de datos y SQL a gran escala más de 4,3 veces más rápido que Apache Spark de código abierto. Esta drástica reducción del tiempo de ejecución de las tareas disminuye el coste total de propiedad de tus cargas de trabajo de Spark al reducir el tiempo de computación.

Acelera el rendimiento de Spark

Descubre una forma más sencilla de mejorar el rendimiento. Reduce el tiempo que los ingenieros dedican a optimizar Spark.

Acceso a datos y almacenamiento en caché inteligentes

Aprovecha una arquitectura más inteligente. Lightning Engine almacena automáticamente en caché los datos activos en la memoria y utiliza conectores optimizados de alto rendimiento para Cloud Storage y BigQuery, lo que mejora significativamente la latencia de E/S y el rendimiento del procesamiento de datos de Spark a gran escala.

La tecnología principal: ejecución vectorizada

Lightning Engine aprovecha un motor de ejecución vectorizado nativo de C++ para procesar datos en lotes, lo que mejora drásticamente la eficiencia de la CPU en comparación con el procesamiento tradicional fila por fila. Este es un componente fundamental de su innovador rendimiento de Spark.

Disponibilidad

Disponibilidad	Lightning Engine está pensado para tus cargas de trabajo de Spark más exigentes. Puedes acceder a él con los niveles premium de Dataproc y Serverless Apache Spark.
Producto	Disponibilidad	Acceso
Google Cloud Serverless para Apache Spark - Nivel Premium	Disponible de forma general	Empieza aquí
Dataproc en Google Compute Engine	En versión preliminar	Disponible próximamente

Guía de decisión para Dataproc y Google Cloud Serverless para Apache Spark

Disponibilidad

Lightning Engine está pensado para tus cargas de trabajo de Spark más exigentes. Puedes acceder a él con los niveles premium de Dataproc y Serverless Apache Spark.

Google Cloud Serverless para Apache Spark - Nivel Premium

Disponibilidad

Disponible de forma general

Acceso

Empieza aquí

Dataproc en Google Compute Engine

Disponibilidad

En versión preliminar

Acceso

Disponible próximamente

Guía de decisión para Dataproc y Google Cloud Serverless para Apache Spark

Cómo funciona

Lightning Engine acelera el procesamiento de datos de Spark con un motor vectorizado nativo de C++, almacenamiento en caché inteligente y E/S optimizada. Procesa los datos por lotes para maximizar la eficiencia de la CPU, reducir los tiempos de ejecución de las tareas y los costes de computación. Este conjunto de optimizaciones ofrece un rendimiento de Spark revolucionario.

Usos habituales

Ideal para tus trabajos más exigentes

ETL a gran escala

Reduce drásticamente el tiempo de ejecución de tus flujos de procesamiento y transformación de datos de Spark más complejos. Esto significa que puedes cumplir acuerdos de nivel de servicio más frecuentes en cuanto a la actualización de datos, reducir las ventanas de procesamiento por lotes repentinas y disminuir significativamente el coste total de propiedad de tus flujos de datos que más recursos consumen.

Diapositiva que indica que el rendimiento mejoró 4,3 veces en comparación con Apache Spark de código abierto

Recursos de formación

ETL a gran escala

Reduce drásticamente el tiempo de ejecución de tus flujos de procesamiento y transformación de datos de Spark más complejos. Esto significa que puedes cumplir acuerdos de nivel de servicio más frecuentes en cuanto a la actualización de datos, reducir las ventanas de procesamiento por lotes repentinas y disminuir significativamente el coste total de propiedad de tus flujos de datos que más recursos consumen.

Preparación de datos para IA y aprendizaje automático

Acelera los pasos de ingeniería de funciones y preparación de datos que son fundamentales para tu ciclo de vida de aprendizaje automático. Al acelerar la parte más lenta del flujo de trabajo de aprendizaje automático, tus científicos de datos pueden ejecutar más experimentos, iterar en los modelos más rápido y poner en producción aplicaciones de IA valiosas antes.

Optimización del flujo de trabajo de aprendizaje automático

Recursos de formación

Preparación de datos para IA y aprendizaje automático

Acelera los pasos de ingeniería de funciones y preparación de datos que son fundamentales para tu ciclo de vida de aprendizaje automático. Al acelerar la parte más lenta del flujo de trabajo de aprendizaje automático, tus científicos de datos pueden ejecutar más experimentos, iterar en los modelos más rápido y poner en producción aplicaciones de IA valiosas antes.

Analíticas interactivas

Ejecuta consultas de SQL rápidas e interactivas directamente en tu data lake para hacer análisis ad hoc y de inteligencia empresarial. Permite que tus analistas de datos mantengan el hilo de sus pensamientos con tiempos de respuesta de las consultas más rápidos, lo que lleva a una exploración de datos más rápida y a estadísticas más eficaces.

Lakehouse abierto de Google Cloud basado en IA de nueva generación

Recursos de formación

Analíticas interactivas

Ejecuta consultas de SQL rápidas e interactivas directamente en tu data lake para hacer análisis ad hoc y de inteligencia empresarial. Permite que tus analistas de datos mantengan el hilo de sus pensamientos con tiempos de respuesta de las consultas más rápidos, lo que lleva a una exploración de datos más rápida y a estadísticas más eficaces.

Precios

Spark acelerado, a tu manera	Lightning Engine es una función de los niveles premium de Dataproc y Google Cloud Serverless para Apache Spark.
Producto	Precios
Google Cloud Serverless for Apache Spark	Precios detallados
Dataproc	En vista previa, disponible próximamente.

Spark acelerado, a tu manera

Lightning Engine es una función de los niveles premium de Dataproc y Google Cloud Serverless para Apache Spark.

Google Cloud Serverless for Apache Spark

Precios

Precios detallados

Dataproc

Precios

En vista previa, disponible próximamente.

Calculadora de precios

Calcula tus costes mensuales, incluyendo los precios y las tarifas específicos de cada región.

Presupuesto personalizado

Ponte en contacto con nuestro equipo de ventas para solicitar un presupuesto personalizado para tu organización.

Lightning Engine

Acelera el rendimiento de Apache Spark

Aspectos destacados del producto

Reduce los tiempos de ejecución de las tareas y los costes

Acelera el rendimiento de Spark

Acceso a datos y almacenamiento en caché inteligentes

La tecnología principal: ejecución vectorizada

Ideal para tus trabajos más exigentes

ETL a gran escala

Recursos de formación

ETL a gran escala

Preparación de datos para IA y aprendizaje automático

Recursos de formación

Preparación de datos para IA y aprendizaje automático

Analíticas interactivas

Recursos de formación

Analíticas interactivas

Calculadora de precios

Presupuesto personalizado

Acelera tu Spark

Impulsa tus tareas de Spark

¿Tienes un proyecto de gran envergadura?

Empieza a usar Serverless para Apache Spark

Cuándo usar Lightning Engine para Apache Spark

Comparar Dataproc y Serverless para Apache Spark