Echa un vistazo a la sesión de Spark en Google Cloud de Next 2021.

Ir a

Spark en Google Cloud

Es el primer Spark autoescalado sin servidor del sector, integrado con las mejores herramientas nativas y de código abierto de Google. Desarrolla y ejecuta Spark donde lo necesites en todos los casos prácticos, incluidos el proceso de extracción, transformación y carga (ETL) y la ciencia de datos y la exploración.

Ventajas

Aumenta la productividad de los desarrolladores y obtén información valiosa más rápido

Sencillez operativa gracias a Spark sin servidor

Crea aplicaciones y flujos de procesamiento de Spark que se escalan automáticamente sin tener que aprovisionar ni ajustar manualmente las infraestructuras. 

Spark fluido para todos los usuarios de datos

Spark está integrado con BigQuery, Vertex AI y Dataplex. Puedes escribir y ejecutar desde estas interfaces con dos clics, sin integraciones personalizadas, para el proceso de extracción, transformación y carga (ETL), exploración de datos, análisis y aprendizaje automático. 

Flexibilidad de consumo

One size does not fit all. Puedes elegir entre clústeres sin servidor, de Kubernetes y de computación para tus aplicaciones de Spark.

Funciones principales

Ejecuta tareas de Spark que se escalan automáticamente desde la interfaz que elijas con solo dos clics

Spark sin servidor (disponible próximamente para GA)

Los desarrolladores pueden dedicar todo su tiempo a tareas de código y lógica y, a través de la interfaz que elijan, enviar las tareas de Spark que se aprovisionan y escalan automáticamente.

Spark a través de BigQuery (vista preliminar privada)

Experiencia unificada de SQL y Spark: permite que los usuarios de almacenamiento de datos escriban y ejecuten datos fácilmente en BigQuery sin tener que exportarlos. Sin gestionar infraestructuras. 

Spark a través de Vertex AI (vista preliminar privada)

Spark para la ciencia de datos con un clic: los científicos de datos pueden usar Spark para el desarrollo con Vertex AI Workbench, sin problemas y con seguridad integrada. Spark se integra con las funciones de operaciones de aprendizaje automático de Vertex AI, donde los usuarios pueden ejecutar código de Spark a través de ejecutores de cuaderno integrados con Vertex AI Pipelines.

Spark a través de Dataplex (vista preliminar privada)

Ejecuta el autoescalado de Spark en los datos de Google Cloud desde una única interfaz que permite acceder con un solo clic a SparkSQL, Notebooks o PySpark. Además, ofrece una gobernanza integrada en múltiples lagos de datos y una colaboración sencilla para que puedas guardar, compartir y buscar cuadernos, secuencias de comandos y datos.

Opciones de consumo flexibles

Además de usar el Spark sin servidor para despliegues sin operaciones, los clientes que estandarizan la gestión de la infraestructura en Kubernetes pueden ejecutar Spark en Google Kubernetes Engine (vista preliminar privada) para optimizar el uso de recursos y simplificar la gestión de la infraestructura. Los clientes que busquen una gestión de infraestructuras de tipo Hadoop pueden ejecutar Spark en Compute Engine (GA).


¿Empezamos? Contactar

Novedades

No te pierdas las últimas noticias, blogs y eventos de Spark en Google Cloud

Si quieres solicitar acceso anticipado a las nuevas soluciones de Spark en Google Cloud, regístrate aquí.