Apache Spark en Google Cloud

La nueva forma de usar Spark más fácilmente, de manera más inteligente y más rápido.

Ejecuta cargas de trabajo de Apache Spark en Google Cloud con menos sobrecarga operativa, más asistencia potenciada por IA y mejor relación precio-rendimiento. Enfócate en tu código, no en tu clúster.


Beneficios

Una mejor experiencia de Apache Spark en Google Cloud

Más fácil: Elimina la carga operativa de Spark

Elige entre Google Cloud Serverless for Apache Spark sin operaciones o clústeres de Dataproc administrados. Ambos automatizan la complejidad de la infraestructura para que puedas acelerar tu ciclo de vida de desarrollo.

Compara ambas opciones

Más inteligente: Desarrollo de Spark asistido por IA

Acelera todo tu flujo de trabajo con Gemini en Dataproc y Google Cloud Serverless for Apache Spark. Obtén asistencia potenciada por Gemini para generar y depurar código, y solucionar problemas de trabajos fallidos. 

Más información sobre Gemini Code Assist

Más rápido: Acelera el rendimiento de Spark

Obtén una relación precio-rendimiento líder en el sector, de forma automática. Para tus trabajos más exigentes, obtén un rendimiento más de 4.3 veces más rápido con Lightning Engine. Esto reduce el TCO y acelera el tiempo de obtención de estadísticas.

Explorar Lightning Engine

Características clave

Elige la versión de Spark adecuada para tu carga de trabajo

Elige entre Serverless for Apache Spark para una simplicidad sin operaciones o Dataproc para clústeres administrados con personalizaciones profundas.

Consultar la guía de decisiones

Google Cloud sin servidores para Apache Spark

Enfócate únicamente en tu código y acelera el desarrollo. Con niveles para el procesamiento por lotes rentable y la IA y el AA de alto rendimiento, es ideal para nuevas canalizaciones de Apache Spark, análisis interactivos y cargas de trabajo con demanda impredecible en las que se prefiere un modelo "No-ops".

Ideal para: Científicos de datos e ingenieros de AA, consultas ad hoc, aplicaciones nuevas y productividad de desarrolladores.

Explora Spark sin servidores

Dataproc

Obtén el máximo control sobre tu entorno de clúster. Es perfecto para migrar cargas de trabajo existentes de Apache Hadoop o Spark, ejecutar clústeres persistentes de larga duración o usar un ecosistema diverso de código abierto.

Ideal para: Ingeniería y operaciones empresariales, migraciones locales, trabajos de larga duración y personalización profunda.

Explorar Dataproc

Documentación

Documentación

Tutorial

Ejecuta tu primer trabajo de Spark sin servidores

Sigue esta guía de inicio rápido para experimentar la velocidad y la simplicidad de Spark sin servidores. Aprende a enviar un trabajo por lotes de PySpark con Google Cloud CLI.

Tutorial

Crea un clúster de Dataproc administrado

En este instructivo, se explica cómo crear un clúster de Dataproc con la consola de Google Cloud. Aprende a configurar y aprovisionar un entorno administrado para tus cargas de trabajo de Spark y Hadoop.

Best Practice

Unifica tus análisis: SQL y Spark en una sola copia de datos

Deja de elegir entre la potencia de SQL y la flexibilidad de Spark. BigLake te permite usar ambos motores en los mismos datos administrados. Es una experiencia unificada que te permite usar la mejor herramienta para cada trabajo.

Best Practice

Acelera todo tu ciclo de vida de IA y AA

Pasa de la preparación de datos al entrenamiento y la inferencia de modelos más rápido. Nuestros niveles Premium están diseñados para IA y AA, lo que te permite usar entornos de ejecución de AA preconfigurados con compatibilidad integrada con GPU, como NVIDIA RAPIDS, para eliminar la configuración compleja.

¿No encuentras lo que buscas?


Spark es una marca comercial de The Apache Software Foundation.

** Las consultas se derivan del estándar TPC-DS y el estándar TPC-H y, como tal, no son comparables con los resultados publicados del estándar TPC-DS y el estándar TPC-H, ya que estas ejecuciones no cumplen con todos los requisitos de la especificación del estándar TPC-DS y el estándar TPC-H.

Da el siguiente paso

Dinos en qué estás trabajando. Un experto de Google Cloud te ayudará a encontrar la mejor solución.

Google Cloud