La nueva forma de usar Spark más fácilmente, de manera más inteligente y más rápido.
Ejecuta cargas de trabajo de Apache Spark en Google Cloud con menos sobrecarga operativa, más asistencia potenciada por IA y mejor relación precio-rendimiento. Enfócate en tu código, no en tu clúster.
Beneficios
Más fácil: Elimina la carga operativa de Spark
Elige entre Google Cloud Serverless for Apache Spark sin operaciones o clústeres de Dataproc administrados. Ambos automatizan la complejidad de la infraestructura para que puedas acelerar tu ciclo de vida de desarrollo.
Más inteligente: Desarrollo de Spark asistido por IA
Acelera todo tu flujo de trabajo con Gemini en Dataproc y Google Cloud Serverless for Apache Spark. Obtén asistencia potenciada por Gemini para generar y depurar código, y solucionar problemas de trabajos fallidos.
Más rápido: Acelera el rendimiento de Spark
Obtén una relación precio-rendimiento líder en el sector, de forma automática. Para tus trabajos más exigentes, obtén un rendimiento más de 4.3 veces más rápido con Lightning Engine. Esto reduce el TCO y acelera el tiempo de obtención de estadísticas.
Características clave
Elige entre Serverless for Apache Spark para una simplicidad sin operaciones o Dataproc para clústeres administrados con personalizaciones profundas.
Enfócate únicamente en tu código y acelera el desarrollo. Con niveles para el procesamiento por lotes rentable y la IA y el AA de alto rendimiento, es ideal para nuevas canalizaciones de Apache Spark, análisis interactivos y cargas de trabajo con demanda impredecible en las que se prefiere un modelo "No-ops".
Ideal para: Científicos de datos e ingenieros de AA, consultas ad hoc, aplicaciones nuevas y productividad de desarrolladores.
Obtén el máximo control sobre tu entorno de clúster. Es perfecto para migrar cargas de trabajo existentes de Apache Hadoop o Spark, ejecutar clústeres persistentes de larga duración o usar un ecosistema diverso de código abierto.
Ideal para: Ingeniería y operaciones empresariales, migraciones locales, trabajos de larga duración y personalización profunda.
Documentación
Deja de elegir entre la potencia de SQL y la flexibilidad de Spark. BigLake te permite usar ambos motores en los mismos datos administrados. Es una experiencia unificada que te permite usar la mejor herramienta para cada trabajo.
Pasa de la preparación de datos al entrenamiento y la inferencia de modelos más rápido. Nuestros niveles Premium están diseñados para IA y AA, lo que te permite usar entornos de ejecución de AA preconfigurados con compatibilidad integrada con GPU, como NVIDIA RAPIDS, para eliminar la configuración compleja.
Novedades
Spark es una marca comercial de The Apache Software Foundation.
** Las consultas se derivan del estándar TPC-DS y el estándar TPC-H y, como tal, no son comparables con los resultados publicados del estándar TPC-DS y el estándar TPC-H, ya que estas ejecuciones no cumplen con todos los requisitos de la especificación del estándar TPC-DS y el estándar TPC-H.
Dinos en qué estás trabajando. Un experto de Google Cloud te ayudará a encontrar la mejor solución.