La nueva forma de usar Spark de forma más fácil, inteligente y rápida.
Ejecuta cargas de trabajo de Apache Spark en Google Cloud con menos sobrecarga operativa, más asistencia basada en IA y una mejor relación calidad‑precio. Céntrate en tu código, no en los clústeres.
Ventajas
Más fácil: elimina la carga operativa de Spark
Elige entre Google Cloud Serverless para Apache Spark, que no requiere operaciones, o los clústeres gestionados de Dataproc. Ambos automatizan la complejidad de la infraestructura para que puedas acelerar el ciclo de vida de desarrollo.
Más inteligente: desarrollo de Spark asistido por IA
Agiliza todo tu flujo de trabajo con Gemini en Dataproc y Google Cloud Serverless para Apache Spark. Recibe asistencia basada en Gemini para generar y depurar código, así como para solucionar problemas con tareas fallidas.
Más rápido: acelera el rendimiento de Spark
Consigue automáticamente una relación precio-rendimiento líder en el sector. Para tus trabajos más exigentes, consigue un rendimiento 4,3 veces más rápido con Lightning Engine. Esto reduce el TCO y agiliza la obtención de información valiosa.
Características principales
Elige entre Serverless para Apache Spark, que ofrece sencillez sin operaciones, o Dataproc, que permite gestionar clústeres con personalizaciones avanzadas.
Céntrate únicamente en tu código y acelera el desarrollo. Con niveles para el procesamiento por lotes rentable y la IA o el aprendizaje automático de alto rendimiento, es ideal para nuevos flujos de procesamiento de Apache Spark, análisis interactivos y cargas de trabajo con una demanda impredecible en las que se prefiere un modelo NoOps.
Ideal para: científicos de datos e ingenieros de aprendizaje automático, consultas ad hoc, nuevas aplicaciones y productividad de los desarrolladores.
Consigue el máximo control sobre tu entorno de clústeres. Es perfecto para migrar cargas de trabajo de Apache Hadoop o Spark, ejecutar clústeres persistentes de larga duración o usar un ecosistema de código abierto diverso.
Ideal para: ingeniería y operaciones empresariales, migraciones on-premise, tareas de larga duración y personalización exhaustiva.
Clientes
Documentación
Deja de tener que elegir entre la potencia de SQL y la flexibilidad de Spark. BigLake te permite usar ambos motores en los mismos datos gobernados. Es una experiencia unificada que te permite usar la mejor herramienta para cada tarea.
Pasa de la preparación de datos al entrenamiento de modelos y la inferencia más rápido. Nuestros niveles Premium están diseñados para la IA y el aprendizaje automático, lo que te permite usar entornos de ejecución de aprendizaje automático preconfigurados con compatibilidad con GPU integrada, como NVIDIA RAPIDS, para eliminar la complejidad de la configuración.
Novedades
Apache Spark es una marca de The Apache Software Foundation.
** Las consultas se derivan del estándar TPC-DS y del estándar TPC-H, por lo que no se pueden comparar con los resultados publicados del estándar TPC-DS y del estándar TPC-H, ya que estas ejecuciones no cumplen todos los requisitos de la especificación del estándar TPC-DS y del estándar TPC-H.
Cuéntanos lo que buscas. Un experto de Google Cloud te ayudará a encontrar la mejor solución.