Anunciado en mayo de 2025: Dataproc Serverless ahora es Google Cloud Serverless for Apache Spark

Ejecuta tus trabajos de Apache Spark de forma más sencilla en una plataforma personalizable con operaciones autónomas, de forma más inteligente con la asistencia de Gemini y de forma más rápida con el rendimiento de Lightning Engine.
Apache Spark es una marca comercial de The Apache Software Foundation.
Funciones
Potencia tus trabajos con Lightning Engine, nuestro motor vectorizado de nueva generación. Obtén un rendimiento 4.3 veces más rápido y un TCO más bajo para tus cargas de trabajo de Spark sin servidores, de forma automática.
Elimina la administración de clústeres con el ajuste de escala automático inteligente. Los recursos se escalan verticalmente de forma automática para adaptarse perfectamente a las necesidades de tu trabajo, lo que garantiza un rendimiento máximo y rentabilidad sin pagar por tiempo de inactividad.
Acelera todo tu flujo de trabajo. Escribe y depura código de PySpark, Scala y Java con Gemini Code Assist en BigQuery Studio, y lanza entornos acelerados por GPU con entornos de ejecución de AA preconfigurados.
Elimina el cambio de contexto. Desarrolla y ejecuta tus cargas de trabajo en un solo entorno como BigQuery Studio, combinando sin problemas el potente SQL con la flexibilidad de PySpark en el mismo notebook.
Dos niveles de rendimiento
| Dos niveles de rendimiento | Niveles que se adaptan a tus necesidades específicas, desde el procesamiento por lotes estándar hasta los trabajos más exigentes y de rendimiento crítico. |
|---|---|
| Nivel | Ideal para |
Estándar | Ideal para el procesamiento por lotes rentable, las transformaciones de datos y los trabajos de Spark de uso general.
|
Premium | Para las cargas de trabajo más exigentes, ofrece el máximo rendimiento con Lightning Engine, aceleración de IA/AA y capacidades interactivas.
|
Dos niveles de rendimiento
Niveles que se adaptan a tus necesidades específicas, desde el procesamiento por lotes estándar hasta los trabajos más exigentes y de rendimiento crítico.
Estándar
Ideal para el procesamiento por lotes rentable, las transformaciones de datos y los trabajos de Spark de uso general.
Premium
Para las cargas de trabajo más exigentes, ofrece el máximo rendimiento con Lightning Engine, aceleración de IA/AA y capacidades interactivas.
Usos comunes
Ciencia de datos interactiva
Permite a los científicos de datos explorar datos y realizar iteraciones rápidas en modelos de Spark ML. Unifica SQL y Spark en un solo notebook de BigQuery Studio, pasando sin problemas de la exploración de datos con SQL a la creación de modelos con PySpark sin tener que administrar la infraestructura.
Ciencia de datos interactiva
Permite a los científicos de datos explorar datos y realizar iteraciones rápidas en modelos de Spark ML. Unifica SQL y Spark en un solo notebook de BigQuery Studio, pasando sin problemas de la exploración de datos con SQL a la creación de modelos con PySpark sin tener que administrar la infraestructura.
Precios
| Precios transparentes y basados en el valor | Los precios de Serverless for Apache Spark se basan en el uso por segundo de procesamiento (DCU), GPU y almacenamiento aleatorio. | |
|---|---|---|
| Servicios y uso | Tipo de suscripción | Precio (USD) |
Unidad de procesamiento de datos (DCU) | Estándar | A partir de $0.06 por hora |
Premium | A partir de $0.089 por hora | |
Almacenamiento de Shuffle | Estándar | A partir de $0.04 por GB, por mes |
Premium | A partir de $0.1 por GB, por mes | |
Precios del acelerador | a100 40 GB | A partir de $3.52069 por hora |
a100 80 GB | A partir de $4.713696 por hora | |
L4 | A partir de $0.672048 por hora | |
Consulta los detalles de los precios de Google Cloud sion servidores para Apache Spark.
Precios transparentes y basados en el valor
Los precios de Serverless for Apache Spark se basan en el uso por segundo de procesamiento (DCU), GPU y almacenamiento aleatorio.
Unidad de procesamiento de datos (DCU)
Estándar
Starting at
$0.06
por hora
Premium
Starting at
$0.089
por hora
Almacenamiento de Shuffle
Estándar
Starting at
$0.04
por GB, por mes
Premium
Starting at
$0.1
por GB, por mes
Precios del acelerador
a100 40 GB
Starting at
$3.52069
por hora
a100 80 GB
Starting at
$4.713696
por hora
L4
Starting at
$0.672048
por hora
Consulta los detalles de los precios de Google Cloud sion servidores para Apache Spark.
Caso empresarial
Crea tu caso de negocio para Google Cloud sin servidores para Apache Spark
Los beneficios económicos de Google Cloud Dataproc y Serverless Spark en comparación con soluciones alternativas
Descubre cómo Serverless for Apache Spark ofrece ahorros significativos en el TCO y valor empresarial en comparación con las soluciones locales y otras soluciones en la nube.
En el informe se muestra lo siguiente:
Descubre cómo Dataproc y Serverless for Apache Spark pueden ofrecer un ahorro de costos de entre el 18% y el 60% en comparación con otras alternativas de Spark basadas en la nube.
Explora cómo Google Cloud Serverless para Apache Spark puede proporcionar un rendimiento-precio entre un 21% y un 55% mejor que otras ofertas de Spark sin servidores.
Descubre cómo Dataproc y Google Cloud sin servidores para Apache Spark simplifican las implementaciones de Spark y ayudan a reducir la complejidad operativa.
Preguntas frecuentes
Elige Serverless for Apache Spark cuando quieras enfocarte en tu código y eliminar toda la administración de la infraestructura. Es ideal para nuevas canalizaciones de Spark, análisis interactivos y trabajos con demanda impredecible en los que la velocidad y la simplicidad son la prioridad.
El nivel Premium está diseñado para IA/AA y viene con entornos de ejecución de AA preconfigurados que tienen bibliotecas comunes como PyTorch, XGBoost y scikit-learn integradas. Esto elimina la configuración compleja y te permite comenzar con tus cargas de trabajo de ciencia de datos en minutos.
Aprende sobre las cargas de trabajo y los tiempos de ejecución de GPU.
Para obtener el máximo rendimiento, puedes seleccionar el nivel Premium, que funciona con Lightning Engine. Los precios se basan en un modelo de “pago por uso”, en el que se te factura por segundo solo durante la duración de la ejecución de tu trabajo. Esto es muy rentable, ya que elimina el costo de los clústeres inactivos.