Anunciado en mayo del 2025: Dataproc Serverless ahora es Google Cloud Serverless para Apache Spark

Logotipo de Serverless para Apache Spark

Google Cloud Serverless para Apache Spark

Céntrate en tu código, no en la infraestructura

Ejecuta tus trabajos de Apache Spark de forma más sencilla en una plataforma personalizable sin operaciones, de forma más inteligente con la ayuda de Gemini y de forma más rápida con el rendimiento de Lightning Engine.

Apache Spark es una marca de The Apache Software Foundation.


Características

Rendimiento líder en el sector

Impulsa tus trabajos con Lightning Engine, nuestro motor vectorizado de nueva generación. Consigue un rendimiento más de 4,3 veces más rápido y un TCO más bajo para tus cargas de trabajo de Spark sin servidor, de forma automática.

Operaciones cero con autoescalado inteligente

Elimina la gestión de clústeres con el autoescalado inteligente. Los recursos se escalan automáticamente hacia arriba y hacia abajo para adaptarse perfectamente a las necesidades de tu trabajo, lo que garantiza el máximo rendimiento y rentabilidad sin pagar por el tiempo de inactividad.

Desarrollo basado en IA

Agiliza todo tu flujo de trabajo. Escribe y depura código de PySpark, Scala y Java con Gemini Code Assist en BigQuery Studio, y lanza entornos acelerados por GPU con ML Runtimes preconfigurado.

Experiencia unificada de Spark y SQL

Elimina los cambios de contexto. Desarrolla y ejecuta tus cargas de trabajo en un solo entorno, como BigQuery Studio, combinando a la perfección la potencia de SQL con la flexibilidad de PySpark en el mismo cuaderno.


Dos niveles de rendimiento

Dos niveles de rendimientoDiferentes niveles para adaptarse a tus necesidades específicas, desde el procesamiento por lotes estándar hasta los trabajos más exigentes y críticos para el rendimiento.
NivelUsos recomendados

Estándar

Ideal para el procesamiento por lotes rentable, las transformaciones de datos y los trabajos de Spark de uso general.

  • ETL de Spark de uso general
  • Flujos de procesamiento de datos programados
  • Tareas por lotes sensibles a los costes

Premium

Para las cargas de trabajo más exigentes, ofrece el máximo rendimiento con Lightning Engine, aceleración de IA y aprendizaje automático, y funciones interactivas.

  • Trabajos críticos para el rendimiento con Lightning Engine para una mejora de 4,3 veces
  • Ciencia de datos y análisis interactivos
  • IA y aprendizaje automático acelerados por GPU
  • Procesamiento de datos complejo y a gran escala

Dos niveles de rendimiento

Diferentes niveles para adaptarse a tus necesidades específicas, desde el procesamiento por lotes estándar hasta los trabajos más exigentes y críticos para el rendimiento.

Estándar

Usos recomendados

Ideal para el procesamiento por lotes rentable, las transformaciones de datos y los trabajos de Spark de uso general.

  • ETL de Spark de uso general
  • Flujos de procesamiento de datos programados
  • Tareas por lotes sensibles a los costes

Premium

Usos recomendados

Para las cargas de trabajo más exigentes, ofrece el máximo rendimiento con Lightning Engine, aceleración de IA y aprendizaje automático, y funciones interactivas.

  • Trabajos críticos para el rendimiento con Lightning Engine para una mejora de 4,3 veces
  • Ciencia de datos y análisis interactivos
  • IA y aprendizaje automático acelerados por GPU
  • Procesamiento de datos complejo y a gran escala

Cómo funciona

Desarrolla tu aplicación de Apache Spark en tus herramientas favoritas, incluidos los cuadernos de BigQuery Studio. Envía tu trabajo de Spark sin servidor con un solo comando y deja que Google se encargue del resto: no tendrás que crear, configurar ni gestionar clústeres.


Usos habituales

Ciencia de datos interactiva

Permite a los científicos de datos explorar datos e iterar rápidamente en modelos de aprendizaje automático de Spark. Unifica SQL y Spark en un solo cuaderno de BigQuery Studio, pasando sin problemas de la exploración de datos con SQL a la creación de modelos con PySpark sin tener que gestionar la infraestructura.

Cuaderno de BQ Studio

Ciencia de datos interactiva

Permite a los científicos de datos explorar datos e iterar rápidamente en modelos de aprendizaje automático de Spark. Unifica SQL y Spark en un solo cuaderno de BigQuery Studio, pasando sin problemas de la exploración de datos con SQL a la creación de modelos con PySpark sin tener que gestionar la infraestructura.

Cuaderno de BQ Studio

Flujos de ETL automatizados

 Crea flujos de procesamiento de ETL de Spark robustos y basados en eventos que se escalen automáticamente bajo demanda. Paga solo por lo que usas, por lo que es perfecto para cargas de trabajo irregulares o impredecibles.

De los datos a la producción de Spark, más rápido.

    Flujos de ETL automatizados

     Crea flujos de procesamiento de ETL de Spark robustos y basados en eventos que se escalen automáticamente bajo demanda. Paga solo por lo que usas, por lo que es perfecto para cargas de trabajo irregulares o impredecibles.

    De los datos a la producción de Spark, más rápido.

      IA y aprendizaje automático a escala

      Acelera el entrenamiento de modelos a gran escala y la inferencia por lotes con Spark sin servidor. Asigna GPUs NVIDIA con bibliotecas preconfiguradas con un solo comando.

      Diapositiva

        IA y aprendizaje automático a escala

        Acelera el entrenamiento de modelos a gran escala y la inferencia por lotes con Spark sin servidor. Asigna GPUs NVIDIA con bibliotecas preconfiguradas con un solo comando.

        Diapositiva

          Precios

          Precios transparentes y basados en el valorLos precios de Serverless para Apache Spark se basan en el uso por segundo de recursos de computación (DCUs), GPUs y almacenamiento de Shuffle.
          Servicios y usoTipo de suscripción Precio (USD)

          Unidad de computación de datos (DCU)

          Estándar

          Desde

          0,06 USD

          por hora

          Premium

          Desde

          0,089 USD

          por hora

          Almacenamiento Shuffle

          Estándar

          Desde

          0,04 USD

          por GB al mes

          Premium

          Desde

          0,1 USD

          por GB al mes

          Precios de Accelerator

          a100 40 GB

          Desde

          3,52069 USD

          por hora

          a100 80 GB

          Desde

          4,713696 USD

          por hora

          L4

          Desde

          0,672048 USD

          por hora

          Consulta los detalles de los precios de Google Cloud Serverless para Apache Spark.

          Precios transparentes y basados en el valor

          Los precios de Serverless para Apache Spark se basan en el uso por segundo de recursos de computación (DCUs), GPUs y almacenamiento de Shuffle.

          Unidad de computación de datos (DCU)

          Tipo de suscripción

          Estándar

          Precio (USD)

          Starting at

          0,06 USD

          por hora

          Premium

          Tipo de suscripción

          Starting at

          0,089 USD

          por hora

          Almacenamiento Shuffle

          Tipo de suscripción

          Estándar

          Precio (USD)

          Starting at

          0,04 USD

          por GB al mes

          Premium

          Tipo de suscripción

          Starting at

          0,1 USD

          por GB al mes

          Precios de Accelerator

          Tipo de suscripción

          a100 40 GB

          Precio (USD)

          Starting at

          3,52069 USD

          por hora

          a100 80 GB

          Tipo de suscripción

          Starting at

          4,713696 USD

          por hora

          L4

          Tipo de suscripción

          Starting at

          0,672048 USD

          por hora

          Consulta los detalles de los precios de Google Cloud Serverless para Apache Spark.

          Calculadora de precios

          Calcula tus costes mensuales por región.

          Presupuesto personalizado

          Ponte en contacto con nuestro equipo de ventas para solicitar un presupuesto personalizado para tu organización.

          Empieza hoy mismo

          Tutorial para dar los primeros pasos

          ¿Tienes un proyecto de gran envergadura?

          Documentación del producto

          Utilizar el conector de BigQuery con Serverless para Apache Spark

          Usar GPUs con Serverless para Apache Spark

          Caso de negocio

           Elabora tu caso de éxito para Google Cloud Serverless para Apache Spark


          Las ventajas económicas de Google Cloud Dataproc y Serverless Spark frente a otras soluciones

          Descubre cómo Serverless para Apache Spark ofrece un ahorro significativo en el TCO y valor empresarial en comparación con las soluciones on-premise y otras soluciones en la nube.

          En el informe:

          Descubre cómo Dataproc y Serverless para Apache Spark pueden ofrecer un ahorro de costes de entre el 18% y el 60% en comparación con otras alternativas de Spark basadas en la nube.

          Descubre cómo Google Cloud Serverless para Apache Spark puede ofrecer una relación calidad‑precio entre un 21% y un 55% mejor que otras ofertas de Spark sin servidor.

          Descubre cómo Dataproc y Google Cloud Serverless para Apache Spark simplifican las implementaciones de Spark y ayudan a reducir la complejidad operativa.

          Preguntas frecuentes

          ¿Cuándo debo elegir Serverless para Apache Spark en lugar de Dataproc?

          Elige Serverless para Apache Spark si quieres centrarte en el código y olvidarte de la gestión de la infraestructura. Es ideal para nuevos flujos de procesamiento de Spark, análisis interactivos y tareas con una demanda impredecible en las que la velocidad y la sencillez son prioritarias.

          Consulta nuestra guía de decisiones.

          El nivel Premium está diseñado para la IA y el aprendizaje automático, y viene con entornos de ejecución de aprendizaje automático preconfigurados que tienen bibliotecas comunes integradas, como PyTorch, XGBoost y scikit-learn. De esta forma, se elimina la complejidad de la configuración y puedes empezar a trabajar con tus cargas de trabajo de ciencia de datos en cuestión de minutos.

          Consulta información sobre las cargas de trabajo y los runtimes de GPU.

          Para obtener el máximo rendimiento, puedes seleccionar el nivel Premium, que cuenta con la tecnología de Lightning Engine. Los precios se basan en un modelo de pago por uso, en el que se te factura por segundo solo durante el tiempo que se ejecuta tu tarea. Esto es muy rentable, ya que elimina el coste de los clústeres inactivos.

          Ver precios detallados.

          Google Cloud