Anunciado en mayo de 2025: Dataproc Serverless ahora es Google Cloud Serverless for Apache Spark

Logotipo de Serverless for Apache Spark

Google Cloud sin servidores para Apache Spark

Enfócate en tu código, no en tu infraestructura

Ejecuta tus trabajos de Apache Spark de forma más sencilla en una plataforma personalizable con operaciones autónomas, de forma más inteligente con la asistencia de Gemini y de forma más rápida con el rendimiento de Lightning Engine.

Apache Spark es una marca comercial de The Apache Software Foundation.


Funciones

Rendimiento líder en la industria

Potencia tus trabajos con Lightning Engine, nuestro motor vectorizado de nueva generación. Obtén un rendimiento 4.3 veces más rápido y un TCO más bajo para tus cargas de trabajo de Spark sin servidores, de forma automática.

Zero-Ops con ajuste de escala automático inteligente

Elimina la administración de clústeres con el ajuste de escala automático inteligente. Los recursos se escalan verticalmente de forma automática para adaptarse perfectamente a las necesidades de tu trabajo, lo que garantiza un rendimiento máximo y rentabilidad sin pagar por tiempo de inactividad.

Desarrollo potenciado por IA

Acelera todo tu flujo de trabajo. Escribe y depura código de PySpark, Scala y Java con Gemini Code Assist en BigQuery Studio, y lanza entornos acelerados por GPU con entornos de ejecución de AA preconfigurados.

Experiencia unificada de Spark y SQL

Elimina el cambio de contexto. Desarrolla y ejecuta tus cargas de trabajo en un solo entorno como BigQuery Studio, combinando sin problemas el potente SQL con la flexibilidad de PySpark en el mismo notebook.


Dos niveles de rendimiento

Dos niveles de rendimientoNiveles que se adaptan a tus necesidades específicas, desde el procesamiento por lotes estándar hasta los trabajos más exigentes y de rendimiento crítico.
NivelIdeal para

Estándar

Ideal para el procesamiento por lotes rentable, las transformaciones de datos y los trabajos de Spark de uso general.

  • ETL de Spark de uso general
  • Canalizaciones de datos programadas
  • Trabajos por lotes sensibles a los costos

Premium

Para las cargas de trabajo más exigentes, ofrece el máximo rendimiento con Lightning Engine, aceleración de IA/AA y capacidades interactivas.

  • Trabajos fundamentales potenciados por Lightning Engine para un aumento de 4.3 veces
  • Ciencia de datos y análisis interactivos
  • IA y AA acelerados por GPU
  • Procesamiento de datos complejo y a gran escala

Dos niveles de rendimiento

Niveles que se adaptan a tus necesidades específicas, desde el procesamiento por lotes estándar hasta los trabajos más exigentes y de rendimiento crítico.

Estándar

Ideal para

Ideal para el procesamiento por lotes rentable, las transformaciones de datos y los trabajos de Spark de uso general.

  • ETL de Spark de uso general
  • Canalizaciones de datos programadas
  • Trabajos por lotes sensibles a los costos

Premium

Ideal para

Para las cargas de trabajo más exigentes, ofrece el máximo rendimiento con Lightning Engine, aceleración de IA/AA y capacidades interactivas.

  • Trabajos fundamentales potenciados por Lightning Engine para un aumento de 4.3 veces
  • Ciencia de datos y análisis interactivos
  • IA y AA acelerados por GPU
  • Procesamiento de datos complejo y a gran escala

Cómo funciona

Desarrolla tu aplicación de Apache Spark en tus herramientas favoritas, incluidas las notebooks de BigQuery Studio. Envía tu trabajo de Spark sin servidores con un solo comando y deja que Google se encargue del resto: no hay clústeres que crear, configurar o administrar.


Usos comunes

Ciencia de datos interactiva

Permite a los científicos de datos explorar datos y realizar iteraciones rápidas en modelos de Spark ML. Unifica SQL y Spark en un solo notebook de BigQuery Studio, pasando sin problemas de la exploración de datos con SQL a la creación de modelos con PySpark sin tener que administrar la infraestructura.

Notebook de BQ Studio

Ciencia de datos interactiva

Permite a los científicos de datos explorar datos y realizar iteraciones rápidas en modelos de Spark ML. Unifica SQL y Spark en un solo notebook de BigQuery Studio, pasando sin problemas de la exploración de datos con SQL a la creación de modelos con PySpark sin tener que administrar la infraestructura.

Notebook de BQ Studio

Canalizaciones de ETL automatizadas

 Crea canalizaciones de ETL de Spark sólidas y basadas en eventos que se escalen automáticamente a pedido. Paga solo por lo que usas, lo que lo hace perfecto para cargas de trabajo irregulares o impredecibles.

De los datos a la producción de Spark, más rápido.

    Canalizaciones de ETL automatizadas

     Crea canalizaciones de ETL de Spark sólidas y basadas en eventos que se escalen automáticamente a pedido. Paga solo por lo que usas, lo que lo hace perfecto para cargas de trabajo irregulares o impredecibles.

    De los datos a la producción de Spark, más rápido.

      IA/AA a gran escala

      Acelera el entrenamiento de modelos a gran escala y la inferencia por lotes con Spark sin servidores. Conecta GPUs de NVIDIA con bibliotecas preconfiguradas con un solo comando.

      Diapositiva

        IA/AA a gran escala

        Acelera el entrenamiento de modelos a gran escala y la inferencia por lotes con Spark sin servidores. Conecta GPUs de NVIDIA con bibliotecas preconfiguradas con un solo comando.

        Diapositiva

          Precios

          Precios transparentes y basados en el valorLos precios de Serverless for Apache Spark se basan en el uso por segundo de procesamiento (DCU), GPU y almacenamiento aleatorio.
          Servicios y usoTipo de suscripción Precio (USD)

          Unidad de procesamiento de datos (DCU)

          Estándar

          A partir de

          $0.06

          por hora

          Premium

          A partir de

          $0.089

          por hora

          Almacenamiento de Shuffle

          Estándar

          A partir de

          $0.04

          por GB, por mes

          Premium

          A partir de

          $0.1

          por GB, por mes

          Precios del acelerador

          a100 40 GB

          A partir de

          $3.52069

          por hora

          a100 80 GB

          A partir de

          $4.713696

          por hora

          L4

          A partir de

          $0.672048

          por hora

          Consulta los detalles de los precios de Google Cloud sion servidores para Apache Spark.

          Precios transparentes y basados en el valor

          Los precios de Serverless for Apache Spark se basan en el uso por segundo de procesamiento (DCU), GPU y almacenamiento aleatorio.

          Unidad de procesamiento de datos (DCU)

          Tipo de suscripción

          Estándar

          Precio (USD)

          Starting at

          $0.06

          por hora

          Premium

          Tipo de suscripción

          Starting at

          $0.089

          por hora

          Almacenamiento de Shuffle

          Tipo de suscripción

          Estándar

          Precio (USD)

          Starting at

          $0.04

          por GB, por mes

          Premium

          Tipo de suscripción

          Starting at

          $0.1

          por GB, por mes

          Precios del acelerador

          Tipo de suscripción

          a100 40 GB

          Precio (USD)

          Starting at

          $3.52069

          por hora

          a100 80 GB

          Tipo de suscripción

          Starting at

          $4.713696

          por hora

          L4

          Tipo de suscripción

          Starting at

          $0.672048

          por hora

          Consulta los detalles de los precios de Google Cloud sion servidores para Apache Spark.

          Calculadora de precios

          Calcula tus costos mensuales por región.

          Presupuesto personalizado

          Comunícate con nuestro equipo de Ventas a fin de obtener una cotización personalizada para tu organización.

          Comience hoy mismo

          Instructivo para comenzar

          ¿Tienes un proyecto grande?

          Documentación de productos

          Usa el conector de BigQuery con Serverless for Apache Spark

          Usa GPUs con Serverless for Apache Spark

          Caso empresarial

           Crea tu caso de negocio para Google Cloud sin servidores para Apache Spark


          Los beneficios económicos de Google Cloud Dataproc y Serverless Spark en comparación con soluciones alternativas

          Descubre cómo Serverless for Apache Spark ofrece ahorros significativos en el TCO y valor empresarial en comparación con las soluciones locales y otras soluciones en la nube.

          En el informe se muestra lo siguiente:

          Descubre cómo Dataproc y Serverless for Apache Spark pueden ofrecer un ahorro de costos de entre el 18% y el 60% en comparación con otras alternativas de Spark basadas en la nube.

          Explora cómo Google Cloud Serverless para Apache Spark puede proporcionar un rendimiento-precio entre un 21% y un 55% mejor que otras ofertas de Spark sin servidores.

          Descubre cómo Dataproc y Google Cloud sin servidores para Apache Spark simplifican las implementaciones de Spark y ayudan a reducir la complejidad operativa.

          Preguntas frecuentes

          ¿Cuándo debo elegir Serverless for Apache Spark en lugar de Dataproc?

          Elige Serverless for Apache Spark cuando quieras enfocarte en tu código y eliminar toda la administración de la infraestructura. Es ideal para nuevas canalizaciones de Spark, análisis interactivos y trabajos con demanda impredecible en los que la velocidad y la simplicidad son la prioridad.

          Consulta nuestra guía de decisiones.

          El nivel Premium está diseñado para IA/AA y viene con entornos de ejecución de AA preconfigurados que tienen bibliotecas comunes como PyTorch, XGBoost y scikit-learn integradas. Esto elimina la configuración compleja y te permite comenzar con tus cargas de trabajo de ciencia de datos en minutos.

          Aprende sobre las cargas de trabajo y los tiempos de ejecución de GPU.

          Para obtener el máximo rendimiento, puedes seleccionar el nivel Premium, que funciona con Lightning Engine. Los precios se basan en un modelo de “pago por uso”, en el que se te factura por segundo solo durante la duración de la ejecución de tu trabajo. Esto es muy rentable, ya que elimina el costo de los clústeres inactivos.

          Ver precios detallados.

          Google Cloud