Dataproc Serverless para versiones del entorno de ejecución de Spark

Dataproc Serverless compatible con las versiones del entorno de ejecución de Spark

Versión Última actualización Lanzamiento Compatible hasta Disponible hasta Notas
Entorno de ejecución de Spark 2.2 con LTS 05/07/2024 27/03/2024 30/09/2026 30/09/2028 Versión de disponibilidad general.
Entorno de ejecución de Spark 2.0 05/07/2024 21/10/2022 30/06/2024 30/06/2026 Versión de disponibilidad general. Esta es la versión predeterminada.
Entorno de ejecución de Spark 1.2 con LTS 05/07/2024 27/03/2024 30/09/2026 30/09/2028 Versión de disponibilidad general.
Entorno de ejecución de Spark 1.1 LTS 05/07/2024 27/1/2023 31/07/2025 31/07/2027 Versión de disponibilidad general.

Cómo elegir una versión de entorno de ejecución de Dataproc Serverless para Spark

La versión predeterminada actual del entorno de ejecución de Dataproc Serverless se encuentra en Versiones compatibles de Dataproc Serverless para el entorno de ejecución de Spark. Puedes usar la consola de Google Cloud, gcloud CLI y la API de Dataproc para elegir una versión diferente del entorno de ejecución cuando envíes una carga de trabajo por lotes.

Console

  1. Abre la página Crear lote de Dataproc en la consola de Google Cloud.
  2. En Contenedor, en la sección Versión del entorno de ejecución, selecciona una de las versiones del entorno de ejecución de Dataproc Serverless que se muestran en la lista.

gcloud

Usa la marca dataproc batches submit --version para especificar una versión del entorno de ejecución de Dataproc Serverless.

Ejemplo:

gcloud dataproc batches submit JOB_TYPE \
    --region=REGION \
    --version=VERSION (for example, 2.1)
    other args ...

API

Usa el campo RuntimeConfig.version como parte de una llamada a la API batches.create para especificar una versión del entorno de ejecución sin servidores de Dataproc.

Dataproc Serverless no es compatible con las versiones del entorno de ejecución de Spark

Las siguientes versiones de Dataproc Serverless no son compatibles.

Versión Incluye Lanzamiento Última actualización Disponible hasta Notas
Entorno de ejecución de Spark 2.1 Apache Spark 3.4.0
Conector de Cloud Storage 2.2.20
Conector de BigQuery 0.28.1
Java 17
Conda 23.3
Python 3.11
R 4.2
Scala 2.13
19/1/2022 30/5/2024 30/04/2026 No es compatible desde el 30/05/2024. 2.1.50 fue la versión de actualización final.
Entorno de ejecución de Spark 1.0 Apache Spark 3.2.3
Conector de Cloud Storage 2.2.11
Conda 4.11
Java 11
Python 3.9
R 4.1
Scala 2.12.17
19/1/2022 03/2/2023 31/01/2025 No es compatible desde el 03/02/2023. 1.0.29 fue la versión de actualización final.