Dataproc Serverless para versiones del entorno de ejecución de Spark

Dataproc Serverless compatible con las versiones del entorno de ejecución de Spark

Versión Última actualización Lanzamiento Compatible hasta Disponible hasta Notas
Entorno de ejecución de Spark 2.2 con LTS 05/07/2024 27/03/2024 30/09/2026 30/09/2028 Versión de disponibilidad general.
Entorno de ejecución de Spark 2.0 05/07/2024 21/10/2022 30/06/2024 30/06/2026 Versión de disponibilidad general. Esta es la versión predeterminada.
Entorno de ejecución de Spark 1.2 con LTS 05/07/2024 27/03/2024 30/09/2026 30/09/2028 Versión de disponibilidad general.
Entorno de ejecución de Spark 1.1 LTS 05/07/2024 27/1/2023 31/07/2025 31/07/2027 Versión de disponibilidad general.

Cómo elegir una versión de entorno de ejecución de Dataproc Serverless para Spark

La versión predeterminada actual del entorno de ejecución de Dataproc Serverless se muestra en Dataproc Serverless compatible con las versiones del entorno de ejecución de Spark. Puedes usar la consola de Google Cloud, gcloud CLI y Dataproc para elegir una versión del entorno de ejecución diferente cuando envías una carga de trabajo por lotes.

Console

  1. Abre la página Crear lote de Dataproc en la consola de Google Cloud.
  2. En Contenedor, en la sección Versión del entorno de ejecución, selecciona una de las una lista de versiones del entorno de ejecución de Dataproc Serverless.

gcloud

Usa la marca dataproc batches submit --version para especificar una Versión del entorno de ejecución de Dataproc Serverless.

Ejemplo:

gcloud dataproc batches submit JOB_TYPE \
    --region=REGION \
    --version=VERSION (for example, 2.1)
    other args ...

API

Usa RuntimeConfig.version. como parte de un batches.create Llamada a la API para especificar una versión del entorno de ejecución de Dataproc Serverless.

Dataproc Serverless no es compatible con las versiones del entorno de ejecución de Spark

Las siguientes versiones de Dataproc Serverless no son compatibles.

Versión Incluye Lanzamiento Última actualización Disponible hasta Notas
Entorno de ejecución de Spark 2.1 Apache Spark 3.4.0
Conector de Cloud Storage 2.2.20
Conector de BigQuery 0.28.1
Java 17
Conda 23.3
Python 3.11
R 4.2
Scala 2.13
19/1/2022 30/5/2024 30/04/2026 No es compatible desde el 30/05/2024. 2.1.50 fue la versión de actualización final.
Entorno de ejecución de Spark 1.0 Apache Spark 3.2.3
Conector de Cloud Storage 2.2.11
Conda 4.11
Java 11
Python 3.9
R 4.1
Scala 2.12.17
19/1/2022 03/2/2023 31/01/2025 No es compatible desde el 03/02/2023. 1.0.29 fue la versión de actualización final.