支持的 Dataproc Serverless for Spark 运行时版本
版本 | 上次更新时间 | 发布日期 | 支持截止日期 | 下架日期 | 备注 |
---|---|---|---|---|---|
Spark 运行时 2.2 LTS | 2024/10/17 | 2024/03/27 | 2026 年 9 月 30 日 | 2028 年 9 月 30 日 | 推出正式版。这是默认版本。 |
Spark 运行时 1.2 LTS | 2024 年 10 月 17 日 | 2024/03/27 | 2026/09/30 | 2028/09/30 | 推出正式版。 |
Spark 运行时 1.1 LTS | 2024/10/17 | 2023/01/27 | 2025 年 7 月 31 日 | 2027/07/31 | 正式版发布。 |
如何选择 Dataproc Serverless for Spark 运行时版本
当前的默认 Dataproc Serverless 运行时版本列在 Dataproc Serverless for Spark 支持的运行时版本中。您可以使用 Google Cloud 控制台、gcloud CLI 和 Dataproc API 在提交批量工作负载时选择其他运行时版本。
控制台
- 在 Google Cloud 控制台中打开 Dataproc 创建批次页面。
- 在容器下的运行时版本部分中,选择 其中列出了 Dataproc Serverless 运行时版本。
gcloud
使用 dataproc batches submit --version
标志指定 Dataproc Serverless 运行时版本。
示例:
gcloud dataproc batches submit SPARK_WORKLOAD_TYPE \ --region=REGION \ --version=VERSION \ other args ...
替换以下内容:
SPARK_WORKLOAD_TYPE::A Spark 工作负载类型 例如
spark
。REGION:一个可用的 Compute Engine 区域, 例如
us-central1
。VERSION:可选。Dataproc 无服务器运行时版本, 示例
1.2
。
API
使用 RuntimeConfig.version
字段作为 batches.create
的一部分
用于指定 Dataproc Serverless 运行时版本的 API 调用。
不支持 Dataproc Serverless for Spark 运行时版本
以下 Dataproc Serverless 版本不受支持。
版本 | 包含的内容 | 发布日期 | 上次更新时间 | 下架日期 | 备注 |
---|---|---|---|---|---|
Spark 运行时 2.1 | Apache Spark 3.4.0 Cloud Storage 连接器 2.2.20 BigQuery 连接器 0.28.1 Java 17 Conda 23.3 Python 3.11 R 4.2 Scala 2.13 |
2022/01/19 | 2024 年 5 月 30 日 | 2026 年 4 月 30 日 | 自 2024 年 5 月 30 日起不再受支持。2.1.50 是最终发布的版本。 |
Spark 运行时 2.0 | Apache Spark 3.3.4 Cloud Storage 连接器 2.2.20 Java 17 Conda 22.9 Python 3.10 R 4.1 Scala 2.13 |
2022 年 10 月 21 日 | 2024 年 8 月 22 日 | 2026 年 8 月 31 日 | 从 2024 年 8 月 22 日起停止支持。2.0.84 是最后发布的版本。 |
Spark 运行时 1.0 | Apache Spark 3.2.3 Cloud Storage 连接器 2.2.11 Conda 4.11 Java 11 Python 3.9 R 4.1 Scala 2.12.17 |
2022/01/19 | 2023 年 2 月 3 日 | 2025 年 1 月 31 日 | 从 2023 年 2 月 3 日起停止支持。1.0.29 是最后发布的版本。 |